SkyDeck.ai Docs
サインアップ管理者サインインお問い合わせ
日本語
日本語
  • SkyDeck.ai
  • GenStudio ワークスペース
    • 会話
    • SkyDeck AI ヘルパーアプリ
    • ドキュメントアップロード
    • 共有とコラボレーション
    • Slack 同期
    • 公開スナップショット
    • ウェブブラウジング
    • ツール
      • ペアプログラマー
        • 使い方
        • 例 – Python スクリプト支援
      • SQL アシスタント
        • 使い方
        • 例 – クエリデバッグ
      • 法的契約レビュー
        • 使い方
        • 例 – NDA 条項
      • 何でも教えて
        • 使い方
        • 例 – プログラミング入門
      • 戦略コンサルタント
        • 使い方
        • 例 – 従業員の定着
      • 画像生成器
        • 使い方
        • 例 – 冬のワンダーランド
    • データセキュリティ
      • データ損失防止
  • コントロールセンター
    • 管理者 & オーナーツール
    • セットアップガイド
      • アカウントの設定
      • 統合の設定
        • 統合支援
      • セキュリティの設定
        • 認証 (SSO)
      • チームの整理
        • 新しいグループの追加
        • グループの削除
      • ツールのキュレーション
        • システムツール
        • タグの割り当て
      • メンバーの管理
        • メンバーの追加
        • ファイルのインポート
        • メンバーの招待
        • メンバーの編集
    • 請求
      • 無料トライアル
      • クレジットの購入
      • プランとアップグレード
      • モデル使用料金
  • 統合
    • LLM とデータベース
      • Anthropic 統合
      • データベース統合
      • Groq 統合
      • HuggingFace 統合
      • Mistral 統合
      • OpenAI 統合
      • Perplexity 統合
      • Together AI 統合
      • Vertex AI 統合
    • アプリ統合
      • Rememberizer 統合
      • Slack 統合
  • 開発者
    • 独自のツールを開発する
      • ツールのための JSON 形式
      • LLM ツールのための JSON 形式
      • 例: テキストベースの UI ジェネレーター
      • スマートツールのための JSON 形式
  • ユースケース
    • プライバシーポリシーの作成
  • 通知
    • 利用規約
    • プライバシーポリシー
    • クッキーノーティス
  • リリース
    • 2025年5月9日
    • 2025年5月2日
    • 2025年4月25日
    • 2025年4月18日
    • 2025年4月11日
    • 2025年4月4日
    • 2025年3月28日
    • 2025年3月21日
    • 2025年3月14日
    • 2025年3月7日
    • 2025年2月28日
    • 2025年2月21日
    • 2025年2月14日
    • 2025年2月7日
    • 2025年1月31日
    • 2025年1月24日
    • 2025年1月17日
    • 2025年1月10日
    • 2025年1月3日
    • 2024年12月27日
    • 2024年12月20日
    • 2024年12月13日
    • 2024年12月6日
    • 2024年11月29日
    • 2024年11月22日
    • 2024年11月15日
    • 2024年11月8日
    • 2024年11月1日
    • 2024年10月25日
    • 2024年10月18日
    • 2024年10月11日
    • 2024年10月4日
    • 2024年9月27日
    • 2024年9月20日
    • 2024年9月13日
    • 2024年9月6日
    • 2024年8月23日
    • 2024年8月16日
    • 2024年8月9日
    • 2024年8月2日
    • 2024年7月26日
    • 2024年7月12日
    • 2024年7月5日
    • 2024年6月28日
    • 2024年6月21日
    • 2023年11月12日
    • 2023年11月6日
    • 2023年10月30日
    • 2023年10月23日
    • 2023年10月16日
    • 2023年9月18日
    • 2023年9月8日
  • セキュリティ
    • SkyDeck.ai セキュリティプラクティス
    • バグバウンティプログラム
  • AI ドキュメント
    • LLM 評価レポート
    • SkyDeck.ai LLM 対応ドキュメント
GitBook提供
このページ内
  • HuggingFaceエンドポイントをゼロにスケーリング
  • サポートされているモデル
  1. 統合
  2. LLM とデータベース

HuggingFace 統合

HuggingFaceモデルのフロントエンドとしてSkyDeck.aiを使用します。

前へGroq 統合次へMistral 統合

最終更新 11 日前

HuggingFaceに推論エンドポイントをデプロイした後、次のユーザーインターフェースが表示されるはずです:

このページでは、次の情報が必要です:

  • エンドポイントURL

  • モデルリポジトリ

  • APIトークン。このトークンは、Call Examplesコードブロックで「Add API token」ボックスをチェックすることで確認できます。

これに加えて、モデルのコンテキストウィンドウも必要です。これはモデルの情報ページで見つけることができます。

この情報を収集したら、以下の例のようにJSON形式にフォーマットします:

{
    "api_key":"your_api_key",
    "endpoint": "your_api_endpoint",
    "model_name": "meta-llama/Llama-2-7b-chat-hf",
    "context_window": 4096
}

次に、これを統合のCredentialフィールドに貼り付けます。

資格情報が正常に検証されると、GenStudioのモデルリストにあなたのHuggingFaceモデルが表示されるはずです:

HuggingFaceエンドポイントをゼロにスケーリング

ゼロにスケーリングすることは、Inference Endpointsが提供する動的な機能で、リソースの利用効率とコストを最適化することを目指しています。インテリジェントにリクエストパターンを監視し、アイドルタイム中にレプリカの数をゼロに減らすことで、必要なときだけリソースを使用することを保証します。

サポートされているモデル

現時点では、text-generation タグが付けられたモデルのエンドポイントのみをサポートしており、これらは text-generation-inference コンテナとしてデプロイされています。サポートされているモデルのリストを拡張するために取り組んでいます。

しかし、これはトラフィックが再開したときのコールドスタート期間を導入しますので、注意すべき点がいくつかあります。この機能の動作方法、利点、潜在的な課題について詳しくは、 を参照してください。

HuggingFaceのAutoscalingに関するガイド
LLaMA 2 はテキスト生成タグを持つモデルです
デプロイ時にコンテナタイプとしてテキスト生成推論を選択してください
huggingface deploy interface
credential field
huggingface model as genstudio model
image (48)
image (49)