SkyDeck.ai Docs
S'inscrireConnexion AdminContactez-nous
Français
Français
  • SkyDeck.ai
  • GenStudio Workspace
    • Conversations
    • Application d'Aide SkyDeck AI
    • Téléchargement de Documents
    • Partage et Collaboration
    • Synchronisation Slack
    • Instantanés Publics
    • Navigation Web
    • Outils
      • Programmeur de Pair
        • Comment Utiliser
        • Exemple – Assistance Script Python
      • Assistant SQL
        • Comment Utiliser
        • Exemple – Débogage de Requête
      • Révision d'Accord Légal
        • Comment Utiliser
        • Exemple – Clause NDA
      • Apprends-moi Tout
        • Comment Utiliser
        • Exemple – Introduction à la Programmation
      • Consultant en Stratégie
        • Comment Utiliser
        • Exemple – Rétention des Employés
      • Générateur d'Images
        • Comment Utiliser
        • Exemple – Paysage d'Hiver
    • Sécurité des Données
      • Prévention de Perte de Données
  • Centre de Contrôle
    • Outils Admin & Propriétaire
    • Guide de Configuration
      • Configurer un Compte
      • Configurer des Intégrations
        • Assistance à l'Intégration
      • Configurer la Sécurité
        • Authentification (SSO)
      • Organiser les Équipes
        • Ajouter un Nouveau Groupe
        • Supprimer des Groupes
      • Curater des Outils
        • Outils Système
        • Attribuer des Étiquettes
      • Gérer les Membres
        • Ajouter des Membres
        • Importer un Fichier
        • Inviter des Membres
        • Modifier des Membres
    • Facturation
      • Essai Gratuit
      • Acheter des Crédits
      • Plans et Améliorations
      • Prix d'Utilisation des Modèles
  • Intégrations
    • LLMs et Bases de Données
      • Intégration Anthropic
      • Intégration de Base de Données
      • Intégration Groq
      • Intégration HuggingFace
      • Intégration Mistral
      • Intégration OpenAI
      • Intégration Perplexity
      • Intégration Together AI
      • Intégration Vertex AI
    • Intégrations d'Applications
      • Intégration Rememberizer
      • Intégration Slack
  • Développeurs
    • Développez Vos Propres Outils
      • Format JSON pour Outils
      • Format JSON pour Outils LLM
      • Exemple : Générateur d'UI Basé sur le Texte
      • Format JSON pour Outils Intelligents
  • Cas d'Utilisation
    • Créer une Politique de Confidentialité
  • Avis
    • Conditions d'Utilisation
    • Politique de Confidentialité
    • Avis sur les Cookies
  • Versions
    • 23 mai 2025
    • 16 mai 2025
    • 9 mai 2025
    • 2 mai 2025
    • 25 avr 2025
    • 18 avr 2025
    • 11 avr 2025
    • 4 avr 2025
    • 28 mars 2025
    • 21 mars 2025
    • 14 mars 2025
    • 7 mars 2025
    • 28 fév 2025
    • 21 fév 2025
    • 14 fév 2025
    • 7 fév 2025
    • 31 janv 2025
    • 24 janv 2025
    • 17 janv 2025
    • 10 janv 2025
    • 3 janv 2025
    • 27 déc 2024
    • 20 déc 2024
    • 13 déc 2024
    • 6 déc 2024
    • 29 nov 2024
    • 22 nov 2024
    • 15 nov 2024
    • 8 nov 2024
    • 1 nov 2024
    • 25 oct 2024
    • 18 oct 2024
    • 11 oct 2024
    • 4 oct 2024
    • 27 sept 2024
    • 20 sept 2024
    • 13 sept 2024
    • 6 sept 2024
    • 23 août 2024
    • 16 août 2024
    • 9 août 2024
    • 2 août 2024
    • 26 juil 2024
    • 12 juil 2024
    • 5 juil 2024
    • 28 juin 2024
    • 21 juin 2024
    • 12 nov 2023
    • 6 nov 2023
    • 30 oct 2023
    • 23 oct 2023
    • 16 oct 2023
    • 18 sept 2023
    • 8 sept 2023
  • Sécurité
    • Pratiques de Sécurité SkyDeck.ai
    • Programme de Récompense de Bugs
  • Documentation AI
    • Rapport d'Évaluation LLM
    • Documentation Prête pour LLM de SkyDeck.ai
Propulsé par GitBook
Sur cette page
  • Mise à l'échelle des points de terminaison HuggingFace à zéro
  • Modèles pris en charge
  1. Intégrations
  2. LLMs et Bases de Données

Intégration HuggingFace

Utiliser SkyDeck.ai comme interface pour vos modèles HuggingFace.

PrécédentIntégration GroqSuivantIntégration Mistral

Dernière mise à jour il y a 25 jours

Après avoir déployé votre point de terminaison d'inférence sur HuggingFace, vous devriez voir l'interface utilisateur suivante :

Sur cette page, vous aurez besoin des informations suivantes :

  • URL du point de terminaison

  • Répertoire du modèle

  • Jeton API. Vous pouvez le voir en cochant la case "Ajouter un jeton API" dans le bloc de code Exemples d'appel.

En plus de cela, vous aurez également besoin de la fenêtre de contexte de votre modèle. Cela peut être trouvé sur la page d'information du modèle.

Après avoir collecté ces informations, formatez-les en JSON comme montré dans l'exemple ci-dessous :

{
    "api_key":"your_api_key",
    "endpoint": "your_api_endpoint",
    "model_name": "meta-llama/Llama-2-7b-chat-hf",
    "context_window": 4096
}

Ensuite, collez cela dans le champ d'identification de votre intégration.

Une fois que l'identification est validée avec succès, vous devriez voir votre modèle HuggingFace répertorié dans la liste des modèles de GenStudio :

Mise à l'échelle des points de terminaison HuggingFace à zéro

La mise à l'échelle à 0 est une fonctionnalité dynamique offerte par les points de terminaison d'inférence, conçue pour optimiser l'utilisation des ressources et les coûts. En surveillant intelligemment les schémas de demande et en réduisant le nombre de répliques à aucune pendant les périodes d'inactivité, elle garantit que vous n'utilisez des ressources que lorsque c'est nécessaire.

Modèles pris en charge

Pour le moment, nous ne prenons en charge que les points de terminaison pour les modèles avec un tag text-generation qui sont déployés en tant que conteneurs text-generation-inference. Nous travaillons à élargir notre liste de modèles pris en charge.

Cependant, cela introduit une période de démarrage à froid lorsque le trafic reprend, et il y a quelques considérations à prendre en compte. Pour un aperçu détaillé de la façon dont cette fonctionnalité fonctionne, de ses avantages et des défis potentiels, veuillez vous référer au .

guide de HuggingFace sur l'Autoscaling
LLaMA 2 est un modèle avec le tag Text Generation
Assurez-vous de sélectionner Text Generation Inference comme type de conteneur lors du déploiement
interface de déploiement huggingface
champ d'identification
modèle huggingface en tant que modèle genstudio
image (48)
image (49)