SkyDeck.ai Docs
RegístrateInicio de sesión de administradorContáctenos
Español
Español
  • SkyDeck.ai
  • GenStudio Workspace
    • Conversaciones
    • Aplicación Ayudante de SkyDeck AI
    • Carga de Documentos
    • Compartir y Colaborar
    • Sincronización con Slack
    • Instantáneas Públicas
    • Navegación Web
    • Herramientas
      • Programador en Pareja
        • Cómo Usar
        • Ejemplo – Asistencia con Script de Python
      • Asistente SQL
        • Cómo Usar
        • Ejemplo – Depuración de Consultas
      • Revisión de Acuerdos Legales
        • Cómo Usar
        • Ejemplo – Cláusula de NDA
      • Enséñame Cualquier Cosa
        • Cómo Usar
        • Ejemplo – Introducción a la Programación
      • Consultor Estratégico
        • Cómo Usar
        • Ejemplo – Retención de Empleados
      • Generador de Imágenes
        • Cómo Usar
        • Ejemplo – Maravilla Invernal
    • Seguridad de Datos
      • Prevención de Pérdida de Datos
  • Centro de Control
    • Herramientas para Administradores y Propietarios
    • Guía de Configuración
      • Configurar Cuenta
      • Configurar Integraciones
        • Asistencia para Integración
      • Configurar Seguridad
        • Autenticación (SSO)
      • Organizar Equipos
        • Agregar Nuevo Grupo
        • Eliminar Grupos
      • Curar Herramientas
        • Herramientas del Sistema
        • Asignar Etiquetas
      • Gestionar Miembros
        • Agregar Miembros
        • Importar Archivo
        • Invitar Miembros
        • Editar Miembros
    • Facturación
      • Prueba Gratuita
      • Comprar Crédito
      • Planes y Mejoras
      • Precios de Uso de Modelos
  • Integraciones
    • LLMs y Bases de Datos
      • Integración de Anthropic
      • Integración de Base de Datos
      • Integración de Groq
      • Integración de HuggingFace
      • Integración de Mistral
      • Integración de OpenAI
      • Integración de Perplexity
      • Integración de Together AI
      • Integración de Vertex AI
    • Integraciones de Aplicaciones
      • Integración de Rememberizer
      • Integración de Slack
  • Desarrolladores
    • Desarrolla Tus Propias Herramientas
      • Formato JSON para Herramientas
      • Formato JSON para Herramientas LLM
      • Ejemplo: Generador de UI Basado en Texto
      • Formato JSON para Herramientas Inteligentes
  • Casos de Uso
    • Creando una Política de Privacidad
  • Avisos
    • Términos de Uso
    • Política de Privacidad
    • Aviso de Cookies
  • Lanzamientos
    • 23 de Mayo de 2025
    • 16 de Mayo de 2025
    • 9 de Mayo de 2025
    • 2 de Mayo de 2025
    • 25 de Abr de 2025
    • 18 de Abr de 2025
    • 11 de Abr de 2025
    • 4 de Abr de 2025
    • 28 de Mar de 2025
    • 21 de Mar de 2025
    • 14 de Mar de 2025
    • 7 de Mar de 2025
    • 28 de Feb de 2025
    • 21 de Feb de 2025
    • 14 de Feb de 2025
    • 7 de Feb de 2025
    • 31 de Ene de 2025
    • 24 de Ene de 2025
    • 17 de Ene de 2025
    • 10 de Ene de 2025
    • 3 de Ene de 2025
    • 27 de Dic de 2024
    • 20 de Dic de 2024
    • 13 de Dic de 2024
    • 6 de Dic de 2024
    • 29 de Nov de 2024
    • 22 de Nov de 2024
    • 15 de Nov de 2024
    • 8 de Nov de 2024
    • 1 de Nov de 2024
    • 25 de Oct de 2024
    • 18 de Oct de 2024
    • 11 de Oct de 2024
    • 4 de Oct de 2024
    • 27 de Sep de 2024
    • 20 de Sep de 2024
    • 13 de Sep de 2024
    • 6 de Sep de 2024
    • 23 de Ago de 2024
    • 16 de Ago de 2024
    • 9 de Ago de 2024
    • 2 de Ago de 2024
    • 26 de Jul de 2024
    • 12 de Jul de 2024
    • 5 de Jul de 2024
    • 28 de Jun de 2024
    • 21 de Jun de 2024
    • 12 de Nov 2023
    • 6 de Nov 2023
    • 30 de Oct 2023
    • 23 de Oct 2023
    • 16 de Oct 2023
    • 18 de Sep 2023
    • 8 de Sep 2023
  • Seguridad
    • Prácticas de Seguridad de SkyDeck.ai
    • Programa de Recompensas por Errores
  • Documentación de IA
    • Informe de Evaluación de LLM
    • Documentación Lista para LLM de SkyDeck.ai
Con tecnología de GitBook
En esta página
  • Escalar a Cero los Endpoints de HuggingFace
  • Modelos soportados
  1. Integraciones
  2. LLMs y Bases de Datos

Integración de HuggingFace

Usando SkyDeck.ai como la interfaz para tus modelos de HuggingFace.

AnteriorIntegración de GroqSiguienteIntegración de Mistral

Última actualización hace 25 días

Después de desplegar tu punto final de inferencia en HuggingFace, deberías ver la siguiente interfaz de usuario:

En esta página, necesitarás la siguiente información:

  • URL del punto final

  • Repositorio del modelo

  • Token de API. Puedes ver esto marcando la casilla "Agregar token de API" en el bloque de código de Ejemplos de Llamadas.

Además de esto, también necesitarás la ventana de contexto de tu modelo. Esto se puede encontrar en la página de información del modelo.

Después de recopilar esta información, formatea en JSON como se muestra en el ejemplo a continuación:

{
    "api_key":"your_api_key",
    "endpoint": "your_api_endpoint",
    "model_name": "meta-llama/Llama-2-7b-chat-hf",
    "context_window": 4096
}

A continuación, pega esto en el campo de Credenciales de tu integración.

Una vez que la credencial se valide correctamente, deberías ver tu modelo de HuggingFace listado en la lista de modelos de GenStudio:

Escalar a Cero los Endpoints de HuggingFace

Escalar a 0 es una característica dinámica ofrecida por los Endpoints de Inferencia, diseñada para optimizar la utilización de recursos y los costos. Al monitorear inteligentemente los patrones de solicitud y reducir el número de réplicas a ninguna durante los períodos de inactividad, asegura que solo utilice recursos cuando sea necesario.

Modelos soportados

En este momento, solo soportamos puntos finales para modelos con una etiqueta de text-generation que están desplegados como contenedores de text-generation-inference. Estamos trabajando para expandir nuestra lista de modelos soportados.

Sin embargo, esto introduce un período de inicio en frío cuando se reanuda el tráfico, y hay algunas consideraciones de las que hay que estar consciente. Para una mirada profunda de cómo funciona esta característica, sus beneficios y desafíos potenciales, por favor consulte la .

guía de HuggingFace sobre el Autoescalado
LLaMA 2 es un modelo con etiqueta de Generación de Texto
Asegúrate de seleccionar Inferencia de Generación de Texto como el tipo de contenedor durante el despliegue
interfaz de despliegue de huggingface
campo de credenciales
modelo de huggingface como modelo de genstudio
image (48)
image (49)