SkyDeck.ai Docs
가입관리자 로그인문의하기
한국어
한국어
  • SkyDeck.ai
  • GenStudio 작업 공간
    • 대화
    • SkyDeck AI 헬퍼 앱
    • 문서 업로드
    • 공유 및 협업
    • 슬랙 동기화
    • 공개 스냅샷
    • 웹 브라우징
    • 도구
      • 페어 프로그래머
        • 사용 방법
        • 예시 – 파이썬 스크립트 지원
      • SQL 어시스턴트
        • 사용 방법
        • 예시 – 쿼리 디버깅
      • 법적 계약 검토
        • 사용 방법
        • 예시 – NDA 조항
      • 무엇이든 가르쳐 주세요
        • 사용 방법
        • 예시 – 프로그래밍 소개
      • 전략 컨설턴트
        • 사용 방법
        • 예시 – 직원 유지
      • 이미지 생성기
        • 사용 방법
        • 예시 – 겨울 원더랜드
    • 데이터 보안
      • 데이터 손실 방지
  • 제어 센터
    • 관리자 및 소유자 도구
    • 설정 가이드
      • 계정 설정
      • 통합 설정
        • 통합 지원
      • 보안 설정
        • 인증 (SSO)
      • 팀 구성
        • 새 그룹 추가
        • 그룹 제거
      • 도구 정리
        • 시스템 도구
        • 태그 할당
      • 회원 관리
        • 회원 추가
        • 파일 가져오기
        • 회원 초대
        • 회원 편집
    • 청구
      • 무료 체험
      • 크레딧 구매
      • 요금제 및 업그레이드
      • 모델 사용 가격
  • 통합
    • LLM 및 데이터베이스
      • Anthropic 통합
      • 데이터베이스 통합
      • Groq 통합
      • HuggingFace 통합
      • Mistral 통합
      • OpenAI 통합
      • Perplexity 통합
      • Together AI 통합
      • Vertex AI 통합
    • 앱 통합
      • Rememberizer 통합
      • 슬랙 통합
  • 개발자
    • 자신의 도구 개발
      • 도구를 위한 JSON 형식
      • LLM 도구를 위한 JSON 형식
      • 예시: 텍스트 기반 UI 생성기
      • 스마트 도구를 위한 JSON 형식
  • 사용 사례
    • 개인정보 보호정책 작성
  • 공지사항
    • 이용 약관
    • 개인정보 보호정책
    • 쿠키 공지
  • 릴리스
    • 2025년 5월 16일
    • 2025년 5월 9일
    • 2025년 5월 2일
    • 2025년 4월 25일
    • 2025년 4월 18일
    • 2025년 4월 11일
    • 2025년 4월 4일
    • 2025년 3월 28일
    • 2025년 3월 21일
    • 2025년 3월 14일
    • 2025년 3월 7일
    • 2025년 2월 28일
    • 2025년 2월 21일
    • 2025년 2월 14일
    • 2025년 2월 7일
    • 2025년 1월 31일
    • 2025년 1월 24일
    • 2025년 1월 17일
    • 2025년 1월 10일
    • 2025년 1월 3일
    • 2024년 12월 27일
    • 2024년 12월 20일
    • 2024년 12월 13일
    • 2024년 12월 6일
    • 2024년 11월 29일
    • 2024년 11월 22일
    • 2024년 11월 15일
    • 2024년 11월 8일
    • 2024년 11월 1일
    • 2024년 10월 25일
    • 2024년 10월 18일
    • 2024년 10월 11일
    • 2024년 10월 4일
    • 2024년 9월 27일
    • 2024년 9월 20일
    • 2024년 9월 13일
    • 2024년 9월 6일
    • 2024년 8월 23일
    • 2024년 8월 16일
    • 2024년 8월 9일
    • 2024년 8월 2일
    • 2024년 7월 26일
    • 2024년 7월 12일
    • 2024년 7월 5일
    • 2024년 6월 28일
    • 2024년 6월 21일
    • 2023년 11월 12일
    • 2023년 11월 6일
    • 2023년 10월 30일
    • 2023년 10월 23일
    • 2023년 10월 16일
    • 2023년 9월 18일
    • 2023년 9월 8일
  • 보안
    • SkyDeck.ai 보안 관행
    • 버그 바운티 프로그램
  • AI 문서
    • LLM 평가 보고서
    • SkyDeck.ai LLM 준비 문서
Powered by GitBook
On this page
  • HuggingFace 엔드포인트의 제로로 스케일링
  • 지원되는 모델
  1. 통합
  2. LLM 및 데이터베이스

HuggingFace 통합

HuggingFace 모델을 위한 프론트 엔드로 SkyDeck.ai 사용하기.

PreviousGroq 통합NextMistral 통합

Last updated 23 days ago

HuggingFace에서 추론 엔드포인트를 배포한 후, 다음 사용자 인터페이스를 볼 수 있어야 합니다:

이 페이지에서는 다음 정보를 필요로 합니다:

  • 엔드포인트 URL

  • 모델 리포지토리

  • API 토큰. 이는 Call Examples 코드 블록에서 "Add API token" 상자를 체크하여 확인할 수 있습니다.

이 외에도 모델의 컨텍스트 윈도우가 필요합니다. 이는 모델의 정보 페이지에서 찾을 수 있습니다.

이 정보를 수집한 후, 아래 예시와 같이 JSON 형식으로 포맷합니다:

{
    "api_key":"your_api_key",
    "endpoint": "your_api_endpoint",
    "model_name": "meta-llama/Llama-2-7b-chat-hf",
    "context_window": 4096
}

다음으로, 이를 통합의 Credential 필드에 붙여넣습니다.

자격 증명이 성공적으로 검증되면, GenStudio의 모델 목록에 HuggingFace 모델이 나열되는 것을 볼 수 있습니다:

HuggingFace 엔드포인트의 제로로 스케일링

0으로 스케일링은 Inference 엔드포인트가 제공하는 동적 기능으로, 리소스 사용량과 비용을 최적화하는 데 설계되었습니다. 이는 기발하게 요청 패턴을 모니터링하고 유휴 시간 동안 복제본 수를 없앨 경우, 필요할 때만 리소스를 사용하도록 보장합니다.

지원되는 모델

현재 우리는 text-generation 태그가 있는 모델에 대해 text-generation-inference 컨테이너로 배포된 엔드포인트만 지원합니다. 지원되는 모델 목록을 확장하기 위해 작업 중입니다.

그러나, 이렇게 하면 트래픽이 재개될 때 차가운 시작 기간이 있고, 주의해야 할 몇 가지 사항이 있습니다. 이 기능이 어떻게 작동하는지, 그 장점과 잠재적인 도전 과제에 대한 심도있는 연구를 원한다면, 를 참조하십시오.

HuggingFace의 Autoscaling에 대한 가이드
LLaMA 2는 텍스트 생성 태그가 있는 모델입니다
배포 중에 컨테이너 유형으로 텍스트 생성 추론을 선택해야 합니다
huggingface 배포 인터페이스
credential 필드
huggingface 모델이 genstudio 모델로
image (48)
image (49)