사용 가능한 생성형 AI 모델

Google Distributed Cloud (GDC) 오프라인 Vertex AI는 오프라인 애플리케이션에서 테스트, 배포, 구현할 수 있는 점점 더 많은 생성형 AI 기반 모델 목록을 제공합니다. 기반 모델은 특정 사용 사례에 맞게 조정되며 여러 가격대로 제공됩니다. 이 페이지에서는 GDC의 생성형 AI API에서 사용할 수 있는 모델 제품군을 요약하고 사용 사례별로 선택할 수 있는 모델을 안내합니다.

임베딩 모델

임베딩은 자연어로 작성된 텍스트 데이터를 숫자 벡터로 변환합니다. 이러한 벡터 표현은 표현이 나타내는 단어의 시맨틱 의미와 컨텍스트를 캡처하도록 설계되었습니다. 텍스트 임베딩 모델은 문서 검색, 질문 및 답변, 분류, 사실 확인과 같은 다양한 태스크 유형에 최적화된 임베딩을 생성할 수 있습니다. 영어 텍스트에는 text-embedding-004를 사용합니다. 다국어 텍스트에는 text-multilingual-embedding-002를 사용합니다.

다음 표에는 Embeddings API에서 사용할 수 있는 모델이 요약되어 있습니다. 임베딩에 대한 자세한 내용은 텍스트 임베딩을 참고하세요.

모델 설명 사양
텍스트 임베딩

(text-embedding-004)
영어 텍스트 입력의 임베딩을 반환합니다. 최대 토큰 입력: 2,048개

임베딩 측정기준: 768 미만
다국어 텍스트 임베딩

(text-multilingual-embedding-002)
100개가 넘는 언어의 텍스트 입력에 대한 임베딩을 반환합니다. 최대 토큰 입력: 2,048개

임베딩 측정기준: 768 미만