생성형 AI에 대한 모델 API 참조

Vertex AI의 생성형 AI(genai이라고도 함)를 통해 Vertex AI에서 Google의 대규모 생성형 AI 모델에 액세스할 수 있습니다.

생성형 AI 기반 모델 참조

모델 이름 설명 응답 스트리밍 가능
Gemini API(gemini-1.5-pro, gemini-1.0-pro, gemini-1.0-pro-vision)

Gemini는 멀티모달 사용 사례를 위해 설계되고 Google DeepMind에서 개발된 생성형 AI 모델 제품군 중 하나입니다. Gemini API에서 Gemini Pro Vision 및 Gemini Pro 모델에 액세스할 수 있습니다.

텍스트용 PaLM 2(text-bison)

자연어 안내를 따르도록 미세 조정되며 다양한 언어 태스크에 적합합니다.

텍스트용 임베딩(textembedding-gecko)

텍스트 입력에 대한 모델 임베딩을 반환합니다.

채팅용 PaLM 2(chat-bison)

멀티턴 대화 사용 사례에 맞게 미세 조정됩니다.

코드 생성용 Codey(code-bison)

원하는 코드의 자연어 설명을 기반으로 코드를 생성하도록 미세 조정된 모델입니다. 예를 들어 함수의 단위 테스트를 생성할 수 있습니다.

코드 채팅용 Codey(codechat-bison)

코드 관련 질문에 도움이 되는 챗봇 대화용으로 미세 조정된 모델입니다.

코드 완성용 Codey(code-gecko)

작성된 코드의 컨텍스트를 기반으로 코드 완성을 추천하도록 미세 조정된 모델입니다.

이미지 생성용 Imagen(imagegeneration)

이 모델은 이미지 생성을 지원하며 몇 초 이내에 고품질 시각적 애셋을 만들 수 있습니다.

멀티모달 임베딩(multimodalembedding)

이 모델은 사용자가 제공한 입력을 기반으로 벡터를 생성합니다. 여기에는 이미지 및 텍스트 조합이 포함될 수 있습니다.

이미지 캡셔닝(imagetext)

이 모델은 이미지 캡셔닝을 지원하며 지정된 언어를 기반으로 사용자가 제공하는 이미지에서 캡션을 생성할 수 있습니다.

MedLM(medlm-mediummedlm-large)

의료 산업에 맞게 미세 조정된 기반 모델의 제품군입니다.

시각적 질의 응답 - VQA(imagetext)

이미지 질문 및 답변을 지원하는 모델입니다.

생성형 AI 모델에서 응답 스트리밍

매개변수는 API에 대한 스트리밍 요청 또는 비스트리밍 요청에 대해 모두 동일합니다.

REST API를 사용하여 샘플 코드 요청 및 응답을 보려면 스트리밍 REST API 사용 예시를 참조하세요.

Python용 Vertex AI SDK를 사용하여 샘플 코드 요청 및 응답을 보려면 스트리밍을 위한 Python용 Vertex AI SDK 사용 예시를 참조하세요.

사용 가능한 리전

기반 모델이 Vertex AI의 생성형 AI에서 지원되는 리전 목록은 리전을 참조하세요.

책임감 있는 AI 참조

안전 관련 속성과 샘플 응답을 보려면 안전 필터 및 속성을 참조하세요. 이러한 참조 전반에는 citation 매개변수가 사용됩니다. 인용에 대한 자세한 내용은 인용 메타데이터를 참조하세요.

다음 단계