Vertex AI의 생성형 AI 개요

Vertex AI의 생성형 AI(genAI 또는 gen AI라고도 함)는 여러 대규모 생성형 AI 모델에 액세스하여 평가, 조정, 배포를 통해 AI 기반 애플리케이션에 사용할 수 있게 해줍니다. 이 페이지에서는 Vertex AI의 생성형 AI 워크플로, 제공되는 기능, 모델을 간략하게 설명하고 시작하기 위한 리소스를 안내합니다.

생성형 AI 워크플로

다음 다이어그램은 생성형 AI 워크플로의 대략적인 개요를 보여줍니다.

생성형 AI 워크플로 다이어그램

프롬프트

프롬프트

생성형 AI 워크플로는 일반적으로 프롬프트로 시작합니다. 프롬프트는 응답을 다시 유도하기 위해 생성형 AI 모델로 전송되는 요청입니다. 모델에 따라 프롬프트에는 텍스트, 이미지, 동영상, 오디오, 문서 및 기타 형식은 물론 여러 형식(멀티모달)도 포함될 수 있습니다.

모델에서 원하는 응답을 얻기 위해 프롬프트를 만드는 과정을 프롬프트 설계라고 부릅니다. 프롬프트 설계는 시행착오를 반복하는 과정이지만 원하는 방식으로 작동하도록 모델을 잘 다루기 위해 사용할 수 있는 프롬프트 설계 원칙과 전략이 있습니다. Vertex AI Studio는 프롬프트 관리에 도움이 되는 프롬프트 관리 도구를 제공합니다.

기반 모델

기반 모델

프롬프트는 응답 생성을 위해 생성형 AI 모델에 전송됩니다. Vertex AI에는 다음을 포함해서 관리형 API를 통해 액세스할 수 있는 다양한 생성형 AI 기반 모델이 포함됩니다.

  • Gemini API: 고급 추론, 멀티턴 채팅, 코드 생성, 멀티모달 프롬프트
  • Imagen API: 이미지 생성, 이미지 수정, 이미지 캡셔닝
  • MedLM: 의료 질의 응답 및 요약 (비공개 GA)

모델은 크기, 형식, 비용이 다릅니다. Google 모델과 오픈 모델, Google 파트너의 모델은 Model Garden에서 살펴볼 수 있습니다.

모델 맞춤설정

모델 맞춤설정

복잡한 프롬프트를 사용하지 않고도 원하는 결과를 일관되게 생성하도록 Google 기반 모델의 기본 동작을 맞춤설정할 수 있습니다. 이러한 맞춤설정 프로세스를 모델 조정이라고 합니다. 모델 조정을 통해 프롬프트를 간소화하여 요청 비용과 지연 시간을 줄일 수 있습니다.

Vertex AI는 조정된 모델의 성능을 평가하는 데 도움이 되는 모델 평가 도구도 제공합니다. 조정된 모델이 프로덕션에 사용할 준비가 되면 이를 엔드포인트에 배포하고 표준 MLOps 워크플로에서 성능을 모니터링할 수 있습니다.

증강 요청

증강

Vertex AI는 외부 API 및 실시간 정보에 대한 액세스 권한을 모델에 부여하는 여러 요청 강화 방법을 제공합니다.

  • 그라운딩: 자체 데이터 또는 웹 검색과 같이 정보원에 모델 응답을 연결하여 할루시네이션을 줄여줍니다.
  • RAG: 문서 및 데이터베이스와 같은 외부 지식 소스에 모델을 연결하여 보다 정확하고 유용한 응답을 생성합니다.
  • 함수 호출: 모델이 외부 API와 상호작용해서 실시간 정보를 얻고 실제 태스크를 수행할 수 있게 해줍니다.

인용 확인

인용 확인

응답이 생성된 후 Vertex AI는 응답에 인용을 포함해야 하는지 여부를 확인합니다. 응답에 포함된 텍스트 상당량을 특정 출처에서 가져온 경우 해당 출처가 응답의 인용 메타데이터에 추가됩니다.

책임감 있는 AI 및 안전

책임감 있는 AI 및 안전

프롬프트와 응답이 반환되기 전에 거치는 마지막 검사 레이어는 안전 필터입니다. Vertex AI는 프롬프트와 응답 모두에서 프롬프트 또는 응답이 얼마나 안전 카테고리에 속하는지 확인합니다. 하나 이상의 카테고리에 기준점이 초과되면 응답이 차단되고 Vertex AI가 대체 응답을 반환합니다.

응답

응답

프롬프트와 응답이 안전 필터 확인을 통과하면 응답이 반환됩니다. 일반적으로 응답은 한 번에 모두 반환됩니다. 그러나 스트리밍을 사용 설정해서 생성되는 대로 점진적으로 응답을 수신할 수도 있습니다.

생성형 AI API 및 모델

기반 모델이라고도 부르는 Vertex AI의 생성형 AI 모델은 생성하도록 설계된 콘텐츠 유형에 따라 분류됩니다. 이 콘텐츠에는 텍스트, 채팅, 이미지, 코드, 동영상, 멀티모달 데이터, 임베딩이 포함됩니다. 각 모델은 Google Cloud 프로젝트에 따라 달라지는 게시자 엔드포인트를 통해 노출되므로, 특정 사용 사례에 맞게 조정해야 하는 경우가 아니라면 기반 모델을 배포할 필요가 없습니다.

Gemini API 서비스

Vertex AI Gemini API에는 Google DeepMind에서 제공되는 Gemini 모델에 대한 게시자 엔드포인트가 포함됩니다.

  • Gemini 1.5 Pro(미리보기)는 멀티모달 프롬프트를 지원합니다. 프롬프트 요청에 텍스트, 이미지, 오디오, 동영상, PDF 파일을 포함하고 텍스트 또는 코드 응답을 가져올 수 있습니다. Gemini 1.5 Pro(미리보기)는 Gemini 1.0 Pro Vision보다 더 큰 이미지 컬렉션, 더 큰 텍스트 문서, 더 긴 동영상을 처리할 수 있습니다.
  • Gemini 1.0 Pro는 자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다.
  • Gemini 1.0 Pro Vision은 멀티 모달 프롬프트를 지원합니다. 프롬프트 요청에 텍스트, 이미지, 동영상, PDF를 포함하고 텍스트 또는 코드 응답을 얻을 수 있습니다.

다음 표에서는 최적의 모델을 선택할 수 있도록 Gemini 모델 간 차이점을 보여줍니다.

Gemini 모델 형식 컨텍스트 윈도우
Gemini 1.0 Pro/Gemini 1.0 Pro Vision
  • 텍스트, 코드, PDF(Gemini 1.0 Pro Vision)
  • 이미지 최대 16개
  • 동영상 최대 2분
  • 8,192개 토큰
  • 출력된 토큰 2,048개
Gemini 1.5 Pro(미리보기)
  • 텍스트, 코드, 이미지, 오디오, 동영상, PDF
  • 이미지 최대 3,000개
  • 오디오 최대 8.4시간
  • 동영상(오디오 최대 1시간)
  • 토큰 100만 개
  • 출력된 토큰 8,192개

PaLM API 서비스

Vertex AI PaLM API에는 자연어 프롬프트에 대한 응답으로 테스트 및 코드를 생성하는 대규모 언어 모델(LLM)에 해당하는 Google Pathways Language Model 2(PaLM 2)에 대한 게시자 엔드포인트가 포함되어 있습니다.

  • 텍스트용 PaLM API는 분류, 요약, 항목 추출과 같은 언어 태스크를 위해 미세 조정되어 있습니다.
  • 채팅용 PaLM API는 모델이 채팅의 이전 메시지를 추적하고 새로운 응답을 생성하기 위한 컨텍스트로 사용하는 멀티턴 채팅을 위해 미세 조정되어 있습니다.

기타 생성형 AI 서비스

  • 텍스트 임베딩은 입력 텍스트에 대한 벡터 임베딩을 생성합니다. 시맨틱 검색, 권장사항, 분류, 이상점 감지와 같은 태스크에 임베딩을 사용할 수 있습니다.

  • 멀티모달 임베딩은 이미지 및 텍스트 입력을 기반으로 벡터 임베딩을 생성합니다. 이러한 임베딩은 나중에 이미지 분류 또는 콘텐츠 추천과 같은 후속 태스크에 사용될 수 있습니다.

  • 텍스트 이미지 변환 기반 모델인 Imagen을 사용하면 규모에 따라 스튜디오급 이미지를 생성하고 맞춤설정할 수 있습니다.

  • 파트너 모델은 Google 파트너 회사에서 개발한 선별된 생성형 AI 모델 목록입니다. 이러한 생성형 AI 모델은 관리형 API로 제공됩니다. 예를 들어 Anthropic은 Vertex AI 기반 서비스로 Claude 모델을 제공합니다.

  • Llama와 같은 오픈 모델은 Vertex AI 또는 기타 플랫폼에 배포할 수 있습니다.

  • MedLM은 의료 산업에 맞게 미세 조정된 기반 모델의 제품군입니다.

인증 및 보안 제어

Vertex AI는 CMEK, VPC 서비스 제어, 데이터 상주, 액세스 투명성을 지원합니다. 생성형 AI 기능에는 몇 가지 제한사항이 있습니다. 자세한 내용은 생성형 AI 보안 제어를 참조하세요.

시작하기