Vertex AI의 생성형 AI 개요

Vertex AI의 생성 AI(genAI 또는 gen AI라고도 함)를 통해 Google의 대규모 생성형 AI 모델에 액세스할 수 있으므로 AI 기반 애플리케이션에서 사용하기 위해 테스트, 조정, 배포할 수 있습니다. 이 페이지에서는 Vertex AI의 생성형 AI 워크플로, 제공되는 기능, 모델을 간략하게 설명하고 시작하기 위한 리소스를 안내합니다.

생성형 AI 워크플로

다음 다이어그램은 생성형 AI 워크플로의 대략적인 개요를 보여줍니다.

생성형 AI 워크플로 다이어그램

프롬프트

프롬프트

생성형 AI 워크플로는 일반적으로 프롬프트로 시작합니다. 프롬프트는 응답을 요청하기 위해 언어 모델로 전송되는 자연어 요청입니다. 모델에서 원하는 응답을 가져오는 프롬프트를 작성하는 것을 프롬프트 설계라고 합니다. 프롬프트 디자인은 시행착오의 과정이지만, 모델이 원하는 방식으로 실행되도록 하는 데 사용할 수 있는 프롬프트 디자인 원칙과 전략이 있습니다.

기반 모델

기반 모델

프롬프트는 응답 생성을 위해 모델에 전송됩니다. Vertex AI에는 다음을 포함해서 API를 통해 액세스할 수 있는 다양한 생성형 AI 기반 모델이 포함됩니다.

  • Gemini API: 고급 추론, 멀티턴 채팅, 코드 생성, 멀티모달 프롬프트
  • PaLM API: 자연어 태스크, 텍스트 임베딩, 멀티턴 채팅
  • Codey API: 코드 생성, 코드 완성, 코드 채팅
  • Imagen API: 이미지 생성, 이미지 수정, 이미지 캡셔닝
  • MedLM: 의료 질의 응답 및 요약 (비공개 GA)

모델은 크기, 형식, 비용이 다릅니다. Model Garden에서 Google의 독점 모델과 OSS 모델을 살펴볼 수 있습니다.

모델 맞춤설정

모델 맞춤설정

복잡한 메시지를 사용하지 않고 원하는 결과를 일관되게 생성할 수 있도록 Google의 기반 모델의 기본 동작을 맞춤설정할 수 있습니다. 이 맞춤설정 프로세스를 모델 미세 조정이라고 합니다. 모델 미세 조정을 사용하면 프롬프트를 간소화하여 요청 비용과 지연 시간을 줄일 수 있습니다.

또한 Vertex AI는 미세 조정된 모델의 성능을 평가하는 데 도움이 되는 모델 평가 도구를 제공합니다. 조정된 모델이 프로덕션에 사용할 준비가 되면 이를 엔드포인트에 배포하고 표준 MLOps 워크플로에서 성능을 모니터링할 수 있습니다.

Vertex AI 그라운딩 서비스

그라운딩

자체 데이터 코퍼스와 같이 정보원에서 모델 응답을 그라운딩해야 하는 경우 Vertex AI에서 그라운딩을 사용할 수 있습니다. 그라운딩은 특히 알려지지 않은 주제에서 모델 할루시네이션을 줄이는 데 도움이 되고, 모델에 새 정보 액세스 권한을 부여합니다.

인용 확인

인용 확인

응답이 생성된 후 Vertex AI가 응답에 인용을 포함해야 하는지 확인합니다. 응답의 텍스트 양이 특정 소스에서 제공되는 경우 이 출처는 응답의 인용 메타데이터에 추가됩니다.

책임감 있는 AI 및 안전

책임감 있는 AI 및 안전

반환되기 전 프롬프트와 응답이 통과하는지 확인하는 마지막 레이어는 안전 필터입니다. Vertex AI는 프롬프트와 응답이 모두 안전 카테고리에 속하는 정도를 확인합니다. 하나 이상의 카테고리에 기준점이 초과되면 응답이 차단되고 Vertex AI가 대체 응답을 반환합니다.

응답

응답

프롬프트와 응답이 안전 필터 확인을 통과하면 응답이 반환됩니다. 일반적으로 응답은 한 번에 모두 반환됩니다. 그러나 스트리밍을 사용 설정해서 생성되는 대로 점진적으로 응답을 수신할 수도 있습니다.

생성형 AI API 및 모델

기반 모델이라고도 부르는 Vertex AI의 생성형 AI 모델은 생성하도록 설계된 콘텐츠 유형에 따라 분류됩니다. 이 콘텐츠에는 텍스트, 채팅, 이미지, 코드, 동영상, 멀티모달 데이터, 임베딩이 포함됩니다. 각 모델은 Google Cloud 프로젝트에 따라 달라지는 게시자 엔드포인트를 통해 노출되므로, 특정 사용 사례에 맞게 조정해야 하는 경우가 아니라면 기반 모델을 배포할 필요가 없습니다.

Gemini API 서비스

Vertex AI Gemini API에는 Google DeepMind에서 제공되는 Gemini 모델에 대한 게시자 엔드포인트가 포함됩니다.

  • Gemini 1.0 Pro는 자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다.
  • Gemini 1.0 Pro Vision은 멀티 모달 프롬프트를 지원합니다. 프롬프트 요청에 텍스트, 이미지, 동영상을 포함하고 텍스트 또는 코드 응답을 얻을 수 있습니다.

PaLM API 서비스

Vertex AI PaLM API에는 자연어 프롬프트에 대한 응답으로 테스트 및 코드를 생성하는 대규모 언어 모델(LLM)에 해당하는 Google Pathways Language Model 2(PaLM 2)에 대한 게시자 엔드포인트가 포함되어 있습니다.

  • 텍스트용 PaLM API는 분류, 요약, 항목 추출과 같은 언어 태스크를 위해 미세 조정되어 있습니다.
  • 채팅용 PaLM API는 모델이 채팅의 이전 메시지를 추적하고 새로운 응답을 생성하기 위한 컨텍스트로 사용하는 멀티턴 채팅을 위해 미세 조정되어 있습니다.

기타 생성형 AI 서비스

  • Codey API는 코드를 생성합니다. Codey API에는 코드를 생성하고, 코드 완성을 위한 코드를 제안하고, 개발자가 채팅을 통해 코드 관련 질문 도움을 얻을 수 있게 해주는 세 가지 모델이 포함되어 있습니다. 자세한 내용은 코드 모델 개요를 참조하세요.

  • 텍스트 임베딩 API는 입력 텍스트에 대한 벡터 임베딩을 생성합니다. 시맨틱 검색, 권장사항, 분류, 이상점 감지와 같은 태스크에 임베딩을 사용할 수 있습니다.

  • 멀티모달 임베딩은 이미지 및 텍스트 입력을 기반으로 임베딩 벡터를 생성합니다. 이러한 임베딩은 나중에 이미지 분류 또는 콘텐츠 추천과 같은 후속 태스크에 사용될 수 있습니다. 자세한 내용은 멀티모달 임베딩 페이지를 참조하세요.

  • 텍스트 이미지 변환 기반 모델인 Imagen을 사용하면 조직이 모든 비즈니스 요구에 맞게 규모에 따라 스튜디오급 이미지를 생성하고 맞춤설정할 수 있습니다. 자세한 내용은 Vertex AI 기반 Imagen 개요를 참조하세요.

  • MedLM은 의료 산업에 맞게 미세 조정된 기반 모델의 제품군입니다. 자세한 내용은 MedLM 모델 개요를 참조하세요.

Vertex AI Studio

Vertex AI Studio는 생성형 AI 모델을 빠르게 프로토타입 제작하고 테스트하기 위한 Google Cloud 콘솔 도구입니다. 샘플 프롬프트를 테스트하고 고유 프롬프트를 설계하고 기반 모델을 맞춤설정하여 애플리케이션의 요구사항을 충족하는 태스크를 처리할 수 있습니다. 이 페이지에서는 다음과 같이 Vertex AI Studio에서 수행할 수 있는 여러 다른 태스크를 소개합니다.

  • 프롬프트 샘플을 사용하여 모델 테스트
  • 나만의 프롬프트 설계 및 저장
  • 기반 모델 조정
  • 음성 및 텍스트 간 변환

프롬프트 샘플을 사용하여 모델 테스트

Vertex AI Studio의 언어 섹션에서 프롬프트 갤러리에는 모델 기능 시연에 도움이 되도록 미리 설계된 다양한 샘플 프롬프트가 포함됩니다. 샘플 프롬프트는 요약, 분류, 추출과 같은 태스크 유형에 따라 분류됩니다. 각 프롬프트가 지정된 모델 및 매개변수 값으로 미리 구성되어 있어서 샘플 프롬프트만 열고 제출을 클릭하여 모델이 응답을 생성하도록 만들 수 있습니다.

prompt-ui

나만의 프롬프트 설계 및 저장

프롬프트 설계는 언어 모델에서 원하는 응답을 유도하는 프롬프트를 수동으로 만드는 프로세스입니다. 프롬프트를 신중하게 만들면 원하는 결과를 얻기 위해 모델을 유도할 수 있습니다. 프롬프트 설계는 특정 사용 사례에 맞게 언어 모델을 적용하는 효율적인 실험 방법일 수 있습니다.

Vertex AI Studio에서 자체 프롬프트를 만들고 저장할 수 있습니다. 새 프롬프트를 만들 때는 프롬프트 텍스트를 입력하고, 사용할 모델을 지정하고, 매개변수 값을 구성하고, 응답을 생성하여 프롬프트를 테스트합니다. 원하는 결과를 얻을 때까지 프롬프트 및 구성을 반복 처리할 수 있습니다. 프롬프트 설계를 마쳤으면 이를 Vertex AI Studio에 저장할 수 있습니다.

응답 인용

text-bison과 같이 Vertex AI Studio에서 텍스트 모델을 사용할 경우 입력을 기반으로 텍스트 응답이 수신됩니다. 이러한 기능은 기존 콘텐츠를 길게 복제하는 것이 아니라 오리지널 콘텐츠를 만들기 위한 것입니다. Vertex AI Studio가 웹페이지에서 길게 인용하면 출력에서 해당 페이지를 인용합니다.

text-citation

강도(출력 무작위성)를 조정하고 Vertex AI Studio에서 다른 응답 매개변수로 실험을 수행하여 응답 품질을 변경할 수 있습니다.

인용은 Vertex AI Studio 및 API에서 사용 가능합니다. 책임감 있는 AI 및 인용에 대한 자세한 내용은 인용 메타데이터를 참조하세요.

Model Garden의 생성형 AI 모델 살펴보기

Model Garden은 Google 독점 정보를 탐색, 테스트, 맞춤설정 및 배포하고 OSS 모델 및 애셋을 선택할 수 있게 해주는 플랫폼입니다. Vertex AI에서 사용할 수 있는 생성형 AI 모델 및 API를 살펴보려면 Google Cloud 콘솔의 Model Garden으로 이동합니다.

Model Garden으로 이동

사용 가능한 모델 및 기능을 포함하여 Model Garden에 대해 자세히 알아보려면 Model Garden에서 AI 모델 살펴보기를 참조하세요.

기반 모델 조정

빠른 실험을 위해서는 프롬프트 설계가 효과적이지만 학습 데이터를 사용할 수 있으면 모델 자체를 조정하여 더 높은 품질을 얻을 수 있습니다. 모델을 조정하면 모델이 수행할 태스크 예시에 따라 모델 응답을 맞춤설정할 수 있습니다.

기반 모델을 조정하는 방법은 기반 모델 조정을 참조하세요.

음성 및 텍스트 간 변환

Vertex AI Studio의 음성 도구에서 텍스트 스니펫을 가져와서 이를 재생 및 다운로드할 수 있는 음성 오디오 파일로 변환할 수 있습니다. 여러 음성 중에서 선택하고 음성 속도를 조정할 수 있습니다.

반대로 음성 오디오 파일이 있으면 이를 Vertex AI Studio에 업로드하여 이를 텍스트로 변환할 수 있습니다.

자세한 내용은 다음 페이지를 참조하세요.

Vertex AI Studio 사용해 보기

Vertex AI Studio는 Google Cloud 콘솔의 Vertex AI 페이지에 있습니다.

Vertex AI Studio로 이동

인증 및 보안 제어

Vertex AI는 CMEK, VPC 서비스 제어, 데이터 상주, 액세스 투명성을 지원합니다. 생성형 AI 기능에는 몇 가지 제한사항이 있습니다. 자세한 내용은 생성형 AI 보안 제어를 참조하세요.

시작하기