콘텐츠로 이동하기
AI 및 머신러닝

Vertex AI의 생성형 AI 지원에 대한 가이드

2023년 4월 3일
Warren Barkley

Sr. Director of Product Management

* 본 아티클의 원문은 2023년 3월 30일 Google Cloud 블로그(영문)에 게재되었습니다.


저는 이 블로그의 내용을 설명이 가미된 댄스 동영상으로 전달하자고 제안했습니다. 이 제안은 거절당했죠. 여러분도 저만큼 실망하셨을 겁니다. 하지만 댄스든 아니든 Vertex AI의 생성형 AI 지원이 정말 큰 기대가 됩니다. 

Vertex AI는 특성 추출부터 모델 학습과 저지연 추론에 이르기까지 모두 엔터프라이즈 거버넌스와 모니터링을 통해 ML 모델의 개발과 배포를 가속화하기 위해 2021년에 출시되었습니다. 그 이후로 Wayfair, Vodafone, 트위터, CNA 등의 고객은 Vertex AI로 ML 프로젝트를 가속화했고, Google은 수백 가지의 새로운 기능을 출시했습니다. 

하지만 거기서 멈추지 않았습니다. Vertex AI는 최근에 가장 큰 규모의 업데이트를 수행했습니다. Vertex AI의 생성형 AI 지원은 팀에서 다양한 생성 모델을 활용할 수 있는 가장 간단한 방법을 제공합니다. 이제 엔드 투 엔드 머신러닝 플랫폼에 직접 빌드한 생성형 AI의 강력한 기능을 활용할 수 있습니다.

Vertex AI의 생성형 AI 지원

지난 몇 달간 소비자급 생성형 AI는 지능형 챗봇과 살아 있는 듯한 디지털 아바타로 수백만 명의 관심을 끌었습니다. 이러한 기술이 잠재력을 완전히 발휘하려면 모든 개발자, 기업 및 정부가 사용할 수 있도록 지원해야 합니다. 지금까지 생성형 AI에 액세스하고 비즈니스 사용 사례를 위한 기반 모델을 맞춤설정하는 것은 어려운 일이었습니다. 이러한 대규모 모델을 프로덕션 환경에서 관리하는 것은 고급 툴킷, 수많은 데이터, 전문 기술, 훨씬 더 많은 시간을 필요로 하는 까다로운 작업이기 때문입니다.

Vertex AI의 생성형 AI 지원을 통해 개발자와 데이터 과학자는 간단한 사용자 인터페이스로 기반 모델에 보다 쉽게 액세스하여 이를 맞춤설정하고 배포할 수 있습니다. Google은 다양한 도구와 자동화된 워크플로를 비롯하여 시작하는 데 도움이 되는 여러 솔루션을 제공합니다. 일단 배포하면 Vertex AI의 엔드 투 엔드 MLOps 기능과 완전 관리형 AI 인프라를 사용하여 프로덕션 환경에서 기반 모델을 확장, 관리, 통제할 수 있습니다. 

Vertex AI는 최근에 두 가지 새로운 기능을 추가했습니다. 모델 가든생성형 AI 스튜디오입니다. 이 블로그에서는 두 기능에 대해 자세히 알아보고 이 기능으로 무엇을 할 수 있는지 살펴보겠습니다.

Video Thumbnail

모델 가든: 제공되는 다양한 모델 유형 탐색 및 사용 

모델 가든은 Google의 자체 기반 모델은 물론, 수백 개의 서드 파티 오픈소스 모델을 즉시 검색 및 탐색하고 이와 상호작용할 수 있는 단일 환경을 제공합니다. 사용자는 텍스트 모델에 액세스할 수 있을 뿐만 아니라, Google의 멀티모달 모델에 액세스하여 비전, 대화, 코드 생성, 코드 완성 전반에 걸쳐 차세대 애플리케이션을 빌드할 수도 있습니다. Google은 AI 스택의 모든 수준에서 선택권을 제공하기 위해 노력하고 있습니다. 이것이 바로 모델 가든이 오픈소스 파트너와 AI 파트너 생태계의 모델을 모두 포함하고 있는 이유입니다. 다양한 모델 유형 및 크기를 한 곳에서 이용할 수 있기 때문에 고객의 비즈니스 니즈에 맞춰 최고의 리소스를 사용할 수 있는 유연성을 제공합니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Generative_AI_support_in_Vertex_AI.max-2000x2000.jpg

사용자는 모델 가든을 통해 모델을 API로 바로 사용하거나, 생성형 AI 스튜디오에서 모델을 미세 조정하거나 Vertex AI의 데이터 과학 노트북으로 모델을 직접 배포하는 등 다양한 워크플로를 시작할 수 있습니다.

생성형 AI 스튜디오: 기반 모델의 쉬운 미세 조정 및 배포 

생성형 AI 스튜디오는 개발자와 데이터 과학자가 기반 모델과 상호작용하고 기반 모델을 미세 조정 및 배포할 수 있는 Vertex AI의 관리형 환경입니다. 생성형 AI 스튜디오는 채팅 인터페이스, 프롬프트 설계, 프롬프트 미세 조정, 모델 가중치 미세 조정 등 다양한 기능을 제공합니다. 생성형 AI 스튜디오에서 사용자는 새롭게 미세 조정된 모델을 애플리케이션에 직접 구현하거나 모델을 Vertex AI의 ML 플랫폼에서 프로덕션 환경에 배포할 수 있습니다. 애플리케이션 개발자와 데이터 과학자가 생성형 AI를 빌드하는 데 기여하도록 지원하는 두 가지 도구를 통해 조직은 차세대 애플리케이션을 프로덕션 환경에 더 빠르고 확실하게 배포할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Generative_AI_support_in_Vertex_AI.max-2000x2000.jpg

Vertex AI에서 기반 모델과 상호작용하는 5가지 방법

1. 기반 모델을 API로 사용: Google의 기반 모델을 텍스트, 대화, 코드 생성 및 완료, 이미지 생성, 임베딩 등의 API로 사용할 수 있도록 만들고 있습니다. Vertex AI의 관리형 엔드포인트를 사용하면 다른 Google Cloud API처럼 코드 몇 줄만으로 애플리케이션에 생성형 기능을 쉽게 빌드할 수 있습니다. 개발자는 스토리지 및 컴퓨팅 리소스를 프로비저닝하거나 추론을 위해 모델을 최적화하는 복잡한 과정에 대해 걱정할 필요가 없습니다. 

2. 프롬프트 설계: 생성형 AI 스튜디오는 프롬프트 설계, 즉 기반 모델에 정보를 제공하기 위해 텍스트 입력 또는 프롬프트를 수동 생성하는 프로세스에 사용하기 쉬운 인터페이스를 제공합니다. 채팅과 비슷한 익숙한 경험을 통해 많은 사람이 개발자의 전문 기술 없이도 모델과 상호작용할 수 있습니다. 사용자는 채팅 인터페이스를 이용하는 데서 더 나아가 직접 시스템을 구성할 수도 있습니다. 예를 들어 응답의 정도를 조절할 수 있습니다. 즉, 응답의 정확성과 창의성 수준을 제어할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_Generative_AI_support_in_Vertex_AI.max-2000x2000.jpg

3. 프롬프트 미세 조정: 프롬프트 미세 조정은 재학습 없이 기반 모델을 맞춤설정할 수 있는 효율적이고도 저렴한 방법입니다. 프롬프트는 프로그래밍 언어가 아닌 자연어를 사용하여 유용한 출력을 생성하도록 모델을 가이드하는 방법입니다. 생성형 AI 스튜디오에서는 모델이 특정 방식으로 작동하도록 유도하는 데 사용되는 사용자 데이터를 쉽게 업로드할 수 있습니다. 예를 들어, 사용자가 PaLM 언어 모델을 업데이트하여 자사 브랜드의 음성으로 말하도록 하려면 브랜드 문서, 트윗, 보도 자료를 비롯한 기타 애셋을 생성형 AI 스튜디오에 업로드하기만 하면 됩니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_Generative_AI_support_in_Vertex_AI.max-2000x2000.jpg

4. 미세 조정: 생성형 AI 스튜디오의 미세 조정은 고도로 차별화된 생성형 AI 제품을 빌드하려는 조직에 매우 적합한 옵션입니다. 미세 조정은 선행 학습된 모델에 새로운 데이터를 추가로 학습시켜 모델의 가중치를 변경하는 프로세스입니다. 이 프로세스는 법률 또는 의학 용어와 같이 전문적인 결과의 출력이 필요한 사용 사례에 유용합니다. Vertex AI 생성형 AI 스튜디오에서 사용자는 대규모 데이터 세트를 업로드하고 Vertex AI 학습을 사용하여 모델을 재학습시킬 수 있습니다. Google Cloud는 보호된 원칙 밖에서 가중치의 변화를 노출하지 않고 모델을 미세 조정할 수 있는 기능을 제공합니다. 이를 통해 데이터에 대한 통제력을 잃지 않고 기반 모델의 강점을 활용할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/5_Generative_AI_support_in_Vertex_AI.max-2000x2000.jpg

5. 비용 최적화: Google은 몇 년간 이러한 모델을 프로덕션 워크로드에서 실행해 왔으며, 그 기간 동안 비용에 대한 예측을 최적화하기 위한 몇 가지 기술을 개발했습니다. Google이 제공하는 기술 중 최적화된 모델 선택(OMS)은 모델에 무엇이 요청되고 있는지 살펴보고 요청에 효과적으로 대응할 수 있는 가장 작은 모델로 요청을 라우팅합니다. 사용 설정하면 백그라운드에서 실행되고 여러 조건에 따라 호출됩니다. 

Vertex AI의 생성형 AI 지원에 대한 발 빠른 고객들의 기대

CNA의 글로벌 데이터 및 분석 최고 책임자이자 SVP인 산토시 바드와즈는 다음과 같이 말합니다. "처음부터 Vertex AI는 CNA의 AI 확장 방식을 혁신하고 프로덕션 환경에서 머신러닝 모델을 보다 효과적으로 관리하는 데 도움이 되었습니다. Vertex AI의 대규모 모델 지원 덕분에 현재 CNA는 고객과 직원의 고유한 비즈니스 니즈에 맞춘 유용한 정보를 제공할 수 있습니다."

Deutsche Bank의 CIO인 길 페레즈는 다음과 같이 말합니다. "Google Cloud는 Deutsche Bank의 전략적 파트너로서 운영 효율을 개선하고 고객을 위한 제품 설계 및 제공 방식을 재편하기 위해 협력하고 있습니다. 책임감 있는 AI에 대한 Google의 접근 방식에 만족하고 있으며, 개발자 생산성 및 혁신 강화, 직원 유지에 있어 그동안 달성한 성공을 기반으로 생성형 AI의 발전 과정에서도 함께 혁신을 이룰 수 있기를 기대합니다."

Google Cloud 신뢰할 수 있는 테스터 프로그램에서는 일부 개발자에게 새로운 비즈니스용 생성형 AI 제품을 제공해 드리고 있습니다.

새로운 발표 내용에 대해 자세히 알아보려면 Google Cloud의 AI 웹페이지를 방문하거나 3월 29일 온라인에서 라이브로 진행되는 Google Data Cloud & AI Summit에 참여하세요. 거기서 제 춤을 보여드릴 수 있을지도 모르겠네요.

게시 위치