콘텐츠로 이동하기
AI 및 머신러닝

최신 업데이트 : Gemini, Imagen, Gemma and MLOps on Vertex AI

2024년 4월 26일
https://storage.googleapis.com/gweb-cloudblog-publish/images/Next24_Blog_Images_6-04.max-2500x2500.jpg
Amin Vahdat

VP/GM, ML, Systems, and Cloud AI

Gemini 1.5 모델 사용해 보기

Google Vertex AI의 가장 진보한 멀티모달 모델

사용해 보기

*본 아티클의 원문은 2024년 4월 10일 Google Cloud 블로그(영문)에 게재되었습니다.

모든 하이퍼스케일 제공업체의 다양한 파운데이션 모델에 대한 액세스, 강력한 인프라 옵션, 모델 개발 MLOps 위한 깊이 있는 도구 모음을 갖춘 Vertex AI 생성형 AI 앱과 에이전트를 빌드할 뿐만 아니라 배포하고 유지관리할 있는 원스톱 플랫폼입니다. 오늘 Google Cloud Next에서는 Vertex AI 지속적으로 향상시키는 흥미로운 모델 업데이트와 플랫폼 기능을 다음과 같이 소개합니다

  • Gemini 1.5 Pro 이제 Vertex AI에서 공개 프리뷰 버전으로 제공되어 세계 개발자가 세계 최대 규모의 컨텍스트 윈도우를 사용할 있게 되었습니다. 이제 이미지 생성 모델 제품군인 Imagen 2.0 사용해 텍스트 프롬프트를 바탕으로 4 길이의 짧은 애니메이션 이미지를 만들 있습니다. 그리고 Imagen 2.0에서 인페인팅/아웃페인팅과 디지털 워터마크 등의 이미지 편집 기능도 정식 버전으로 출시할 예정입니다. 또한 경량 모델 제품군인 Gemma 신규 모델, CodeGemma Vertex AI 추가됩니다.

  • 생성형 AI 서비스에서는 응답의 정확성이 매우 중요하기 때문에 Vertex AI 그라운딩 기능 확장하고 있습니다. 대표적으로 Google Search 사용해 응답을 바로 그라운딩할 있는 기능이 있으며, 현재 공개 프리뷰 버전으로 제공 중입니다. 기능을 통해 Vertex AI 사용자는 이제 모델 응답의 정확성을 대폭 개선하는 고품질의 최신 정보에 액세스할 있습니다.

  • Google Cloud 고객이 프로덕션 단계에 있는 모델을 관리하고 배포하는 도움을 주기 위해 생성형 AI 위한 MLOps 기능을 확장하고 있습니다. 여기에는 새로운 프롬프트 관리 대규모 모델의 테스트 서비스 포함됩니다. 이러한 기능은 조직이 생성형 AI 모델에서 대규모로 최대한의 성능을 끌어내고 실험부터 프로덕션까지 보다 빠르게 반복할 있도록 만들어 줍니다.

발표 내용을 아래에서 자세히 살펴보겠습니다.

고객에게 최상의 엔터프라이즈용 모델 제공

Google Cloud 고객에게 최상의 엔터프라이즈용 모델을 제공한다는 사명을 다하기 위해 최선을 다하고 있습니다. 이에 따라 지난 사이에만 Google Gemini 1.0 Pro부터 Gemini 만들기 위해 투입된 연구 기술을 기반으로 하는 경량 개방형 모델 제품군인 Gemma, Anthropic Claude 3 모델 제품군까지 다양한 유형의 최첨단 퍼스트 파티 모델, 서드 파티 모델, 개방형 모델에 대한 액세스가 Vertex AI 추가되었습니다.

2월에 발표된 Gemini 1.5 Pro 현재 공개 프리뷰가 진행 중이며, 고객에게 100 토큰 규모의 컨텍스트 윈도우를 세계 최초로 제공하고 있습니다. 획기적인 발전은 특정 요청과 관련된 엄청난 양의 데이터를 바탕으로 네이티브 멀티모달 추론을 가능하게 합니다

현재 여러 고객이 AI 기반 고객 서비스 담당자와 개인 지도 교사를 빌드하고, 방대한 양의 복잡한 재무 문서를 분석하고, 문서 내에서 불완전한 부분을 찾아내고, 자연어를 통해 전체 코드베이스 또는 데이터 모음을 탐색하는 완전히 새로운 사용 사례를 구축하고 있습니다.   

United Wholesale Mortgage Gemini 1.5 Pro 사용하여 인수 절차를 보강하고 주택담보대출 신청 절차를 자동화하고 있습니다

SAP Gemini 1.5 Pro 모델을 SAP 생성형 AI 허브에 포함하는 방안을 검토하고 있습니다. SAP 생성형 AI 허브는 관련성 있고 신뢰할 있으며 책임 있는 비즈니스 AI 도입을 촉진하며 다양한 대규모 언어 모델에 대한 즉각적인 액세스를 제공하기 위한 장소입니다

일본의 대표적인 민영 방송사 하나인 TBS Gemini 1.5 Pro 사용하여 대규모 미디어 자료에 메타데이터를 태그하는 작업을 자동화하고 있습니다. 이를 통해 프로덕션 과정에서 자료를 찾는 작업의 효율을 크게 개선했습니다.

또한 Replit 보다 우수한 정확성, 성능, 속도로 코드를 생성, 설명, 변환하기 위해 Gemini 1.5 Pro 테스트하고 있습니다.

또한 Vertex AI Gemini 1.5 Pro 이제 오디오 스트림 처리 작업을 지원합니다. 처리할 있는 오디오 스트림에는 음성은 물론 동영상의 오디오까지 포함됩니다. 덕분에 원활한 cross modal 분석을 통해 텍스트, 이미지, 동영상, 오디오 여러 형식에서 인사이트를 얻을 있게 되었습니다. 예를 들어 사용자는 Gemini 1.5 Pro 사용해 여러 건의 실적 발표 투자자 회의에서 스크립트를 작성하고, 검색하고, 분석하며, 질문에 대한 답도 얻을 있습니다.

고급 생성형 미디어 기능을 제공하는 Imagen

Gemini 모델은 고급 추론 범용 사용 사례에 적합하지만 작업별 생성형 AI 모델은 엔터프라이즈가 특화된 기능을 제공하는 도움이 있습니다. Shutterstock Rakuten 같은 조직 Imagen 2.0 활용하여 엔터프라이즈 규모로 정확도 높은 고품질 이미지를 생성하고 있습니다

현재 프리뷰 버전으로 제공되고 있는 text-to-live image 변환 기능 사용하면 Imagen 엔터프라이즈 워크로드에서 힘을 발휘할 있습니다. 기능을 사용하면 마케팅팀과 크리에이티브팀이 텍스트 프롬프트를 통해 GIF 같은 애니메이션 이미지를 생성할 있습니다. 초기 버전에서는 4 길이의 애니메이션 이미지가 360x640픽셀 해상도에서 24FPS(초당 프레임 ) 제공되지만 앞으로 기능이 더욱 강화될 예정입니다

Imagen 엔터프라이즈에서의 사용에 중점을 두고 설계되었기 때문에, 자연, 음식 이미지, 동물 등의 테마를 다루는 데에 적합하며, 전체 시퀀스에서 일관성을 유지하면서 다양한 카메라 각도와 모션을 생성할 있습니다. 콘텐츠 제작자와 사용자 신뢰를 형성하기 위한 노력의 일환으로, 애니메이션 이미지 생성용 Imagen에는 안전 필터와 디지털 워터마크가 포함됩니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault_9iiKQLk.max-1300x1300.jpg

또한 인페인팅 아웃페인팅을 포함한 고급 사진 편집 기능을 사용할 있도록 Imagen 2.0 이미지 생성 기능을 업데이트하고 있습니다. Vertex AI Imagen 2.0에서 정식 버전으로 출시된 이러한 기능을 사용하면 이미지에서 원치 않는 요소를 제거하고, 새로운 요소를 추가하며, 시야를 넓히기 위해 이미지 경계를 확장하는 작업이 쉬워집니다. 또한 Google DeepMind SynthID 기반으로 하는 디지털 워터마킹 기능이 정식 버전으로 출시되어 고객은 보이지 않는 워터마크를 생성하고 Imagen 모델 제품군이 생성한 이미지와 애니메이션 이미지를 확인할 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-1_ijdXt9E.max-1300x1300.jpg

파운데이션 모델의 기반이 되는 Enterprise Truth

파운데이션 모델의 품질은 학습에 사용되는 데이터의 품질을 뛰어넘을 없습니다. 하지만 이러한 데이터는 조금만 시간이 지나도 구식화되며, 엔터프라이즈 사용 사례를 수행하기 위해 모델이 필요로 하는 정보를 포함하지 않을 있습니다. 오늘 Google Cloud 이제 조직이 Google 검색을 활용하여 모델을 그라운딩할 있다는 소식을 발표합니다. 이를 통해 고객은 Google에서 제공하는 여러 최신 파운데이션 모델의 이점을 활용하는 동시에 고품질의 최신 정보에 액세스할 있습니다. Google 검색을 활용한다는 것은 수십 년간 정보의 품질을 평가하고 이해하며 쌓아온 경험을 토대로 구축된 신뢰할 있는 정보 소스를 바탕으로 결과를 얻을 있다는 의미입니다.

또한 Google Cloud에서는 검색 증강 생성(RAG) 활용할 다양한 방법을 엔터프라이즈에 제공하고 있습니다. 검색 증강 생성을 활용하면 조직은 문서 데이터 스토어 검색을 위한 시맨틱 유사성과 같은 기법을 사용해 엔터프라이즈 데이터 소스로 모델 응답을 그라운딩할 있습니다.

Google Cloud에서는 이와 같은 검색 엔터프라이즈 데이터를 활용한 그라운딩이라는 개념을 'Enterprise Truth'이라고 부릅니다. 그리고 이것을 차세대 AI 에이전트, 단순히 채팅만 하는 데서 그치지 않고 사용자를 대신해 적극적으로 정보를 검색하고 작업을 완수하는 에이전트를 빌드하기 위한 토대로 인식하고 있습니다.

생성형 AI 모델에서 대규모로 최대한의 성능 끌어내기

Google Cloud 대규모 모델을 사용해 빌드할 발생하는 요구사항을 충족시키기 위해 Vertex AI MLOps 기능을 확장했습니다. 이를 활용하는 고객은 Model Registry, Feature Store, 모델 반복 배포를 관리하기 위한 파이프라인 등의 공통 기능을 사용해 모든 AI 프로젝트를 진행할 있습니다. 이러한 공통 기능을 통해 고객은 기존 MLOps 투자에서 지속적으로 이익을 얻는 동시에 생성형 AI 워크로드에서 발생하는 요구사항을 충족할 있습니다

오늘 발표된 다음 기능은 조직이 생성형 AI 모델에서 대규모로 최대한의 성능을 끌어내는 한편 실험부터 프로덕션까지 보다 빠르게 반복할 있도록 만들어 줍니다.

  • Vertex AI Prompt Management 프롬프트 실험, 프롬프트 마이그레이션, 프롬프트 파라미터 추적 고객이 겪고 있는 생성형 AI 가장 문제를 해결하는 것을 목표로 합니다. 현재 프리뷰 버전으로 출시된 Vertex AI Prompt Management 버전 관리, 오래된 프롬프트를 복원할 있는 옵션, 프롬프트 성능을 개선하기 위한 AI 생성 제안 여러 팀에서 사용할 있는 프롬프트 라이브러리를 제공합니다. 고객은 프롬프트 반복을 나란히 비교하여 작은 변화가 출력에 미치는 영향을 평가할 있습니다. 또한 서비스는 메모 태그와 같이 더욱 효과적인 협업을 위한 기능도 제공합니다

  • Vertex AI 평가 도구 고객이 특정 작업을 위한 모델을 비교하는 도움을 줍니다. 현재 사용자가 최상의 프롬프트 디자인을 반복할 모델 성능을 평가하는 도움을 주는 Rapid Evaluation 프리뷰 버전으로 제공하고 있습니다. 사용자는 다양한 차원(: 유사성, 요청 사항 준수, 유창성) 측정항목과 특정 작업(: 텍스트 생성 품질) 위한 번들에 액세스할 있습니다. 보다 효과적인 평가를 위해 AutoSxS 정식 버전으로 출시되었습니다. 기능을 사용하면 모델이 다른 모델보다 우수한 이유에 대한 설명과 사용자가 평가의 정확도를 이해하는 도움이 되는 확실성 점수 등을 통해 모델의 성능을 비교할 있습니다.

"AutoSxS 통해 생성형 AI 모델을 평가하는 Generali Italia 역량이 크게 도약했습니다. 평가 자동화는 LLM 프로덕션 단계까지 이끄는 핵심적인 성공 요인이었습니다."라고 Generali Italia 최고 기술 책임자 Stefano Frigerio는 말합니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/maxresdefault-2_qLKKN01.max-1300x1300.jpg

마지막으로, Google Cloud 오늘 데이터 상주 보장을 브라질, 스위스, 스페인, 이스라엘, 이탈리아, 인도, 오스트레일리아, 타이완, 폴란드, 핀란드, 홍콩 11 신규 국가/지역으로 확장합니다. 데이터 상주 보장은 Vertex AI Gemini, Imagen, Embeddings API 위해 저장된 데이터에 적용됩니다. 이제 고객은 Gemini 1.0 Pro Imagen 사용할 머신러닝 처리를 미국 또는 유럽 연합으로 제한할 있습니다. 작년에 발표된 10 국가/지역에 더해 11 국가/지역이 추가된 덕분에 고객은 데이터가 저장되는 위치와 액세스 방법에 대해 많은 제어권을 확보하여 세계적으로 규제 보안 요구사항을 쉽게 충족할 있습니다.

생성형 AI 여정의 다음 단계

생성형 AI 잠재력을 완전히 활용하려면 조직은 모델 인프라의 역량과 비용 사이의 균형을 유지하고, 모델이 적절한 데이터를 바탕으로 추론하도록 준비를 갖추고, 모델을 대규모로 배포, 관리, 유지하기 위해 MLOps 조정해야 합니다. 오늘 발표를 통해 Vertex AI 고객은 이러한 요구사항을 어느 때보다 빠르고 쉽게 충족할 있어 복잡한 도입 과정과 씨름할 필요 없이 AI 기반 혁신에 집중할 있습니다. Google Cloud 세계의 조직과 함께 생성형 AI 여정을 계속하기를 기대합니다. Vertex AI 대해 자세히 알아보고 무료 체험을 시작하려면 여기 클릭하세요.

게시 위치