콘텐츠로 이동하기
AI 및 머신러닝

Vertex AI의 Imagen 2 정식 버전 출시

2024년 1월 2일
https://storage.googleapis.com/gweb-cloudblog-publish/images/Imagen_2_on_Vertex_AI_v2.max-2500x2500.png
Vishy Tirumalashetty

Head of Product, Generative Media, Cloud AI

Gemini 1.5 모델 사용해 보기

Google Vertex AI의 가장 진보한 멀티모달 모델

사용해 보기

*본 아티클은 2023년 12월 14일 Google Cloud 블로그(영문)에 게재되었습니다.

오늘은 Google Cloud의 가장 진보된 텍스트 이미지 변환 기술인 Imagen 2에 중요한 업데이트가 있음을 알려 드립니다. 이제 Imagen 2가 액세스가 승인된 Vertex AI 고객을 대상으로 정식 출시됩니다.

고객은 Vertex AI의 Imagen 2를 사용하여 직관적인 도구, 완전 관리형 인프라, 기본 제공되는 개인 정보 보호 및 안전 기능을 통해 Imagen 2를 맞춤설정하고 배포할 수 있습니다. Google DeepMind 기술을 사용하여 개발된 Imagen 2는 크게 향상된 이미지 품질은 물론 개발자가 특정 사용 사례에 맞게 이미지를 만들 수 있도록 다음과 같은 다양한 기능을 제공합니다.

  • 고품질 이미지 생성: 자연어 프롬프트로 고해상도의 미적 감각이 뛰어난 실사형 이미지를 생성합니다.
  • 다국어 텍스트 렌더링: 정확한 텍스트 오버레이가 포함된 이미지를 생성합니다.
  • 로고 생성: 회사 또는 제품 로고를 생성하고 이미지에 오버레이할 수 있습니다.
  • 시각적 질의 응답: 이미지에서 캡션을 생성하고 이미지 세부정보 관련 질문에 유익한 텍스트 답변을 얻을 수 있습니다.

무엇보다도 이제 Vertex AI의 고객 면책 약정이 Vertex AI의 Imagen에도 적용됩니다. 여기에는 Imagen 2와 이 서비스의 바탕이 되는 모델의 향후 정식 업그레이드 버전이 포함됩니다. Google Cloud는 업계 최초로 두 갈래의 저작권 면책 접근 방식을 채택하여 고객이 생성형 AI 제품을 안심하고 사용할 수 있도록 지원합니다.

엔터프라이즈급 텍스트 이미지 변환 기능

Vertex AI의 Imagen 2는 고객에게 익숙한 Imagen의 엔터프라이즈급 안정성과 거버넌스를 동일하게 유지하여 조직에서 특정 브랜드의 요건에 맞는 이미지를 생성하는 데 도움이 되는 다양한 이미지 생성 기능을 제공합니다.

이제 Imagen 2에서 사용할 수 있는 새로운 기능은 다음과 같습니다.

고품질 이미지 생성: Imagen 2는 향상된 이미지 및 텍스트 이해와 다양하고 새로운 학습 및 모델링 기법을 통해 고품질의 정확한 실사형 이미지를 출력할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Imagen-BlogTout-1_zKElMC5.max-1400x1400.png

텍스트 렌더링 지원: 텍스트 이미지 변환 기술은 종종 텍스트를 올바르게 렌더링하는 데 어려움이 있습니다. 예를 들어 모델에 특정 단어나 문구가 포함된 객체의 이미지를 생성하라는 프롬프트를 입력했을 때 출력 이미지에 올바른 문구가 포함되도록 하는 것이 어려울 수 있습니다. Imagen 2는 이러한 문제를 해결할 수 있으므로 조직에서 브랜딩 및 메시지를 보다 심층적으로 제어할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Imagen-BlogTout-2.max-2000x2000.png

로고 생성: Imagen 2는 비즈니스, 브랜드, 제품에 대해 엠블럼, 레터마크, 추상적인 로고를 포함하여 창의적이고 사실적인 로고를 다양하게 생성할 수 있습니다. 또한 이러한 로고를 제품, 의류, 명함, 기타 표면에 오버레이할 수 있는 기능도 제공됩니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/Imagen-BlogTout-3_qfLl0oQ.max-2000x2000.png

캡션 질의 응답: Imagen 2의 향상된 이미지 이해 기능을 통해 고객은 길고 서술적인 형식의 캡션을 만들고 이미지 내 요소 관련 질문에 대해 자세한 답변을 확인할 수 있습니다.

다국어 프롬프트: Imagen 2는 프리뷰 버전에서 영어 외에도 6개의 언어(한국어, 스페인어, 일본어, 중국어, 포르투갈어, 힌디어)를 추가로 지원하며, 2024년 초에는 더 많은 언어로 출시될 예정입니다. 다국어 프롬프트 기능에는 프롬프트와 출력 간의 번역 기능이 포함됩니다. 예를 들어 프롬프트는 스페인어이지만 출력은 포르투갈어로 하도록 지정할 수 있습니다.

안전성: Imagen 2에는 생성된 이미지가 Google의 책임감 있는 AI 원칙에 부합하도록 하는 데 도움이 되는 안전 예방 기능이 내장되어 있습니다. 예를 들어 Imagen 2는 Google DeepMind의 SynthID를 바탕으로 한 실험용 디지털 워터마킹 서비스와 통합되어 있으므로, 허용 목록에 있는 고객은 보이지 않는 워터마크를 생성하고 Imagen에서 생성된 이미지를 검증할 수 있습니다. 또한 Imagen 2에는 잠재적으로 유해한 콘텐츠의 생성을 방지하는 데 도움이 되는 포괄적인 안전 필터도 포함되어 있습니다.

고객의 Imagen API 사용 사례를 살펴보고 시작하는 방법 확인하기

Google Cloud는 조직이 이와 같은 새로운 기능을 사용하여 기존에 Imagen으로 달성한 결과를 한층 발전시킬 수 있기를 기대합니다.

Snap은 Imagen을 사용하여 Snapchat+ 구독자가 내면의 창의성을 표현할 수 있도록 지원하고 있습니다. 새로운 AI 카메라 모드를 사용하는 구독자는 버튼을 탭하고, 프롬프트를 입력하거나 미리 선별된 프롬프트를 고르고, 장면을 생성하여 가족 및 친구와 공유하거나 스토리에 게시할 수 있습니다.

"Imagen은 우리가 필요로 하는 안전성과 이미지 품질을 갖춘 가장 확장성이 뛰어난 텍스트 이미지 변환 모델입니다."라고 Snap 제품 부문 수석 이사인 조쉬 시겔은 말합니다. "Snap에서 Imagen을 사용하면서 경험한 주요 이점 중 하나는 우리가 가장 잘 하는 일, 즉 제품 디자인과 표현 방식, 느낌을 전달하는 데 집중할 수 있다는 것입니다. AI 카메라 모드와 같은 신제품을 개발할 때 우리는 Google Cloud에서 제공하는 브랜드 안전성, 확장성, 안정성을 믿고 일을 진행할 수 있습니다."

또한 Shutterstock은 윤리적으로 소싱된 AI 이미지 생성기를 최초로 출시하고 현재는 Vertex AI의 Imagen으로 보강하는 등 AI를 창의적인 콘텐츠 제작에 도입하는 선도적인 혁신 기업으로 부상했습니다. Shutterstock AI 이미지 생성기를 사용하면 간단한 텍스트 프롬프트를 사용자가 상상하는 속도만큼 빠르게 독특하고 눈에 띄는 시각적 요소로 변환할 수 있습니다. Shutterstock 웹사이트에는 16,000개가 넘는 Imagen 사진으로 구성된 검색 가능한 컬렉션이 있으며, 이 모두는 라이선스 취득이 가능합니다.

"우리는 구상과 실현 사이의 격차를 해소하여 세상에 나만의 이야기를 전달할 수 있는 힘을 실어주고자 합니다. 창작 과정에서는 다양성이 매우 중요합니다. 따라서 우리는 이미지 생성기와 편집 기능에 책임감 있게 소싱된 데이터를 기반으로 구축된 탁월한 최신 기술을 계속해서 통합하고 있습니다."라고 Shutterstock AI 서비스 부문 이사인 크리스 로이는 말합니다. "Vertex AI의 Imagen 모델은 Shutterstock의 AI 이미지 생성기에 추가된 중요한 기능입니다. 모델이 계속 발전함에 따라 사용자에게 얼마나 더 우수한 창의적 기능을 제공할 수 있을지 기대가 됩니다."

Canva 역시 Vertex AI의 Imagen을 사용하여 아이디어에 생기를 불어넣고 있으며, 지금까지 이 모델을 통해 생성된 이미지가 수백만 개에 달합니다. 사용자는 Canva 내에서 앱으로 제공되는 Imagen을 곧바로 사용할 수 있으며 간단한 텍스트 프롬프트를 통해 디자인 니즈에 맞는 매력적인 이미지를 생성할 수 있습니다.

Canva의 AI 부문 책임자인 대니 우는 "우리는 Google Cloud와 협력하여 계속해서 생성형 AI를 사용하며 디자인 프로세스를 혁신하고 상상력을 강화하고 있습니다."라고 말합니다. "Imagen을 사용하면 월간 1억 7천만 명 이상의 사용자가 이미지 품질 개선을 통해 한층 향상된 품질의 콘텐츠를 제작할 수 있습니다. 새 모델과 기능으로 불편함은 최소화하면서 아이디어를 실제 이미지로 전환하는 커뮤니티 역량이 강화될 것으로 기대합니다."

Vertex AI의 Imagen 2를 시작하려면 문서를 살펴보거나 Google Cloud 계정 담당자에게 문의하여 신뢰할 수 있는 테스터 프로그램에 참여하세요

게시 위치