Python, Java, Go 프로그래밍 언어에서 사용 가능한 API와 함께 Google Cloud AI 기반 이미지 생성을 사용하여 텍스트 설명에서 몇 초 만에 이미지를 생성합니다.
Vertex AI에서 Imagen을 사용해 이미지 등을 생성할 수 있는 신규 고객에게는 최대 $300의 무료 크레딧이 제공됩니다.
개요
텍스트 이미지 변환 AI는 텍스트 설명에서 이미지를 생성할 수 있는 인공지능의 한 유형입니다. 이 기술에는 상호작용하여 시각적 콘텐츠를 제작하는 방식을 혁신할 수 있는 잠재력이 있습니다. Vertex AI에서 제공하는 Imagen, Parti, Muse와 같은 선행 학습된 AI 모델을 비롯한 Google Cloud의 텍스트 이미지 변환 AI 도구 및 리소스는 개발자가 애플리케이션에서 텍스트 기반 이미지 생성을 쉽게 구현하도록 지원하기 위해 설계되었습니다. 또한 AutoML을 사용하면 영역별 애플리케이션에 맞게 AI 모델을 맞춤설정할 수 있습니다.
텍스트 이미지 변환 AI는 애플리케이션 개발에서 목업, 프로토타입, 삽화, 테스트 데이터, 교육용 콘텐츠, 디버깅을 위한 시각화를 생성하는 데 사용할 수 있습니다. Google Cloud의 Vertex AI와 Cloud Vision API를 통해 개발자는 텍스트 감지, 객체 감지, 이미지 분류를 비롯한 일련의 이미지 처리 기능을 이용할 수 있습니다. Document AI는 스캔한 문서에서 텍스트를 추출하여 텍스트 설명 이미지를 생성하는 데 사용할 수 있습니다.
Imagen, Parti, Muse가 주요 텍스트 이미지 변환 모델입니다. Imagen은 고도의 포토리얼리즘을 제공하는 확산 모델입니다. Pathways Autoregressive 텍스트 이미지 변환 모델(Parti)은 복잡한 구성과 실질적인 지식을 포함하는 리치 콘텐츠 합성을 지원합니다. Muse는 강력한 이미지 생성 성능을 제공하는 Transformer 모델입니다. 또한 Gemini는 거의 모든 입력을 이해하고 텍스트, 이미지, 오디오, 동영상, 코드를 비롯한 거의 모든 출력을 생성할 수 있는 모델을 통해 실현할 수 있는 가능성을 확장합니다.
확산 모델인 Imagen은 언어 이해 수준이 높은 포토리얼리즘에 적합합니다. 자동 회귀 모델인 Parti는 일관된 스타일과 테마의 이미지와 특정 스타일의 이미지를 생성하는 데 적합합니다. Transformer 모델인 Muse는 여러 객체와 복잡한 구성의 이미지를 생성할 수 있습니다. 모델마다 고유한 강점이 있습니다. Imagen은 포토리얼리즘에 탁월하고, Parti는 리치 콘텐츠, Muse는 속도와 수정 도구에서 진가를 발휘합니다. 모두 사용하기 쉽고 프로그래밍 지식이 필요하지 않습니다.
Imagen 3은 Google의 최신 이미지 생성 모델입니다. 신속한 프로토타입 제작 및 반복을 위한 40% 이상의 빠른 생성 속도, 프롬프트 이해 및 안내 준수성 개선, 사진처럼 사실적인 생성(여러 명으로 구성된 그룹 포함), 이미지 내 텍스트 렌더링에 대한 세부적인 제어를 포함하여 Imagen 2에 비해 여러 개선 사항이 적용된 탁월한 이미지 품질을 제공합니다.
Vertex AI 고객을 대상으로 사전 체험판을 제공하는 미리보기 버전으로 출시된 Imagen 3에는 다국어 지원, Google DeepMind의 SynthID 디지털 워터마크와 같은 기본 제공 안전 기능, 여러 가로세로 비율 지원이 포함되어 있습니다.
이러한 텍스트 이미지 변환 AI 모델은 Google Cloud의 Vertex AI 또는 타사 API 제공업체를 통해 액세스할 수 있습니다. 이 모델을 사용하려면 텍스트 프롬프트를 입력하고 매개변수를 선택한 후(일부 모델에서는 생성된 이미지의 스타일, 창의성, 정확성을 제어하는 매개변수를 선택할 수 있음) 마지막으로 이미지를 생성하기만 하면 됩니다.
작동 방식
텍스트 이미지 변환 AI는 자연어 처리(NLP)를 사용하여 텍스트 설명을 머신이 읽을 수 있는 형식으로 변환합니다. 머신이 읽을 수 있는 형식으로 변환되면 머신러닝 모델이 텍스트와 이미지로 구성된 대규모 데이터 세트를 학습하여 패턴을 식별하는 방법과 이를 사용하여 새로운 이미지를 생성하는 방법을 배웁니다. Google Cloud의 텍스트 이미지 변환 AI는 텍스트 설명에서 실사형 이미지를 생성할 수 있는 최신 모델인 Imagen이라는 딥 러닝 모델을 사용합니다.
일반적인 용도
Vertex AI의 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.
Vertex AI의 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.
생성된 이미지 또는 기존 이미지를 수정하려면 Imagen을 사용하세요. 텍스트 프롬프트를 사용하여 전체 이미지를 업데이트할 수도 있고(마스크 없는 수정) 업데이트의 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수도 있습니다(마스크 기반 수정).
생성된 이미지 또는 기존 이미지를 수정하려면 Imagen을 사용하세요. 텍스트 프롬프트를 사용하여 전체 이미지를 업데이트할 수도 있고(마스크 없는 수정) 업데이트의 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수도 있습니다(마스크 기반 수정).