Python, Java, Go 프로그래밍 언어에서 사용 가능한 API와 함께 Gemini 3 Pro Image 및 Imagen 이미지 생성 모델을 사용하여 텍스트 설명에서 몇 초 만에 이미지를 생성하고 수정합니다.
신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Gemini Enterprise 에이전트 플랫폼에서 이미지를 생성하는 등의 작업을 해볼 수 있습니다.
개요
텍스트 이미지 변환 AI는 텍스트 설명에서 이미지를 생성하고 수정할 수 있는 인공지능의 한 유형입니다. 이 기술에는 상호작용하여 시각적 콘텐츠를 제작하는 방식을 혁신할 수 있는 잠재력이 있습니다. 에이전트 플랫폼에서 제공하는 Imagen, Gemini 3 Pro Image, Veo와 같은 사전 학습된 AI 모델을 비롯한 Google Cloud 텍스트 이미지 변환 AI 도구 및 리소스는 개발자가 애플리케이션에서 텍스트 이미지 변환 생성을 쉽게 구현하도록 지원하기 위해 설계되었습니다.
텍스트 이미지 변환 AI는 애플리케이션 개발에서 목업, 프로토타입, 삽화, 테스트 데이터, 교육용 콘텐츠, 디버깅을 위한 시각화를 생성하는 데 사용할 수 있습니다. Google Cloud의 에이전트 플랫폼과 Cloud Vision API를 통해 개발자는 텍스트 감지, 객체 감지, 이미지 분류를 비롯한 일련의 이미지 처리 기능을 이용할 수 있습니다. Document AI는 스캔한 문서에서 텍스트를 추출하여 텍스트 설명 이미지를 생성하는 데 사용할 수 있습니다.
이러한 텍스트 이미지 변환 AI 모델은 Google Cloud 기반 에이전트 플랫폼 또는 Google AI Studio를 통해 액세스할 수 있습니다. 이 모델을 사용하려면 텍스트 프롬프트를 입력하고 매개변수를 선택한 후(일부 모델에서는 생성된 이미지의 스타일, 창의성, 정확성을 제어하는 매개변수를 선택할 수 있음) 마지막으로 이미지를 생성하기만 하면 됩니다.
에이전트 플랫폼 기반 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.
에이전트 플랫폼 기반 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.
Gemini를 사용하면 여러 이미지를 결합하여 하나의 매끄러운 새로운 시각적 이미지를 만들 수 있습니다. 여러 참고 이미지를 사용하여 단일 통합 이미지를 만듭니다. 간단한 자연어 명령어로 이미지를 수정할 수도 있습니다. 그룹 사진에서 사람을 삭제하거나 얼룩과 같은 작은 디테일을 수정하는 등 간단한 대화를 통해 변경할 수 있습니다.
또한 에이전트 플랫폼 기반 Imagen을 사용하면 Imagen으로 생성된 이미지나 기존 이미지를 수정할 수 있습니다. 업데이트에 대한 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수 있습니다(마스크 기반 수정).
Gemini를 사용하면 여러 이미지를 결합하여 하나의 매끄러운 새로운 시각적 이미지를 만들 수 있습니다. 여러 참고 이미지를 사용하여 단일 통합 이미지를 만듭니다. 간단한 자연어 명령어로 이미지를 수정할 수도 있습니다. 그룹 사진에서 사람을 삭제하거나 얼룩과 같은 작은 디테일을 수정하는 등 간단한 대화를 통해 변경할 수 있습니다.
또한 에이전트 플랫폼 기반 Imagen을 사용하면 Imagen으로 생성된 이미지나 기존 이미지를 수정할 수 있습니다. 업데이트에 대한 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수 있습니다(마스크 기반 수정).