텍스트 이미지 변환 AI

코드를 한 줄도 작성하지 않고 텍스트로 이미지 생성 및 수정

Python, Java, Go 프로그래밍 언어에서 사용 가능한 API와 함께 Gemini 3 Pro ImageImagen 이미지 생성 모델을 사용하여 텍스트 설명에서 몇 초 만에 이미지를 생성하고 수정합니다. 

신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Gemini Enterprise 에이전트 플랫폼에서 이미지를 생성하는 등의 작업을 해볼 수 있습니다.

개요

텍스트 이미지 변환 AI란 무엇인가요?

텍스트 이미지 변환 AI는 텍스트 설명에서 이미지를 생성하고 수정할 수 있는 인공지능의 한 유형입니다. 이 기술에는 상호작용하여 시각적 콘텐츠를 제작하는 방식을 혁신할 수 있는 잠재력이 있습니다. 에이전트 플랫폼에서 제공하는 Imagen, Gemini 3 Pro Image, Veo와 같은 사전 학습된 AI 모델을 비롯한 Google Cloud 텍스트 이미지 변환 AI 도구 및 리소스는 개발자가 애플리케이션에서 텍스트 이미지 변환 생성을 쉽게 구현하도록 지원하기 위해 설계되었습니다.

애플리케이션 개발에서 텍스트 이미지 변환이 어떻게 사용되나요?

텍스트 이미지 변환 AI는 애플리케이션 개발에서 목업, 프로토타입, 삽화, 테스트 데이터, 교육용 콘텐츠, 디버깅을 위한 시각화를 생성하는 데 사용할 수 있습니다. Google Cloud의 에이전트 플랫폼과 Cloud Vision API를 통해 개발자는 텍스트 감지, 객체 감지, 이미지 분류를 비롯한 일련의 이미지 처리 기능을 이용할 수 있습니다. Document AI는 스캔한 문서에서 텍스트를 추출하여 텍스트 설명 이미지를 생성하는 데 사용할 수 있습니다.

이러한 Google 모델을 사용하려면 어떻게 해야 하나요?

이러한 텍스트 이미지 변환 AI 모델은 Google Cloud 기반 에이전트 플랫폼 또는 Google AI Studio를 통해 액세스할 수 있습니다. 이 모델을 사용하려면 텍스트 프롬프트를 입력하고 매개변수를 선택한 후(일부 모델에서는 생성된 이미지의 스타일, 창의성, 정확성을 제어하는 매개변수를 선택할 수 있음) 마지막으로 이미지를 생성하기만 하면 됩니다. 

작동 방식

텍스트 이미지 변환 AI는 자연어 처리(NLP)를 사용하여 텍스트 설명을 머신이 읽을 수 있는 형식으로 변환합니다. 머신이 읽을 수 있는 형식으로 변환되면 머신러닝 모델이 텍스트와 이미지로 구성된 대규모 데이터 세트를 학습하여 패턴을 식별하는 방법과 이를 사용하여 이미지를 생성하거나 수정하는 방법을 배웁니다.

생성형 AI 제품 UI
텍스트에서 시각으로: AI 이미지 생성 소개
일반적인 용도

AI를 사용하여 이미지 생성

텍스트 프롬프트를 사용한 이미지 생성

에이전트 플랫폼 기반 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.

Imagen으로 생성한 이미지
텍스트 프롬프트를 사용한 이미지 생성

에이전트 플랫폼 기반 Imagen에서 제공하는 텍스트 기반 이미지 생성 기능을 사용하고 생성된 이미지의 업스케일링된 버전을 내보내는 방법을 알아봅니다. 이 빠른 시작에서는 Google Cloud 콘솔에서 Imagen 이미지 생성 기능을 사용하는 방법을 설명합니다.

Imagen으로 생성한 이미지

AI로 이미지 수정

멀티 이미지 퓨전 및 대화 기반 수정

Gemini를 사용하면 여러 이미지를 결합하여 하나의 매끄러운 새로운 시각적 이미지를 만들 수 있습니다. 여러 참고 이미지를 사용하여 단일 통합 이미지를 만듭니다. 간단한 자연어 명령어로 이미지를 수정할 수도 있습니다. 그룹 사진에서 사람을 삭제하거나 얼룩과 같은 작은 디테일을 수정하는 등 간단한 대화를 통해 변경할 수 있습니다.

또한 에이전트 플랫폼 기반 Imagen을 사용하면 Imagen으로 생성된 이미지나 기존 이미지를 수정할 수 있습니다. 업데이트에 대한 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수 있습니다(마스크 기반 수정).

멀티 이미지 퓨전 및 대화 기반 수정

Gemini를 사용하면 여러 이미지를 결합하여 하나의 매끄러운 새로운 시각적 이미지를 만들 수 있습니다. 여러 참고 이미지를 사용하여 단일 통합 이미지를 만듭니다. 간단한 자연어 명령어로 이미지를 수정할 수도 있습니다. 그룹 사진에서 사람을 삭제하거나 얼룩과 같은 작은 디테일을 수정하는 등 간단한 대화를 통해 변경할 수 있습니다.

또한 에이전트 플랫폼 기반 Imagen을 사용하면 Imagen으로 생성된 이미지나 기존 이미지를 수정할 수 있습니다. 업데이트에 대한 텍스트 설명 외에 수정할 이미지의 일부를 지정할 수 있습니다(마스크 기반 수정).

AI를 사용한 이미지 캡셔닝

이미지 캡셔닝을 사용하여 이미지 설명 가져오기

자세한 메타데이터, 자동 자막, 제품 및 시각적 애셋에 대한 간단한 설명 등 이미지와 관련된 설명을 생성합니다.

이미지 캡션 제품 UI
이미지 캡셔닝을 사용하여 이미지 설명 가져오기

자세한 메타데이터, 자동 자막, 제품 및 시각적 애셋에 대한 간단한 설명 등 이미지와 관련된 설명을 생성합니다.

이미지 캡션 제품 UI

개념 증명 시작

신규 고객에게는 에이전트 플랫폼에서 이미지를 생성하는 등의 작업에 사용할 수 있는 최대 $300의 무료 크레딧이 제공됩니다.

대규모 프로젝트가 있나요?

만들 수 있는 이미지 유형 알아보기

텍스트 프롬프트를 사용해 이미지를 생성하는 방법 알아보기

Colab에서 Imagen 사용해 보기

Google Cloud