프롬프트 및 이미지 속성 가이드

Vertex AI 기반 Imagen을 사용하려면 생성 또는 수정하려는 항목에 대한 텍스트 설명을 제공해야 합니다. 이러한 설명을 프롬프트라고 하며, 이러한 프롬프트는 Vertex AI에서 생성형 AI와 통신하는 기본적인 방법입니다.

이 가이드에서는 텍스트 이미지 변환 프롬프트의 일부를 수정하면 다른 결과를 얻을 수 있는 방법을 설명하고 만들 수 있는 이미지의 예를 제공합니다. 이 가이드에서는 텍스트 프롬프트와 반복을 사용하여 이미지를 수정하는 방법도 안내합니다.

Vertex AI 기반 Imagen과 관련된 사용량 표준과 콘텐츠 제한을 보려면 사용 가이드라인을 참조하세요.

콘텐츠 필터링 - 입력 텍스트, 업로드된 이미지, 생성된 이미지

생성된 이미지는 바람직하지 않거나 유해한 콘텐츠를 제외하도록 필터링됩니다. 마찬가지로 Vertex AI의 Imagen이 수신하는 모든 입력은 불쾌감을 주는 콘텐츠가 있는지 확인됩니다. 여기에는 이미지 수정 시 입력 텍스트 프롬프트와 업로드된 사진이 포함됩니다. 자세한 내용은 Imagen의 책임감 있는 AI 및 사용 가이드라인을 참고하세요.

Google Cloud에서 의심되는 악용사례 신고 양식을 사용하여 Vertex AI에서 의심되는 Imagen의 악용사례 또는 부적절한 자료나 부정확한 정보가 포함된 생성된 출력을 신고할 수도 있습니다.

프롬프트 작성 기본사항(주제, 컨텍스트, 스타일)

효과적인 프롬프트를 작성하는 데 정해진 방법은 없지만 몇 가지 키워드와 수정자를 추가하면 최종 목표에 한 걸음 더 다가갈 수 있습니다. 프롬프트가 길거나 복잡할 필요는 없지만 가장 적합한 프롬프트는 설명적이고 명확합니다.

좋은 출발점은 주제, 컨텍스트, 스타일을 생각하는 것일 수 있습니다.

주제, 컨텍스트, 스타일이 강조되는 프롬프트
이미지 텍스트: 초고층 빌딩(컨텍스트 및 배경)으로 둘러싸인 현대식 아파트 건물(주제)의 스케치(스타일)입니다.
  1. 주제: 프롬프트에서 가장 먼저 고려해야 할 사항은 주제 즉 이미지가 필요한 사물, 사람, 동물 또는 풍경입니다.

  2. 컨텍스트 및 배경: 마찬가지로 주제가 배치될 배경 또는 컨텍스트도 중요합니다. 다양한 배경에 주제를 배치해 보세요. 예를 들어 흰색 배경, 실외 또는 실내 환경의 스튜디오가 있습니다.

  3. 스타일: 마지막으로 원하는 이미지의 스타일을 추가합니다. 스타일은 일반적(회화, 사진, 스케치)이거나 매우 구체적(파스텔 회화, 목탄 드로잉, 아이소메트릭 3D)일 수 있습니다.

프롬프트의 첫 번째 버전을 작성한 후 원하는 이미지가 나올 때까지 세부정보를 추가하여 프롬프트를 수정합니다. 반복이 중요합니다. 먼저 핵심 아이디어를 설정하고 생성된 이미지가 비전에 가까워질 때까지 핵심 아이디어를 수정하고 확장합니다.

실사 샘플 이미지 1
프롬프트: 봄에 호수 옆에 있는 공원
실사 샘플 이미지 2
프롬프트: 호수 옆에 있는 봄의 공원, 호수 건너 일몰, 황금 시간
실사 샘플 이미지 3
프롬프트: 봄에 호수 옆에 있는 공원, 호수 건너편에 지는 태양, 황금 시간, 붉은 야생화

Imagen 3 프롬프트 작성

생성용 Imagen 모델 카드 보기

Imagen 3은 프롬프트가 짧든 길든 상관없이 아이디어를 세부적인 이미지로 변환할 수 있습니다. 반복적인 프롬프트를 통해 비전을 수정하고 완벽한 결과를 얻을 때까지 세부정보를 추가합니다.

짧은 프롬프트를 사용하면 이미지를 빠르게 생성할 수 있습니다.

Imagen 3 짧은 프롬프트 예시
프롬프트: 20대 여성의 클로즈업 사진, 거리 사진, 영화 스틸 컷, 차분한 주황색, 따뜻한 색

프롬프트를 길게 입력하면 구체적인 세부정보를 추가하고 이미지를 만들 수 있습니다.

Imagen 3 긴 프롬프트 예시
프롬프트: 거리 사진 스타일을 활용하여 20대 여성의 시선을 사로잡는 사진. 이미지는 차분한 주황색, 따뜻한 톤의 영화 스틸 컷처럼 보일 것입니다.

Imagen 3 프롬프트 작성을 위한 추가 도움말:

  • 설명적인 표현 사용: 세부적인 형용사와 부사를 사용하여 Imagen 3에 대해 명확한 그림을 그립니다.
  • 맥락 제공: 필요한 경우 AI의 이해를 돕기 위한 배경 정보를 포함합니다.
  • 특정 아티스트 또는 스타일 참고: 특정 미학을 염두에 두고 있다면 특정 아티스트나 예술 운동을 참고하는 것이 도움이 될 수 있습니다.
  • 프롬프트 엔지니어링 도구 사용: 프롬프트를 수정하고 최적의 결과를 얻는 데 도움이 되는 프롬프트 엔지니어링 도구 또는 리소스를 살펴보세요.
  • 개인 및 그룹 이미지의 얼굴 세부정보 개선하기:
    • 얼굴 세부정보를 사진의 초점으로 지정합니다 (예: 프롬프트에서 '인물 사진'이라는 단어 사용).
    • 세부사항을 개선하려면 Imagen 3 Fast 대신 Imagen 3과 같은 더 큰 모델을 사용하는 것이 좋습니다.

이미지에 텍스트 생성

Imagen 3의 이미지에 텍스트를 추가하는 기능을 사용하면 창의적인 이미지를 생성할 수 있습니다. 다음 안내에 따라 이 기능을 최대한 활용하세요.

  • 신뢰를 가지고 반복: 원하는 모양이 나올 때까지 이미지를 다시 생성해야 할 수 있습니다. Imagen의 텍스트 통합은 아직 발전 중이며, 여러 번 시도해 보면 최상의 결과를 얻을 수 있습니다.
  • 간단하게 유지: 최적의 생성을 위해 텍스트를 25자(영문 기준) 이하로 제한합니다.
  • 여러 문구: 두 개 또는 세 개의 고유한 문구를 실험하여 추가 정보를 제공합니다. 더 깔끔한 구성을 위해 구문 수를 3개 이하로 유지하세요.

    Imagen 3 텍스트 생성 예시
    프롬프트: 'Summerland'라는 텍스트가 굵은 서체로 제목으로 표시된 포스터이며 이 텍스트 아래에 'Summer never felt so good'이라는 슬로건이 있습니다.
  • 안내 게재위치: Imagen이 지시에 따라 텍스트를 배치하려고 시도할 수 있지만 가끔씩 텍스트가 다르게 배치될 수 있습니다. 이 기능은 지속적으로 개선되고 있습니다.

  • 글꼴 스타일에 영감 불어넣기: 일반적인 글꼴 스타일을 지정하여 Imagen의 선택에 미묘하게 영향을 미칩니다. 정확한 글꼴 복제를 기대하지 말고 창의적인 해석을 기대하세요.

  • 글꼴 크기: 글꼴 크기 또는 크기의 일반적인 표시 (예: 작음, 중간, 크음)를 지정하여 글꼴 크기 생성에 영향을 미칩니다.

프롬프트 매개변수화

출력 결과를 더 효과적으로 제어하려면 Imagen API 또는 Python용 Vertex AI SDK를 사용할 때 입력을 Imagen에 매개변수화하는 것이 좋습니다. 예를 들어 고객이 비즈니스용 로고를 생성할 수 있도록 하려는 경우 로고가 항상 단색 배경에서 생성되도록 하려면 어떻게 해야 하나요? 또한 클라이언트가 메뉴에서 선택할 수 있는 옵션을 제한하려고 합니다.

이 예에서는 다음과 유사한 매개변수가 있는 프롬프트를 만들 수 있습니다.

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

맞춤 사용자 인터페이스에서 고객은 메뉴를 사용하여 매개변수를 입력할 수 있으며, 선택한 값이 Imagen이 수신하는 프롬프트에 채워집니다.

예를 들면 다음과 같습니다.

  1. 프롬프트: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Imagen 3 프롬프트 매개변수화 예시 1

  2. 프롬프트: A modern logo for a software company on a solid color background. Include the text Silo.

    Imagen 3 프롬프트 매개변수 지정 예시 2

  3. 프롬프트: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Imagen 3 프롬프트 매개변수화 예시 3

스타일: 사진

  • 프롬프트에 포함: '...의 사진'

이 스타일을 사용하려면 먼저 Vertex AI의 Imaged에 사진을 찾고 있음을 명확하게 알리는 키워드를 사용하여 시작합니다. 다음과 같이 프롬프트에 명기합니다. '. . .의 사진'. 예를 들면 다음과 같습니다.

실사 샘플 이미지 1
프롬프트: 주방의 목재 표면 위에 있는 커피 원두 사진
실사 샘플 이미지 2
프롬프트: 주방 카운터에 있는 초콜릿 바 사진
실사 샘플 이미지 3
프롬프트: 물을 배경으로 한 현대적인 건물 사진

이미지 소스: 각 이미지는 Imagen 3 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

스타일: 삽화 및 아트

  • 프롬프트에 포함: '..의 painting', 또는 '...의 sketch'

아트 스타일은 연필 스케치와 같은 흑백 스타일부터 초현실적인 디지털 아트까지 다양합니다. 예를 들어 다음 이미지는 다양한 스타일에서 동일한 프롬프트를 사용합니다.

"고층 빌딩 배경의 각진 스포티 전기 세단의 [art style or creation technique]"

아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...기술적 연필 드로잉
아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...목탄 드로잉
아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...색연필 드로잉
아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...파스텔 회화
아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...디지털 아트
아트 샘플 이미지
프롬프트: 고층 빌딩 배경의...아르데코 (포스터)

이미지 소스: 각 이미지는 Imagen 2 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

고급 프롬프트 작성 기법

다음 예시를 사용하여 사진 설명자, 모양 및 재료, 역사적 예술 움직임 및 이미지 품질 수정자와 같은 속성에 따라 보다 구체적인 프롬프트를 만듭니다.

사진 수정자

다음 예에서는 여러 사진 관련 수정자와 매개변수를 볼 수 있습니다.

  1. 카메라 근접성 - 클로즈업, 멀리서 촬영

    카메라 샘플 클로즈업 이미지
    프롬프트: 커피 원두의 클로즈업 사진
    카메라 샘플 축소 이미지
    프롬프트: 어지러운 주방에 있는 작은 커피 원두 봉지의 축소된 사진

  2. 카메라 위치 - 공중, 아래에서

    항공사진 샘플 이미지
    프롬프트: 고층 빌딩이 있는 도시의 항공사진
    아래에서 본 샘플 이미지
    프롬프트: 아래에서부터
    파란색 하늘이 보이는 숲 캐노피 사진
  3. 조명 - 자연스럽고, 극적이며, 따뜻하고, 차가운

    자연광 샘플 이미지
    프롬프트: 자연광
    에서 현대적인 안락의자의 스튜디오 사진
    극적인 조명 샘플 이미지
    프롬프트: 극적인 조명에서 현대적인 안락의자의 스튜디오 사진
  4. 카메라 설정 - 모션 블러, 소프트 포커스, 보케, 인물 사진

    모션 블러 샘플 이미지
    프롬프트: 모션 블러 설정으로 차량 내부에서 찍은 초고층 빌딩이 있는 도시의 사진
    소프트 포커스 샘플 이미지
    프롬프트: 소프트 포커스 설정으로 찍은 야간 도시의 다리 사진
  5. 렌즈 유형 - 35mm, 50mm, 어안, 광각, 매크로

    매크로 렌즈 샘플 이미지
    프롬프트: 매크로 렌즈
    로 찍은 나뭇잎 사진
    어안 렌즈 샘플 이미지
    프롬프트: 어안 렌즈로 찍은 뉴욕 거리 사진
  6. 필름 유형 - 흑백, 폴라로이드

    폴라로이드 사진 샘플 이미지
    프롬프트: 선글라스를 쓴 강아지의 폴라로이드 사진
    흑백 사진 샘플 이미지
    프롬프트: 선글라스를 쓴 강아지의 흑백 사진

이미지 소스: 각 이미지는 Imagen 3 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

모양 및 재료

  • 프롬프트에는 '...만든...', '...의 형태로...'가 포함됩니다.

이 기술의 강점 중 하나는 다른 작업이 어렵거나 불가능한 이미지를 만들 수 있다는 것입니다. 예를 들어 회사 로고를 다양한 재료와 질감으로 다시 제작할 수 있습니다.

모양 및 재료 예시 이미지 1
프롬프트: 치즈로 만든 더플 백
모양 및 재료 예시 이미지 2
프롬프트: 새 모양의 네온 튜브
모양 및 재료 예시 이미지 3
프롬프트: 종이로 만든 안락의자, 스튜디오 사진, 종이접기 스타일

이미지 소스: 각 이미지는 Imagen 3 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

역사적 아트 참조

  • 프롬프트에는 '...스타일로..'가 포함됩니다.

특정 스타일은 수년에 걸쳐 상징으로 자리잡았습니다. 다음은 시도해 볼 수 있는 역사적인 페인팅 또는 아트 스타일에 대한 아이디어입니다.

'[art period or movement] 스타일의 이미지 생성: 풍력 발전소'

인상주의 예시 이미지
프롬프트: 인상주의 회화 스타일
의 풍력 발전소 이미지 생성
르네상스 예시 이미지
프롬프트: 르네상스 회화 스타일
의 풍력 발전소 이미지 생성
팝아트 예시 이미지
프롬프트: 팝아트 스타일
의 풍력 발전소 이미지 생성

이미지 소스: 각 이미지는 Imagen 3 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

이미지 품질 수정자

특정 키워드를 사용하면 모델에서 고품질 애셋을 찾고 있다는 것을 알 수 있습니다. 품질 수정자의 예시는 다음과 같습니다.

  • 일반 수정자 - 고품질, 아름다움, 스타일
  • 사진 - 4K, HDR, 스튜디오 사진
  • 아트, 삽화 - 전문가, 상세

다음은 품질 수정자가 없는 프롬프트와 품질 수정자가 포함된 동일한 프롬프트의 몇 가지 예시입니다.

수정자가 없는 옥수수 예시 이미지
프롬프트 (품질 수정자 없음): 옥수수 줄기 사진
수정자가 있는 옥수수 예시 이미지
프롬프트 (품질 수정자 포함): 4k HDR 아름다운
옥수수 줄기의 사진 전문 사진작가가 촬영한

이미지 소스: 각 이미지는 Imagen 3 모델과 함께 해당 텍스트 프롬프트를 사용하여 생성되었습니다.

가로세로 비율

Imagen 3 이미지 생성을 사용하면 고유한 이미지 가로세로 비율 5개를 설정할 수 있습니다.

  1. 정사각형(1:1, 기본값) - 표준 정사각형 사진입니다. 이 가로세로 비율의 일반적인 용도는 소셜 미디어 게시물입니다.
  2. 전체 화면(4:3) - 이 가로세로 비율은 미디어나 영화에서 일반적으로 사용됩니다. 또한 대부분의 구형(와이드스크린) TV와 중형 카메라의 크기입니다. 1:1에 비해 더 많은 장면을 수평으로 캡처하므로 사진에 선호되는 가로세로 비율이 가능합니다.

    가로세로 비율 예시
    프롬프트: 피아노를 연주하는 뮤지션의 손가락 클로즈업, 흑백 영화, 빈티지(4:3 가로세로 비율)
    가로세로 비율 예시
    프롬프트: 고급 레스토랑 감자 튀김의 전문 스튜디오 사진, 음식 잡지 스타일(가로세로 비율 4:3)
  3. 세로 전체 화면(3:4) - 90도 회전된 전체 화면 가로세로 비율입니다. 이 비율에서는 1:1 가로세로 비율과 비교할 때 세로로 더 많은 장면을 캡처할 수 있습니다.

    가로세로 비율 예시
    프롬프트: 등산 중인 여성, 가까운 물웅덩이에 부츠가 반사됨, 배경에 큰 산, 광고 스타일, 드라마틱 앵글(가로세로 비율 3:4)
    가로세로 비율 예시
    프롬프트: 신비한 계곡으로 흐르는 강의 항공 사진(가로세로 비율 3:4)
  4. 와이드스크린(16:9) - 이 비율은 4:3을 대체하며, 현재 TV, 모니터, 휴대전화 화면(가로 모드)에서 가장 일반적으로 사용되는 가로세로 비율입니다. 배경 사진을 더 많이 캡처하려면 이 가로세로 비율을 사용합니다(예: 풍경 사진).

    가로세로 비율 예시
    프롬프트: 해변에 앉아 있는 순백색 옷을 입은 남성, 클로즈업, 황금 시간 조명(16:9 가로세로 비율)
  5. 세로 모드(9:16) - 이 비율은 회전된 와이드스크린입니다. 이 가로세로 비율은 짧은 형식 동영상 앱(예: YouTube Shorts)에서 인기가 있는 비교적 새로운 가로세로 비율입니다. 건물, 나무, 폭포 또는 기타 유사한 객체와 같이 수직 방향이 강한 긴 객체에 사용합니다.

    가로세로 비율 예시
    프롬프트: 거대한 초고층 빌딩의 디지털 렌더링, 현대적, 아름답고 웅장한 일몰 배경(9:16 가로세로 비율)

부정적인 프롬프트

이전 예시에서는 Imagen이 만들 항목에 대한 프롬프트 작성에 중점을 두지만 제품이 이미지를 생성하거나 수정하는 데 도움이 되도록 원본 프롬프트와 함께 부정적인 프롬프트를 제공할 수도 있습니다. 이러한 부정적인 프롬프트는 이미지에서 생략할 요소를 지정하는 데 도움이 되는 강력한 도구가 될 수 있습니다. 원하지 않는 사항을 간단히 설명하세요.

권장: 보고 싶지 않은 사항을 명확하게 설명하세요. 예시: '벽, 프레임'

권장하지 않음: '아니요' 또는 '하지 마세요'와 같이 지시적인 언어나 단어의 사용을 피합니다. 예를 들어 '없음' 또는 ' 표시 안함'과 같은 문구를 사용하지 않습니다.

부정적인 프롬프트가 없는 그림 예시 이미지
프롬프트 (부정적인 프롬프트 없음): 4K 비디오 게임 컨셉 아트, 어반정글, 사이버펑크 시티, 상세 렌더링
부정적 프롬프트가 있는 그림 예시 이미지
프롬프트: 4K 비디오 게임 컨셉 아트, 어반정글, 사이버펑크 시티, 상세 렌더링
부정적인 프롬프트: 녹색 나뭇잎, 식물, 숲, 나무
부정적인 프롬프트가 없는 그림 예시 이미지
프롬프트 (부정적인 프롬프트 없음): 산 위로 날아가는 신화 속의 와이번 삽화
부정적 프롬프트가 있는 그림 예시 이미지
프롬프트: 산 위로 날아가는 신화 속의 와이번 삽화
부정적인 프롬프트: 눈, 서리

실사형 이미지

이미지 생성 모델의 각 버전은 예술적이고 실제 사진과 같은 결과를 혼합해서 제공할 수 있습니다. 프롬프트에서 다음 문구를 사용하여 생성하려는 주제를 기반으로 보다 사실적인 출력을 생성합니다.

사용 사례 렌즈 유형 초점 거리 추가 세부정보
사람(세로 모드) Prime, 확대/축소 24~35mm 흑백 촬영, 느와르 촬영, 피사계 심도, 듀오톤(두 가지 색상 언급)
음식, 곤충, 식물(객체, 정물) 매크로 60~105mm 높은 정밀도, 정밀한 초점, 제어된 조명
스포츠, 야생 동물(모션) 망원 확대/축소 100~400mm 빠른 셔터 속도, 동작 또는 움직임 추적
천문, 가로 모드(광각) 광각 10~24mm 긴 노출 시간, 선명한 초점, 긴 노출, 잔잔한 물 또는 구름

초상화

사용 사례 렌즈 유형 초점 거리 추가 세부정보
사람(세로 모드) Prime, 확대/축소 24~35mm 흑백 촬영, 느와르 촬영, 피사계 심도, 듀오톤(두 가지 색상 언급)

Imagen은 테이블의 여러 키워드를 사용하여 다음과 같은 세로 모드를 생성할 수 있습니다.

세로 사진 예시 세로 사진 예시 세로 사진 예시 세로 사진 예시

프롬프트: 여성, 35mm 세로 모드, 파란색 및 회색 듀오톤
모델: Imagen 3 (imagen-3.0-generate-002)

세로 사진 예시 세로 사진 예시 세로 사진 예시 세로 사진 예시

프롬프트: 여성, 35mm 세로 모드, 느와르 촬영
모델: Imagen 3 (imagen-3.0-generate-002)

객체

사용 사례 렌즈 유형 초점 거리 추가 세부정보
음식, 곤충, 식물(객체, 정물) 매크로 60~105mm 높은 정밀도, 정밀한 초점, 제어된 조명

Imagen은 테이블의 여러 키워드를 사용하여 다음과 같은 객체 이미지를 생성할 수 있습니다.

객체 사진 예시 객체 사진 예시 객체 사진 예시 객체 사진 예시

프롬프트: 마란타의 잎, 매크로 렌즈, 60mm
모델: Imagen 3 (imagen-3.0-generate-002)

객체 사진 예시 객체 사진 예시 객체 사진 예시 객체 사진 예시

프롬프트: 파스타 접시, 100mm 매크로 렌즈
모델: Imagen 3 (imagen-3.0-generate-002)

모션

사용 사례 렌즈 유형 초점 거리 추가 세부정보
스포츠, 야생 동물(모션) 망원 확대/축소 100~400mm 빠른 셔터 속도, 동작 또는 움직임 추적

Imagen은 테이블의 여러 키워드를 사용하여 다음과 같은 모션 이미지를 생성할 수 있습니다.

모션 사진 예시 모션 사진 예시 모션 사진 예시 모션 사진 예시

프롬프트: 승리의 터치다운, 빠른 셔터 속도, 움직임 추적
모델: Imagen 3 (imagen-3.0-generate-002)

모션 사진 예시 모션 사진 예시 모션 사진 예시 모션 사진 예시

프롬프트: 숲 속을 달리는 사슴, 빠른 셔터 속도, 움직임 추적
모델: Imagen 3 (imagen-3.0-generate-002)

광각

사용 사례 렌즈 유형 초점 거리 추가 세부정보
천문, 가로 모드(광각) 광각 10~24mm 긴 노출 시간, 선명한 초점, 긴 노출, 잔잔한 물 또는 구름

Imagen은 테이블의 여러 키워드를 사용하여 다음과 같은 광각 이미지를 생성할 수 있습니다.

광각 사진 예시 광각 사진 예시 광각 사진 예시 광각 사진 예시

프롬프트: 광활한 산맥, 가로 모드 광각 10mm
모델: Imagen 3 (imagen-3.0-generate-002)

광각 사진 예시 광각 사진 예시 광각 사진 예시 광각 사진 예시

프롬프트: 달 사진, 천체 사진, 광각 10mm
모델: Imagen 3 (imagen-3.0-generate-002)

다음 단계

Imagen 및 Vertex AI의 기타 생성형 AI 제품 관련 문서 읽기: