Vertex AI の Imagen モデルのバージョンとライフサイクル

Vertex AI 生成 AI の各画像モデルには、異なるバージョンがあります。画像モデルには、imagegenerationimagetext などの生成モデルとテキストモデルがあります。バージョンによって、利用できる機能が異なります。

画像の生成、編集、カスタマイズ

画像生成用の Imagen モデルカードを表示する

編集とカスタマイズ用の Imagen モデルカードを表示する

画像の生成タスクと画像編集タスクでは、次の画像生成モデル バージョンを使用できます。

Imagen 3 Imagen 2(v.006、デフォルト) Imagen 2(v.005) Imagen(v.002)
モデル名とバージョン Imagen 3:

imagen-3.0-generate-002(最新モデル)

imagen-3.0-generate-001


Imagen 3 Fast: imagen-3.0-fast-generate-001

これは、プロトタイピングや低レイテンシのユースケースに使用できる低レイテンシのモデル バリアントです。


Imagen 3 のカスタマイズと編集: imagen-3.0-capability-001
imagegeneration@006 imagegeneration@005 imagegeneration@002
画像の生成 一般提供 一般提供(承認済みユーザー) 一般提供(承認済みユーザー) 一般提供(承認済みユーザー)
画像カスタマイズ(少数ショット学習) 一般提供(承認済みユーザー)
  • 被写体のカスタマイズ(商品、人物、ペット)
  • スタイルのカスタマイズ
  • 制御されたカスタマイズ(落書きと Canny エッジ)
  • カスタマイズ(スタイル転送)の手順を案内する
非対応 サポート対象外 非対応
画像編集
  • 編集(マスクベース)
    • インペインティング(挿入、削除)
    • アウトペインティング
    • 商品画像の編集
  • 編集(マスクベース)
    • インペインティング(挿入、削除)
    • アウトペインティング
    • 商品画像の編集
非対応。このモデルの機能サポートは、将来の変更や更新の対象となります。
  • 編集(マスクベース)
  • 編集(マスクなし)
  • 商品画像の編集(プレビュー機能)
デジタル透かしと検証(画像生成) 対応(デフォルトで有効) 対応(デフォルトで有効) 対応(デフォルトでは無効) 対応(デフォルトでは無効)
ユーザーが構成できる安全性設定
  • 人物の生成 - すべての年齢を許可、成人の人物 / 顔の生成のみを許可、すべての人物の生成をブロック
  • 安全設定 - フィルタリングされたコンテンツのほとんど、一部、またはごく一部をブロック
  • 人物の生成 - すべての年齢を許可、成人の人物 / 顔の生成のみを許可、すべての人物の生成をブロック
  • 安全設定 - フィルタリングされたコンテンツのほとんど、一部、またはごく一部をブロック
非対応 非対応
プロンプト書き換えツールを使用したプロンプトの改善 imagen-3.0-generate-002 モデルのオプション パラメータとして使用できます。 非対応 サポート対象外 非対応
画像のアップスケーリング 非対応 サポート対象外 非対応 対応(2 倍または 4 倍)
アスペクト比と解像度
  • 1:1 - 1,024 x 1,024 ピクセル(スクエア)
  • 9:16 - 768 x 1,408 ピクセル
  • 16:9 - 1,408 x 768 ピクセル
  • 3:4 - 896 x 1,280 ピクセル
  • 4:3 - 1,280 x 896 ピクセル
  • 1:1 - 1,536 x 1,536 ピクセル(スクエア)
  • 9:16 - 1,152 x 2,016 ピクセル
  • 16:9 - 2,016 x 1,134 ピクセル
  • 3:4 - 1,344 x 1,792 ピクセル
  • 4:3 - 1,792 x 1,344 ピクセル
  • 1:1 - 1,536 x 1,536 ピクセル(スクエア)
  • 9:16 - 1,152 x 2,016 ピクセル
  • 1:1 - 1,024 x 1,024 ピクセル(スクエア)
言語

一般提供:

  • 英語

プレビュー:

  • 中国語(簡体)
  • 中国語(繁体)
  • ヒンディー語
  • 日本語
  • 韓国語
  • ポルトガル語
  • スペイン語

一般提供:

  • 英語

プレビュー:

  • 中国語(簡体)
  • 中国語(繁体)
  • ヒンディー語
  • 日本語
  • 韓国語
  • ポルトガル語
  • スペイン語

一般提供:

  • 英語

プレビュー:

  • 中国語(簡体)
  • 中国語(繁体)
  • ヒンディー語
  • 日本語
  • 韓国語
  • ポルトガル語
  • スペイン語

一般提供:

  • 英語
モデルのチューニング 非対応。

このモデルの機能サポートは、将来の変更や更新の対象となります。
非対応 非対応

モデルのチューニングの可用性:

  • サブジェクト モデルのチューニング
  • スタイルモデルのチューニング

画像キャプションと Visual Question Answering(VQA)

キャプションと VQA 用の Imagen モデルカードを表示する

画像キャプションと Visual Question Answering(VQA)タスクには、次の imagetext モデル バージョンを使用できます。

モデル バージョン:
imagetext@001(デフォルト)
画像キャプション(短形式) トークン: 32(約 32 語)
言語: 英語、スペイン語、フランス語、ドイツ語、イタリア語
Visual Question Answering、VQA(短形式) トークン(リクエスト): 80
トークン(レスポンス): 64
言語: 英語

画像モデルのバージョンを指定する方法

ビジョンモデルのバージョンを使用するには、モデルに 3 桁のバージョン番号を追加します。たとえば、imagegeneration モデル バージョンを指定するには、モデルの名前にモデル バージョン(@006 など)を追加します。

  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict

ただし、この形式は Imagen 3 モデルには適用されません。

モデル バージョンを指定せずにデフォルト オプションを使用すると、モデルの動作が変化する可能性があります。本番環境で使用する場合は、常に安定バージョンのモデル バージョンを指定してください。

モデル バージョンを省略すると、Imagen はデフォルトのモデル バージョンを使用します。

  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
  • POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict

モデル バージョンは必ず指定することをおすすめします。モデル バージョンなしでモデル名を使用するのは、テスト環境だけにしてください。

次のステップ