このページは Cloud Translation API によって翻訳されました。

Vertex AI の Imagen モデルのバージョンとライフサイクル

Vertex AI 生成 AI の各画像モデルには、異なるバージョンがあります。画像モデルには、imagegeneration や imagetext などの生成モデルとテキストモデルがあります。バージョンによって、利用できる機能が異なります。

画像の生成、編集、カスタマイズ

画像生成用の Imagen モデルカードを表示する

編集とカスタマイズ用の Imagen モデルカードを表示する

画像の生成タスクと画像編集タスクでは、次の画像生成モデルバージョンを使用できます。

	Imagen 3	Imagen 2（v.006、デフォルト）	Imagen 2（v.005）	Imagen（v.002）
モデル名とバージョン	Imagen 3: `imagen-3.0-generate-002`（最新モデル） `imagen-3.0-generate-001` Imagen 3 Fast: `imagen-3.0-fast-generate-001` これは、プロトタイピングや低レイテンシのユースケースに使用できる低レイテンシのモデルバリアントです。 Imagen 3 のカスタマイズと編集: `imagen-3.0-capability-001`	`imagegeneration@006`	`imagegeneration@005`	`imagegeneration@002`
画像の生成	一般提供	一般提供（承認済みユーザー）	一般提供（承認済みユーザー）	一般提供（承認済みユーザー）
画像カスタマイズ（少数ショット学習）	一般提供（承認済みユーザー）被写体のカスタマイズ（商品、人物、ペット）スタイルのカスタマイズ制御されたカスタマイズ（落書きと Canny エッジ）カスタマイズ（スタイル転送）の手順を案内する	非対応	サポート対象外	非対応
画像編集	編集（マスクベース）インペインティング（挿入、削除）アウトペインティング商品画像の編集	編集（マスクベース）インペインティング（挿入、削除）アウトペインティング商品画像の編集	非対応。このモデルの機能サポートは、将来の変更や更新の対象となります。	編集（マスクベース）編集（マスクなし）商品画像の編集（プレビュー機能）
デジタル透かしと検証（画像生成）	対応（デフォルトで有効）	対応（デフォルトで有効）	対応（デフォルトでは無効）	対応（デフォルトでは無効）
ユーザーが構成できる安全性設定	人物の生成 - すべての年齢を許可、成人の人物 / 顔の生成のみを許可、すべての人物の生成をブロック安全設定 - フィルタリングされたコンテンツのほとんど、一部、またはごく一部をブロック	人物の生成 - すべての年齢を許可、成人の人物 / 顔の生成のみを許可、すべての人物の生成をブロック安全設定 - フィルタリングされたコンテンツのほとんど、一部、またはごく一部をブロック	非対応	非対応
プロンプト書き換えツールを使用したプロンプトの改善	`imagen-3.0-generate-002` モデルのオプションパラメータとして使用できます。	非対応	サポート対象外	非対応
画像のアップスケーリング	非対応	サポート対象外	非対応	対応（2 倍または 4 倍）
アスペクト比と解像度	1:1 - 1,024 x 1,024 ピクセル（スクエア） 9:16 - 768 x 1,408 ピクセル 16:9 - 1,408 x 768 ピクセル 3:4 - 896 x 1,280 ピクセル 4:3 - 1,280 x 896 ピクセル	1:1 - 1,536 x 1,536 ピクセル（スクエア） 9:16 - 1,152 x 2,016 ピクセル 16:9 - 2,016 x 1,134 ピクセル 3:4 - 1,344 x 1,792 ピクセル 4:3 - 1,792 x 1,344 ピクセル	1:1 - 1,536 x 1,536 ピクセル（スクエア） 9:16 - 1,152 x 2,016 ピクセル	1:1 - 1,024 x 1,024 ピクセル（スクエア）
言語	一般提供: 英語プレビュー: 中国語（簡体）中国語（繁体）ヒンディー語日本語韓国語ポルトガル語スペイン語	一般提供: 英語プレビュー: 中国語（簡体）中国語（繁体）ヒンディー語日本語韓国語ポルトガル語スペイン語	一般提供: 英語プレビュー: 中国語（簡体）中国語（繁体）ヒンディー語日本語韓国語ポルトガル語スペイン語	一般提供: 英語
モデルのチューニング	非対応。このモデルの機能サポートは、将来の変更や更新の対象となります。	非対応	非対応	モデルのチューニングの可用性: サブジェクトモデルのチューニングスタイルモデルのチューニング

画像キャプションと Visual Question Answering（VQA）

キャプションと VQA 用の Imagen モデルカードを表示する

画像キャプションと Visual Question Answering（VQA）タスクには、次の imagetext モデルバージョンを使用できます。

	モデルバージョン: `imagetext@001`（デフォルト）
画像キャプション（短形式）	トークン: 32（約 32 語）言語: 英語、スペイン語、フランス語、ドイツ語、イタリア語
Visual Question Answering、VQA（短形式）	トークン（リクエスト）: 80 トークン（レスポンス）: 64 言語: 英語

画像モデルのバージョンを指定する方法

ビジョンモデルのバージョンを使用するには、モデルに 3 桁のバージョン番号を追加します。たとえば、imagegeneration モデルバージョンを指定するには、モデルの名前にモデルバージョン（@006 など）を追加します。

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict

ただし、この形式は Imagen 3 モデルには適用されません。

モデルバージョンを指定せずにデフォルトオプションを使用すると、モデルの動作が変化する可能性があります。本番環境で使用する場合は、常に安定バージョンのモデルバージョンを指定してください。

モデルバージョンを省略すると、Imagen はデフォルトのモデルバージョンを使用します。

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict

モデルバージョンは必ず指定することをおすすめします。モデルバージョンなしでモデル名を使用するのは、テスト環境だけにしてください。

次のステップ

特定のモデルにリクエストを送信する方法を学習します。
API リファレンスでモデルパラメータの詳細を確認する
- 画像生成モデル（imagegeneration モデル）
- 画像キャプション（imagetext モデル）
- Visual Question Answering（VQA）（imagetext モデル）