Google Cloud AI を活用した画像生成と、Python、Java、Go の各プログラミング言語の API を使用して、テキストの説明から数秒で画像を生成します。
新規のお客様には、Vertex AI で Imagen を使用して画像を生成できる無料クレジットを最大 $300 分獲得できます。
概要
Text-to-image AI をアプリケーション開発で使用して、モックアップ、プロトタイプ、イラスト、テストデータ、教育コンテンツ、デバッグ用の可視化を生成できます。Google Cloud の Vertex AI と Cloud Vision API により、デベロッパーはテキスト検出、オブジェクト検出、画像分類などの一連の画像処理機能にアクセスできます。Document AI を使用すると、スキャンしたドキュメントからテキストを抽出し、テキストの説明画像を生成できます。
拡散モデルである Imagen は、深いレベルの言語理解によるフォトリアリズムに最適です。自己回帰モデルである Parti は、スタイルとテーマに一貫性を持たせ、特定のスタイルで画像を生成するのに最適です。Transformer モデルの Muse は、複数のオブジェクトと複雑な合成を含む画像を生成できます。それぞれに独自の強みがあります。Imagen はフォトリアリズムに優れ、Parti はリッチ コンテンツで、Muse はスピードと編集ツールに優れています。どれも使いやすく、プログラミングの知識は必要ありません。
Imagen 3 は Google の最新の画像生成モデルです。Imagen 2 よりも優れた画質を実現するとともに、さまざまな改善が加えられており、迅速なプロトタイピングとイテレーションでの生成速度の向上率が 40% 以上、プロンプトの理解と指示の実行の改善、人のグループ写真などのフォトリアリスティックな生成、画像内のテキスト レンダリングの細かい制御などが挙げられます。
早期アクセスで Vertex AI をご利用のお客様を対象にプレビュー版としてリリースされた Imagen 3 には、多言語サポート、Google DeepMind の SynthID 電子透かしなどの組み込みの安全機能、複数のアスペクト比のサポートも含まれています。
これらのテキストから画像を生成する AI モデルには、Google Cloud の Vertex AI またはサードパーティの API プロバイダを介してアクセスできます。このモデルを使用するには、テキスト プロンプトを入力してパラメータを選択し(一部のモデルでは、生成された画像のスタイル、独創性、精度を制御するパラメータを選択できます)、最後に画像を生成します。
仕組み
Text-to-image AI は自然言語処理(NLP)を使用して、テキストの説明を機械で読み取れる形式に変換します。機械で読み取れる形式に変換されると、ML モデルはテキストと画像の膨大なデータセットでトレーニングされ、パターンを識別することを学習し、それらを使用して新しい画像を生成します。Google Cloud の Text-to-image AI は、テキストの説明から写真のようにリアルな画像を生成できる最先端のモデルである Imagen と呼ばれるディープ ラーニング モデルを使用します。
一般的な使用例
Vertex AI で、テキストから画像を生成する Imagen の機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。
Vertex AI で、テキストから画像を生成する Imagen の機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。
Imagen を使用すると、生成された画像や既存の画像を編集できます。テキスト プロンプトを使用して画像全体を更新する(マスクなしで編集)ことも、更新に関する説明のテキストに加えて画像の一部を変更するように指定する(マスクベースの編集)こともできます。
Imagen を使用すると、生成された画像や既存の画像を編集できます。テキスト プロンプトを使用して画像全体を更新する(マスクなしで編集)ことも、更新に関する説明のテキストに加えて画像の一部を変更するように指定する(マスクベースの編集)こともできます。