text-to-image AI

コードを 1 行も書かずにテキストから画像を作成する

Google Cloud AI を活用した画像生成と、Python、Java、Go の各プログラミング言語の API を使用して、テキストの説明から数秒で画像を生成します。

新規のお客様には、Vertex AI で Imagen を使用して画像を生成できる無料クレジットを最大 $300 分獲得できます。

概要

text-to-image AI とは何か?

Text-to-image AI は、テキストの説明から画像を生成できる AI の一種です。このテクノロジーは、ビジュアル コンテンツの操作や作成の方法を変える可能性を秘めています。Google Cloud の Text-to-AI ツールとリソースは、Vertex AI で利用可能な Imagen、Parti、Muse などの事前トレーニング済み AI モデルを含め、デベロッパーがテキストから画像の生成を簡単に実装できるように設計されています。また、AutoML により、分野固有のアプリケーション向けに AI モデルをカスタマイズできます。

text-to-image はアプリケーション開発でどのように使用されますか?

Text-to-image AI をアプリケーション開発で使用して、モックアップ、プロトタイプ、イラスト、テストデータ、教育コンテンツ、デバッグ用の可視化を生成できます。Google Cloud の Vertex AI と Cloud Vision API により、デベロッパーはテキスト検出、オブジェクト検出、画像分類などの一連の画像処理機能にアクセスできます。Document AI を使用すると、スキャンしたドキュメントからテキストを抽出し、テキストの説明画像を生成できます。

text-to-image の生成にはどのモデルが使用されますか?

Imagen、Parti、Muse は、テキストから画像への主要なモデルです。Imagen は、高度なフォトリアリズムを持つ拡散モデルです。Pathways Autoregressive Text-to-Image モデル(Parti)は、複雑な構成と世界的な知識を含む、コンテンツを豊富に含む合成をサポートしています。Muse は、高い画像生成パフォーマンスのための Transformer モデルです。さらに、Gemini は、ほぼすべての入力を理解し、テキスト、画像、音声、動画、コードなど、ほぼすべての出力を生成できるモデルにより、可能性を拡張します。

これらのモデルにどのような違いがありますか?

拡散モデルである Imagen は、深いレベルの言語理解によるフォトリアリズムに最適です。自己回帰モデルである Parti は、スタイルとテーマに一貫性を持たせ、特定のスタイルで画像を生成するのに最適です。Transformer モデルの Muse は、複数のオブジェクトと複雑な合成を含む画像を生成できます。それぞれに独自の強みがあります。Imagen はフォトリアリズムに優れ、Parti はリッチ コンテンツで、Muse はスピードと編集ツールに優れています。どれも使いやすく、プログラミングの知識は必要ありません。

Imagen 3 とは何ですか?

Imagen 3 は Google の最新の画像生成モデルです。Imagen 2 よりも優れた画質を実現するとともに、さまざまな改善が加えられており、迅速なプロトタイピングとイテレーションでの生成速度の向上率が 40% 以上、プロンプトの理解と指示の実行の改善、人のグループ写真などのフォトリアリスティックな生成、画像内のテキスト レンダリングの細かい制御などが挙げられます。

早期アクセスで Vertex AI をご利用のお客様を対象にプレビュー版としてリリースされた Imagen 3 には、多言語サポート、Google DeepMind の SynthID 電子透かしなどの組み込みの安全機能、複数のアスペクト比のサポートも含まれています。

これらの Google モデルを使用する方法は?

これらのテキストから画像を生成する AI モデルには、Google Cloud の Vertex AI またはサードパーティの API プロバイダを介してアクセスできます。このモデルを使用するには、テキスト プロンプトを入力してパラメータを選択し(一部のモデルでは、生成された画像のスタイル、独創性、精度を制御するパラメータを選択できます)、最後に画像を生成します。

仕組み

Text-to-image AI は自然言語処理(NLP)を使用して、テキストの説明を機械で読み取れる形式に変換します。機械で読み取れる形式に変換されると、ML モデルはテキストと画像の膨大なデータセットでトレーニングされ、パターンを識別することを学習し、それらを使用して新しい画像を生成します。Google Cloud の Text-to-image AI は、テキストの説明から写真のようにリアルな画像を生成できる最先端のモデルである Imagen と呼ばれるディープ ラーニング モデルを使用します。

生成 AI プロダクトの UI
Vertex AI Studio を使った画像の生成と編集

一般的な使用例

AI を使用して画像を生成する

テキスト プロンプトを使用して画像を生成する

Vertex AI で、テキストから画像を生成する Imagen の機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。

使ってみる
Vertex AI プロダクトで新聞を読んでいる犬の生成された画像

テキスト プロンプトを使用して画像を生成する

Vertex AI で、テキストから画像を生成する Imagen の機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。

使ってみる
Vertex AI プロダクトで新聞を読んでいる犬の生成された画像

AI で画像を編集する

テキスト プロンプトを使用して画像を編集する

Imagen を使用すると、生成された画像や既存の画像を編集できます。テキスト プロンプトを使用して画像全体を更新する(マスクなしで編集)ことも、更新に関する説明のテキストに加えて画像の一部を変更するように指定する(マスクベースの編集)こともできます。

テキスト プロンプトで画像の編集を開始する
Vertex AI での画像編集

テキスト プロンプトを使用して画像を編集する

Imagen を使用すると、生成された画像や既存の画像を編集できます。テキスト プロンプトを使用して画像全体を更新する(マスクなしで編集)ことも、更新に関する説明のテキストに加えて画像の一部を変更するように指定する(マスクベースの編集)こともできます。

テキスト プロンプトで画像の編集を開始する
Vertex AI での画像編集

AI による画像キャプション

画像キャプションを使用して画像説明を取得する

詳細なメタデータ、自動字幕起こし、商品や映像アセットの簡単な説明など、画像に関連する説明を生成します。

画像のキャプションの生成を開始する
画像キャプションのプロダクトの UI

画像キャプションを使用して画像説明を取得する

詳細なメタデータ、自動字幕起こし、商品や映像アセットの簡単な説明など、画像に関連する説明を生成します。

画像のキャプションの生成を開始する
画像キャプションのプロダクトの UI

概念実証を開始する

新規のお客様には、Vertex AI での画像生成などに使用できる無料クレジットを最大 $300 分進呈します

大規模なプロジェクトがある場合は、

作成できる画像の種類

テキスト プロンプトを使用して画像を生成する方法を学ぶ

画像の透かしを生成および検証する方法の詳細

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud