Google Cloud Next Tokyo：7/30、31 東京ビッグサイトにて開催！

text-to-image AI

コードを 1 行も書かずにテキストから画像を作成、編集する

画像生成モデル Gemini 3 Pro Image や Imagen を、Python、Java、Go の各プログラミング言語で利用可能な API で使用して、テキストの説明から画像を数秒で生成、編集しましょう。

Gemini Enterprise Agent Platform で画像の生成などにご利用いただける無料クレジット最大 $300 分を新規のお客様に差し上げます。

概要

text-to-image AI とは何か？

テキスト画像変換の AI は、テキストの説明から画像を生成して編集できる AI の一種です。このテクノロジーは、ビジュアルコンテンツの操作や作成の方法を変える可能性を秘めています。Google Cloud の Text-to-AI ツールとリソースは、Agent Platform で利用可能な Imagen、Gemini 3 Pro Image、Veo などの事前トレーニング済み AI モデルを含め、デベロッパーがテキストから画像の生成を簡単に実装できるように設計されています。

動画のサムネイルの説明

動画

text-to-image AI の Q&A

3:23

text-to-image はアプリケーション開発でどのように使用されますか？

アプリケーション開発でテキスト画像変換 AI を使用して、モックアップ、プロトタイプ、イラスト、テストデータ、教育コンテンツ、デバッグ用の可視化を生成できます。開発者は、Google Cloud の Agent Platform と Cloud Vision API を使用して、テキスト検出、オブジェクト検出、画像分類などの一連の画像処理機能にアクセスできます。Document AI を使用してスキャンしたドキュメントからテキストを抽出し、テキストの説明画像を生成できます。

Gemini と Imagen を使用した実際の AI アプリケーションの構築

無料のトレーニングを開始

これらの Google モデルを使用する方法は？

これらのテキスト画像変換の AI モデルには、Google Cloud の Agent Platform または Google AI Studio からアクセスできます。このモデルを使用するには、テキストプロンプトを入力してパラメータを選択し（一部のモデルでは、生成された画像のスタイル、独創性、精度を制御するパラメータを選択できます）、最後に画像を生成します。

仕組み

テキスト画像変換 AI は、自然言語処理（NLP）を使用して、テキストの説明を機械で読み取れる形式に変換します。機械で読み取り可能な形式に変換されると、ML モデルはテキストと画像の膨大なデータセットでトレーニングされ、パターンを識別することを学習し、それらを使用して画像を生成または編集します。

生成 AI プロダクトの UI

テキストからビジョンへ: AI 画像生成の概要

一般的な使用例

AI を使用して画像を生成する

テキストプロンプトを使用して画像を生成する

Agent Platform で、Imagen のテキスト画像変換機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。

Imagen で作成された画像

入門ガイド

テキストプロンプトを使用して画像を生成する

Agent Platform で、Imagen のテキスト画像変換機能を使用し、生成された画像をアップスケールしてエクスポートする方法を学習します。このクイックスタートでは、Google Cloud コンソールで Imagen 画像生成機能を使用する方法について説明します。

Imagen で作成された画像

AI で画像を編集する

マルチ画像融合と会話型編集

Gemini を使用すると、複数の画像を組み合わせて、シームレスな新しいビジュアルを作成できます。複数の参照画像を使用して、単一の統合画像を作成します。簡単な自然言語で指示して画像を編集することもできます。グループ写真から人物を削除したり、汚れなどの小さなディテールを修正したりするなど、簡単な会話で変更できます。

また、Agent Platform の Imagen を使用すると、Imagen で生成された画像や既存の画像を編集できます。更新に関する説明テキストと変更する画像部分を指定することも（マスクベースの編集）できます。

Generative AI Studio の編集 UI

入門ガイド

マルチ画像融合と会話型編集

Gemini を使用すると、複数の画像を組み合わせて、シームレスな新しいビジュアルを作成できます。複数の参照画像を使用して、単一の統合画像を作成します。簡単な自然言語で指示して画像を編集することもできます。グループ写真から人物を削除したり、汚れなどの小さなディテールを修正したりするなど、簡単な会話で変更できます。

また、Agent Platform の Imagen を使用すると、Imagen で生成された画像や既存の画像を編集できます。更新に関する説明テキストと変更する画像部分を指定することも（マスクベースの編集）できます。

Generative AI Studio の編集 UI

AI を使用した画像キャプション

画像キャプションを使用して画像説明を取得する

詳細なメタデータ、自動キャプション、商品や画像アセットの簡単な説明など、画像に関連する説明を生成します。

画像キャプションプロダクトの UI

入門ガイド

画像キャプションを使用して画像説明を取得する

詳細なメタデータ、自動キャプション、商品や画像アセットの簡単な説明など、画像に関連する説明を生成します。

画像キャプションプロダクトの UI

概念実証を開始する

新規のお客様には、Agent Platform で画像の生成などにご利用いただける無料クレジット最大 $300 分を差し上げます。

大規模なプロジェクトを計画していますか？

作成できる画像のタイプを確認する

テキストプロンプトを使用して画像を生成する方法を学ぶ

Colab で Imagen を試す

ドキュメントサポート

コンソール

デジタル変革を加速させましょう
お客様がデジタルトランスフォーメーションに乗り出したばかりでも、あるいはすでに進めている場合でも、Google Cloud は困難な課題の解決を支援します。
詳細

業種別ソリューション
コストを削減し、運用のアジリティを高め、新たな市場機会を獲得。
すべての業種別ソリューションを見る

Google Cloud プロダクト
100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます（毎月の使用量上限があります）。
すべてのプロダクト（100 以上）を見る

Google の透明性の高い料金設定の手法で費用を削減
Google Cloud の従量課金制では、毎月の使用量と、リソース料金の前払い割引に基づいて自動的に割引が適用されます。見積もりをご希望の場合は、今すぐお問い合わせください。
見積もりをリクエスト