Google AI Studio は、Gemini モデルを試して Gemini Developer API を使った開発を始めたいと考えているデベロッパー、学生、研究者にとっての近道です。また、翻訳、画像と動画の分析、音声入力など、一般的な AI ユースケース向けの無料ツールも提供しています。
*Google AI Studio は、利用可能なすべてのリージョンで料金なしでご利用いただけます。詳しくは、請求に関するよくある質問をご覧ください。
概要
Google Cloud では、Translation、Speech-to-Text、Natural Language、Video Intelligence などの多くの AI プロダクトを毎月の上限枠まで無料でお試しいただけます。以下の対象プロダクトは、指定の使用量上限まで無料でご利用いただけます。この無料の使用量上限に有効期限はありませんが、変更されることがあります。
さらに、Google AI Studio では、Google のマルチモーダル生成 AI モデル ファミリー全体での無料枠など、Gemini を使用した構築を簡単に開始できます。NotebookLM を使用すると、アップロードしたデータ(テキスト、動画、音声など)に関する分析情報と音声概要を提供する、パーソナライズされた AI アシスタントを作成できます。NotebookLM は、早期テストフェーズの間は無料です。
生成 AI の構築と活用のための統合プラットフォームである Vertex AI を使用したテキスト、チャット、コードの生成は、$0.0001(1,000 文字あたり)からご利用いただけます。また、Google Cloud を新たにご利用されるお客様には、Vertex AI で使用できる $300 分の無料クレジットを差し上げます。
さらに、Vertex AI Agent Builder の新規のお客様は、Google Cloud 請求先アカウントごとに 1 回、$1,000 分のクレジットをご利用いただけます。
ユースケースに応じて、Gemini Code Assist がコードの記述と開発を支援します。Gemini for Workspace は、Google ドキュメントと統合されており、ウェブページやビジネス提案書などのコンテンツの作成と開発を会話型インターフェースで行えるようにします。いずれの機能も、プレビュー版の期間中は無料で使用できます。
設定の詳細については Gemini Code Assist をご覧ください。
Google Gemini は、個人の Google アカウント、または管理者が Gemini へのアクセスを有効にした Google Workspace アカウントを持つ 18 歳以上のユーザーに無料でご利用いただけます。
10 種類以上の無料 AI ツールを比較
プロダクト | 説明 | 無料特典の詳細 | 料金 |
---|---|---|---|
API キーを取得して、Gemini モデルをアプリに統合します | Gemini API の「無料枠」は API サービスを通じて提供され、テスト目的でレート制限が緩和されます。Google AI Studio は、利用可能なすべての国で完全に無料でご利用いただけます。 | ||
アップロードしたデータから分析情報を引き出し、音声概要を提供するパーソナライズされた AI アシスタントを作成します | NotebookLM はまだ早期テスト段階であるため、現時点では料金は発生しません。 | ||
100 以上の言語ペアのサポートを利用して、テキストの翻訳とローカライズをリアルタイムで行えます。 AWS Polly との比較 | 最初の 500,000 文字(1 か月あたり)。 有効期限なし | ||
バッチテキスト、書式設定されたドキュメント、カスタムモデル、ローマ字テキストの翻訳をサポートします。 AWS Polly との比較 | 最初の 500,000 文字(1 か月あたり) 有効期限なし | ||
画像内の顔、物体、ランドマーク、ロゴ、テキストなどを検出します。 AWS Rekognition との比較 | 毎月最初の 1,000 ユニットは無料 有効期限なし | ||
ドメイン固有モデルを使用して音声を正確にテキストに変換し、品質を向上させます。 AWS Transcribe との比較 | 毎月最初の 60 分は無料 有効期限なし | ||
テキストを人間のような自然のイントネーションの音声に変換します。 AWS Polly との比較 | 最初の 400 万文字(標準) 最初の 100 万文字(WaveNet) 有効期限なし | ||
非構造化テキストのエンティティと感情を識別して分析します。 AWS Comprehend との比較 | 毎月最初の 5,000 ユニットは無料 有効期限なし | ||
動画内のショット、顔、有名人、露骨な表現を含むコンテンツ、ロゴ、テキストなどを検出します。 AWS Rekognition との比較 | 毎月最初の 1,000 分は無料 有効期限なし | ||
対話型 AI を使用して、最先端の人間のような仮想エージェントを構築 AWS Lex との比較 | Dialogflow の新規のお客様には $600 分のクレジットを差し上げます 有効期限: 12 か月 | ||
Google のインフラストラクチャ上で仮想マシンを作成して実行します AWS EC2 との比較 | 1 か月あたり 1 つの非プリエンプティブル e2-micro VM インスタンス(米国リージョン)が無料 有効期限なし | ||
ディープ ラーニング モデルと機械学習モデルを費用対効果の高い方法でトレーニングするための非構造化データを保存 AWS S3 との比較 | 1 か月あたり 5 GiB の米国の Regional Storage が無料 有効期限なし |
まず、Google Cloud アカウントを作成するか、アカウントにログインします。新規のお客様には、登録時に $300 分の無料クレジットを進呈します。
API キーを取得して、Gemini モデルをアプリに統合します
Gemini API の「無料枠」は API サービスを通じて提供され、テスト目的でレート制限が緩和されます。Google AI Studio は、利用可能なすべての国で完全に無料でご利用いただけます。
アップロードしたデータから分析情報を引き出し、音声概要を提供するパーソナライズされた AI アシスタントを作成します
NotebookLM はまだ早期テスト段階であるため、現時点では料金は発生しません。
100 以上の言語ペアのサポートを利用して、テキストの翻訳とローカライズをリアルタイムで行えます。
AWS Polly との比較
最初の 500,000 文字(1 か月あたり)。
有効期限なし
バッチテキスト、書式設定されたドキュメント、カスタムモデル、ローマ字テキストの翻訳をサポートします。
AWS Polly との比較
最初の 500,000 文字(1 か月あたり)
有効期限なし
画像内の顔、物体、ランドマーク、ロゴ、テキストなどを検出します。
AWS Rekognition との比較
毎月最初の 1,000 ユニットは無料
有効期限なし
ドメイン固有モデルを使用して音声を正確にテキストに変換し、品質を向上させます。
AWS Transcribe との比較
毎月最初の 60 分は無料
有効期限なし
テキストを人間のような自然のイントネーションの音声に変換します。
AWS Polly との比較
最初の 400 万文字(標準)
最初の 100 万文字(WaveNet)
有効期限なし
非構造化テキストのエンティティと感情を識別して分析します。
AWS Comprehend との比較
毎月最初の 5,000 ユニットは無料
有効期限なし
動画内のショット、顔、有名人、露骨な表現を含むコンテンツ、ロゴ、テキストなどを検出します。
AWS Rekognition との比較
毎月最初の 1,000 分は無料
有効期限なし
対話型 AI を使用して、最先端の人間のような仮想エージェントを構築
AWS Lex との比較
Dialogflow の新規のお客様には $600 分のクレジットを差し上げます
有効期限: 12 か月
Google のインフラストラクチャ上で仮想マシンを作成して実行します
AWS EC2 との比較
1 か月あたり 1 つの非プリエンプティブル e2-micro VM インスタンス(米国リージョン)が無料
有効期限なし
ディープ ラーニング モデルと機械学習モデルを費用対効果の高い方法でトレーニングするための非構造化データを保存
AWS S3 との比較
1 か月あたり 5 GiB の米国の Regional Storage が無料
有効期限なし
まず、Google Cloud アカウントを作成するか、アカウントにログインします。新規のお客様には、登録時に $300 分の無料クレジットを進呈します。
仕組み
すべてのお客様は、10 種類以上の無料 AI ツールを含む 20 種類以上のプロダクトを毎月の上限まで無料で使用することで、Google Cloud を試して評価できます。無料枠の制限の範囲内であれば、これらのリソースは無料クレジットまたは Cloud 請求先アカウントのお支払い方法に対して課金されることはありません。
一般的な使用例
Google AI Studio で Gemini を使ってみましょう。Google AI Studio は、ブラウザ内で直接プロトタイプを作成し、プロンプトを実行できるウェブベースのツールです。デベロッパー、学生、研究者の方は、テスト、プロトタイピング、AI のデプロイに適した Gemini Developer API をお試しください。
*Google AI Studio は、利用可能なすべてのリージョンで料金なしでご利用いただけます。詳しくは、請求に関するよくある質問をご覧ください。
Google AI Studio で Gemini を使ってみましょう。Google AI Studio は、ブラウザ内で直接プロトタイプを作成し、プロンプトを実行できるウェブベースのツールです。デベロッパー、学生、研究者の方は、テスト、プロトタイピング、AI のデプロイに適した Gemini Developer API をお試しください。
*Google AI Studio は、利用可能なすべてのリージョンで料金なしでご利用いただけます。詳しくは、請求に関するよくある質問をご覧ください。
Translation API Basic では、Google の事前トレーニング済みのニューラル機械翻訳(NMT)モデルを使用して、100 以上の言語ペアを動的に翻訳できます。毎月最初の 50 万文字は無料であるため、チャット、ソーシャル メディア、コメントなど、主に形式張らないユーザー作成コンテンツを扱うアプリケーションに適しています。
Translation API Advanced には Translation-Basic のすべての機能が含まれており、分野固有の用語を翻訳するための用語集の作成、長いテキスト リクエストの一括処理など、高度なカスタマイズ機能をサポートしています。毎月 500,000 文字まで無料です。ニューラル機械翻訳(NMT)での書式設定済みドキュメントの翻訳やカスタムモデルも含まれます。
Translation API Basic では、Google の事前トレーニング済みのニューラル機械翻訳(NMT)モデルを使用して、100 以上の言語ペアを動的に翻訳できます。毎月最初の 50 万文字は無料であるため、チャット、ソーシャル メディア、コメントなど、主に形式張らないユーザー作成コンテンツを扱うアプリケーションに適しています。
Translation API Advanced には Translation-Basic のすべての機能が含まれており、分野固有の用語を翻訳するための用語集の作成、長いテキスト リクエストの一括処理など、高度なカスタマイズ機能をサポートしています。毎月 500,000 文字まで無料です。ニューラル機械翻訳(NMT)での書式設定済みドキュメントの翻訳やカスタムモデルも含まれます。
Cloud Vision AI は、Google の事前トレーニング済み機械学習モデルを使用して、画像検出機能をアプリケーション内に簡単に統合します。毎月 1,000 ユニット(機能リクエスト)までは無料です。画像内の顔、オブジェクト、ランドマーク、ロゴ、その他の分析情報を検出してラベル付けできます。
Vision API を使用すると、エンドユーザーと小売業者は、小売業者が作成した商品セットの参照画像内でオブジェクトにクエリを実行でき、商品を見つけやすくなります。画像のクエリ実行と保存は、毎月最初の 1,000 枚まで無料です。
Cloud Vision AI は、Google の事前トレーニング済み機械学習モデルを使用して、画像検出機能をアプリケーション内に簡単に統合します。毎月 1,000 ユニット(機能リクエスト)までは無料です。画像内の顔、オブジェクト、ランドマーク、ロゴ、その他の分析情報を検出してラベル付けできます。
Vision API を使用すると、エンドユーザーと小売業者は、小売業者が作成した商品セットの参照画像内でオブジェクトにクエリを実行でき、商品を見つけやすくなります。画像のクエリ実行と保存は、毎月最初の 1,000 枚まで無料です。
Speech-to-Text API は同期音声認識を使用して、60 秒までの音声ファイルを文字に変換します。音声コンテンツは、ローカル ファイルまたは Google Cloud Storage バケットからアップロードできます。毎月、最初の 60 分間の音声処理が無料です。
Speech-to-Text API は同期音声認識を使用して、60 秒までの音声ファイルを文字に変換します。音声コンテンツは、ローカル ファイルまたは Google Cloud Storage バケットからアップロードできます。毎月、最初の 60 分間の音声処理が無料です。
Text-to-Speech API は、任意の文字列、単語、文を、同じことを話す人間の音声に変換します。50 以上の言語と方言に対応し、380 種類以上の音声に対応しています。API の一般的な用途には、アプリへの合成音声の追加、カスタマー サービスの音声 bot の強化、ユーザー補助に関するユーザー エクスペリエンスの改善などがあります。標準音声での処理は、毎月最初の 400 万文字まで無料です。
Text-to-Speech API は、任意の文字列、単語、文を、同じことを話す人間の音声に変換します。50 以上の言語と方言に対応し、380 種類以上の音声に対応しています。API の一般的な用途には、アプリへの合成音声の追加、カスタマー サービスの音声 bot の強化、ユーザー補助に関するユーザー エクスペリエンスの改善などがあります。標準音声での処理は、毎月最初の 400 万文字まで無料です。
Natural Language API は、自然言語理解(NLU)を使用して、感情分析、エンティティ分析、エンティティ感情分析、コンテンツ分類、構文分析などの機能を使用して、アプリケーションから意味を識別して抽出します。コンテンツ分類(1 か月あたり 30,000 ユニットが無料)を除くすべての機能で、毎月最初の 5,000 ユニット(1 ユニット = 1,000 Unicode 文字)のテキスト分析が無料です。
Natural Language API は、自然言語理解(NLU)を使用して、感情分析、エンティティ分析、エンティティ感情分析、コンテンツ分類、構文分析などの機能を使用して、アプリケーションから意味を識別して抽出します。コンテンツ分類(1 か月あたり 30,000 ユニットが無料)を除くすべての機能で、毎月最初の 5,000 ユニット(1 ユニット = 1,000 Unicode 文字)のテキスト分析が無料です。
Video Intelligence API は、ショットタイプ、顔、人物、有名人、露骨な表現を含むコンテンツ、ロゴ、テキストなどの動画メタデータを自動的に識別してラベル付けする、事前トレーニング済みの機械学習モデルを使用します。動画分析は毎月最初の 1,000 分まで無料です。
Video Intelligence API は、ショットタイプ、顔、人物、有名人、露骨な表現を含むコンテンツ、ロゴ、テキストなどの動画メタデータを自動的に識別してラベル付けする、事前トレーニング済みの機械学習モデルを使用します。動画分析は毎月最初の 1,000 分まで無料です。
NotebookLM は、Gemini 1.5 のマルチモーダル理解機能を使用して、アップロードされたソース資料(PDF、ウェブサイト、YouTube 動画、音声ファイルなど)を要約し、トピック間の興味深い分析情報を提供します。さらに、音声の概要機能を使用すると、ポッドキャストのように、情報源から「ディープダイブ」のディスカッションを魅力的なものにできます。
NotebookLM は、Gemini 1.5 のマルチモーダル理解機能を使用して、アップロードされたソース資料(PDF、ウェブサイト、YouTube 動画、音声ファイルなど)を要約し、トピック間の興味深い分析情報を提供します。さらに、音声の概要機能を使用すると、ポッドキャストのように、情報源から「ディープダイブ」のディスカッションを魅力的なものにできます。