Gemini 2.0 モデルは、Vertex AI でサポートされている最新の Google モデルです。このページでは、次のモデルについて説明します。
Gemini 2.0 Flash Thinking モデルについては、Gemini 2.0 Flash Thinking のドキュメントをご覧ください。
2.0 モデル
2.0 Flash
Gemini 2.0 Flash は、Gemini ファミリーの最新の一般提供モデルです。あらゆる日常業務に使用できる主軸モデルで、パフォーマンスが向上し、リアルタイムの Live API をサポートしています。2.0 Flash は、少し遅くなっても品質を大幅に向上させることを求めている 1.5 Flash ユーザーと、品質を少し向上させると同時にリアルタイム レイテンシを改善することを求めている 1.5 Pro ユーザー向けのアップグレード パスです。
Gemini 2.0 Flash では、次の新機能と機能強化が導入されています。
- Multimodal Live API: この新しい API を使用すると、Gemini との間で音声と動画の低レイテンシで双方向のやり取りが可能になります。
- 品質: Gemini 1.5 Pro よりも、ほとんどの品質ベンチマークでパフォーマンスが向上しています。
- エージェント機能の改善: 2.0 Flash では、複数のデータ形式の理解、コーディング、複雑な指示の実行、関数呼び出しが改善されています。これらの改善が連携することで、エージェント エクスペリエンスが向上します。
- 新しいモダリティ: 2.0 Flash には、画像生成と制御可能なテキスト読み上げ機能が組み込まれており、画像編集、ローカライズされたアートワークの作成、表現力豊かなストーリーテリングを可能にします。
Gemini 2.0 Flash の機能:
- マルチモーダル入力
- テキスト出力(一般提供)/ マルチモーダル出力(限定公開プレビュー)
- プロンプト オプティマイザー
- 生成制御機能
- 関数呼び出し
- Google 検索によるグラウンディング
- コードの実行
- トークンのカウント
Gen AI SDK で Gemini 2.0 Flash を使用するには、モデル ID gemini-2.0-flash-001
を使用します。
利用できる機能
Gemini 2.0 Flash では、次の機能を利用できます。
機能 | 可用性レベル |
---|---|
テキスト生成 | 一般提供 |
Google 検索によるグラウンディング | 一般提供 |
Gen AI SDK | 一般提供 |
Multimodal Live API | 公開プレビュー版 |
境界ボックス検出 | 公開プレビュー版 |
画像生成 | 限定公開プレビュー版 |
音声生成 | 限定公開プレビュー版 |
- 一般提供: この機能は一般公開されており、本番環境レベルのコードでの使用がサポートされています。
- 公開プレビュー版: この機能は、制限付きで一般公開されています。公開プレビュー版としてリリースされている機能は、本番環境コードで使用しないでください。この機能のサポートレベルと動作は、予告なく変更される可能性があります。
- 限定公開プレビュー版: この機能は、承認済みの許可リストに登録されているユーザーのみが利用できます。限定公開プレビュー版としてリリースされている機能は、本番環境コードで使用しないでください。この機能のサポートレベルと動作は予告なく変更される可能性があります。
料金
Gemini 2.0 Flash の料金については、料金ページをご覧ください。
割り当てと上限
Gemini 2.0 Flash の一般提供機能は動的共有割り当てを使用します。
Gemini 2.0 Flash の Google 検索によるグラウンディングには、レート制限が適用されます。
2.0 Flash-Lite
Gemini 2.0 Flash-Lite は、Google 史上最も高速で費用対効果に優れた Flash モデルです。価格と速度はそのままに品質の向上を求めている 1.5 Flash ユーザー向けのアップグレード パスです。
Gemini 2.0 Flash-Lite には以下が含まれています。
- マルチモーダル入力、テキスト出力
- 100 万トークンの入力コンテキスト ウィンドウ
- 8,000 トークンの出力コンテキスト ウィンドウ
2.0 Flash-Lite には、次の 2.0 Flash 機能は含まれません。
- マルチモーダル出力の生成
- Multimodal Live API とのインテグレーション
- 思考モード
- 組み込みツールの使用
Gen AI SDK で Gemini 2.0 Flash-Lite を使用するには、モデル ID gemini-2.0-flash-lite-preview-02-05
を使用します。
割り当てと上限
Gemini 2.0 Flash-Lite は、公開プレビュー期間中は 1 分あたり 60 クエリにレート制限されています。
Gemini 2.0 Flash-Lite は、us-central1
リージョンの Vertex AI でのみ使用できます。
2.0 Pro
Gemini 2.0 Pro は、コーディングと世界中の知識を扱う非常に優れたモデルで、200 万個のトークンの長いコンテキスト ウィンドウを備えています。Gemini 2.0 Pro は Vertex AI で試験運用版モデルとして利用できます。品質の向上を求めている 1.5 Pro ユーザーや、長いコンテキストとコードに重点を置いている 1.5 Pro ユーザー向けのアップグレード パスです。
Gemini 2.0 Pro の機能:
- マルチモーダル入力
- テキスト出力
- プロンプト オプティマイザー
- 生成制御機能
- 関数呼び出し(コンポジション関数呼び出しを除く)
- Google 検索によるグラウンディング
- コードの実行
- トークンのカウント
Gen AI SDK で Gemini 2.0 Pro を使用するには、モデル ID gemini-2.0-pro-exp-02-05
を使用します。
割り当てと上限
Gemini 2.0 Pro は、試験運用期間中は 1 分あたり 10 クエリ(QPM)にレート制限されています。
Gemini 2.0 Pro の Google 検索によるグラウンディングには、レート制限が適用されます。
Google Gen AI SDK
Gen AI SDK は、Gemini Developer API と Vertex AI の Gemini API の両方を介して Gemini 2.0 への統合インターフェースを提供します。いくつかの例外を除き、1 つのプラットフォームで実行されるコードは両方のプラットフォームで実行されます。つまり、Developer API を使用してアプリケーションのプロトタイプを作成してから、コードを書き換えることなくアプリケーションを Vertex AI に移行できます。
Gen AI SDK は Gemini 1.5 モデルもサポートしています。
この SDK は Python で一般提供されています。Go のサポートはプレビュー版です。Java と JavaScript のサポートは近日提供予定です。
SDK の使用を開始するには、次のようにします。
Gen AI SDK for Python
Google Gen AI SDK for Python をインストールまたは更新する方法を確認します。
詳細については、Gen AI SDK for Python API リファレンス ドキュメントまたは python-genai
GitHub リポジトリをご覧ください。
Vertex AI で Gen AI SDK を使用するように環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
(省略可)環境変数を設定する
または、環境変数を使用してクライアントを初期化することもできます。まず、適切な値を設定して変数をエクスポートします。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=YOUR_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True
次に、引数なしでクライアントを初期化できます。
client = genai.Client()