Gemini 2.0 モデルは、Vertex AI でサポートされている最新の Google モデルです。このページでは、次のモデルについて説明します。
Gemini 2.0 Flash Thinking モデルについて詳しくは、Gemini 2.0 Flash Thinking のドキュメントをご覧ください。
2.0 モデル
2.0 Flash
Gemini 2.0 Flash は、Gemini ファミリーの最新の一般提供モデルです。すべての日常業務に使用できるモデルで、パフォーマンスが向上し、リアルタイムの Live API をサポートしています。2.0 Flash は、品質が大幅に向上したやや遅いモデルを希望する 1.5 Flash ユーザーや、品質とリアルタイム レイテンシを少し改善し、費用を抑えたい 1.5 Pro ユーザー向けのアップグレード パスです。
Gemini 2.0 Flash では、次の新機能と強化機能が導入されています。
- Multimodal Live API: この新しい API を使用すると、Gemini との低レイテンシの双方向音声と動画のやり取りが可能になります。
- 品質: Gemini 1.5 Pro よりも、ほとんどの品質ベンチマークでパフォーマンスが向上しています。
- エージェント機能の向上: 2.0 Flash では、マルチモーダル理解、コーディング、複雑な指示の実行、関数呼び出しが改善されています。これらの改善は連携して、エージェント エクスペリエンスの向上をサポートします。
- 新しいモダリティ: 2.0 Flash には、画像生成と制御可能なテキスト読み上げ機能が組み込まれており、画像編集、ローカライズされたアートワークの作成、表現力豊かなストーリーテリングを可能にします。
Gemini 2.0 Flash の機能:
- マルチモーダル入力
- テキスト出力(一般提供)/ マルチモーダル出力(限定公開プレビュー)
- プロンプト オプティマイザー
- 生成制御機能
- 関数呼び出し
- Google 検索によるグラウンディング
- コードの実行
- トークンのカウント
Gen AI SDK で Gemini 2.0 Flash を使用するには、このモデル ID を使用します。gemini-2.0-flash-001
利用できる機能
Gemini 2.0 Flash では、次の機能を利用できます。
機能 | 可用性レベル |
---|---|
テキスト生成 | 一般提供 |
Google 検索によるグラウンディング | 一般提供 |
Gen AI SDK | 一般提供 |
Multimodal Live API | 公開プレビュー版 |
境界ボックスの検出 | 公開プレビュー版 |
画像生成 | 限定公開プレビュー |
音声生成 | 限定公開プレビュー |
- 一般提供: この機能は一般公開されており、本番環境レベルのコードでの使用がサポートされています。
- 公開プレビュー: この機能は、制限付きで一般公開されています。一般公開プレビューとしてリリースされた機能は、本番環境コードで使用しないでください。この機能のサポートレベルと機能は、予告なく変更される可能性があります。
- 限定公開プレビュー: この機能は、承認済みの許可リストに登録されているユーザーのみが利用できます。非公開プレビューとしてリリースされた機能は本番環境コードで使用しないでください。その機能のサポートレベルと機能は予告なく変更される可能性があります。
料金
Gemini 2.0 Flash の料金については、料金ページをご覧ください。
割り当てと上限
Gemini 2.0 Flash の一般提供機能は動的共有割り当てを使用します。
Gemini 2.0 Flash での Google 検索によるグラウンディングには、レート制限が適用されます。
2.0 Flash-Lite
Gemini 2.0 Flash-Lite は、最も高速で費用対効果の高い Flash モデルです。1.5 Flash ユーザーが、同じ価格と速度で品質を高めたい場合に利用できるアップグレード パスです。
Gemini 2.0 Flash-Lite には次のものがあります。
- マルチモーダル入力、テキスト出力
- 100 万トークンの入力コンテキスト ウィンドウ
- 8,000 トークンの出力コンテキスト ウィンドウ
2.0 Flash-Lite には、次の 2.0 Flash 機能は含まれません。
- マルチモーダル出力の生成
- Multimodal Live API との統合
- 思考モード
- 組み込みツールの使用状況
Gen AI SDK で Gemini 2.0 Flash-Lite を使用するには、このモデル ID を使用します。gemini-2.0-flash-lite-preview-02-05
割り当てと上限
Gemini 2.0 Flash-Lite は、公開プレビュー期間中は 1 分あたり 60 クエリにレート制限されています。
Gemini 2.0 Flash-Lite は、Vertex AI の us-central1
リージョンでのみ使用できます。
2.0 Pro
Gemini 2.0 Pro は、コーディングと世界に関する知識を扱う Google の最強のモデルであり、200 万トークンの長いコンテキスト ウィンドウを備えています。Gemini 2.0 Pro は Vertex AI で試験運用版モデルとして利用できます。品質の向上を望んでいる場合や、長いコンテキストとコードに特に重点を置いている 1.5 Pro ユーザー向けのアップグレード パスです。
Gemini 2.0 Pro の機能:
- マルチモーダル入力
- テキスト出力
- プロンプト オプティマイザー
- 生成制御機能
- 関数呼び出し(コンポーズ関数呼び出しを除く)
- Google 検索によるグラウンディング
- コードの実行
- トークンのカウント
Gen AI SDK で Gemini 2.0 Pro を使用するには、このモデル ID を使用します。gemini-2.0-pro-exp-02-05
割り当てと上限
Gemini 2.0 Pro は、試験運用版の間は 1 分あたり 10 クエリ(QPM)にレート制限されています。
Gemini 2.0 Pro で Google 検索によるグラウンディングを行う場合、レート制限が適用されます。
Google Gen AI SDK
Gen AI SDK は、Gemini Developer API と Vertex AI の Gemini API の両方を通じて、Gemini 2.0 への統合インターフェースを提供します。いくつかの例外を除き、1 つのプラットフォームで実行されるコードは両方のプラットフォームで実行されます。つまり、Developer API を使用してアプリケーションのプロトタイプを作成してから、コードを書き換えることなくアプリケーションを Vertex AI に移行できます。
Gen AI SDK は Gemini 1.5 モデルもサポートしています。
この SDK は Python で一般提供されています。Go のサポートはプレビュー版です。Java と JavaScript のサポートは近日提供予定です。
次に示すように、SDK の使用を開始できます。
Gen AI SDK for Python
Google Gen AI SDK for Python のインストールまたは更新方法を確認する。
詳細については、
Gen AI SDK for Python API リファレンス ドキュメントまたは
python-genai
GitHub リポジトリをご覧ください。
Vertex AI で Gen AI SDK を使用するように環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True