Gemini 2

Gemini 2 モデルは、Vertex AI でサポートされている最新の Google モデルです。このページでは、次のモデルについて説明します。

Gemini 2.5 Pro プレビュー モデルについては、Gemini 2.5 Pro プレビューのドキュメントをご覧ください。

モデル

2.0 Flash

Gemini 2.0 Flash は、Gemini ファミリーの最新の一般提供モデルです。あらゆる日常業務に使用できる主軸モデルで、パフォーマンスが向上し、リアルタイムの Live API をサポートしています。

Gemini 2.0 Flash では、次の新機能と機能強化が導入されています。

  • Multimodal Live API: この新しい API を使用すると、Gemini との間で音声と動画の低レイテンシで双方向のやり取りが可能になります。
  • 品質: ほとんどの品質ベンチマークでパフォーマンスが向上しています。
  • エージェント機能の改善: 2.0 Flash では、複数のデータ形式の理解、コーディング、複雑な指示の実行、関数呼び出しが改善されています。これらの改善が連携することで、エージェント エクスペリエンスが向上します。
  • 新しいモダリティ: 2.0 Flash には、画像生成と制御可能なテキスト読み上げ機能が組み込まれており、画像編集、ローカライズされたアートワークの作成、表現力豊かなストーリーテリングを可能にします。

Gemini 2.0 Flash の機能:

  • マルチモーダル入力
  • テキスト出力(一般提供)/ マルチモーダル出力(限定公開プレビュー)
  • プロンプト オプティマイザー
  • 生成制御機能
  • 関数呼び出し
  • Google 検索によるグラウンディング
  • コードの実行
  • トークンのカウント

Gen AI SDK で Gemini 2.0 Flash を使用するには、モデル ID gemini-2.0-flash を使用します。

利用できる機能

Gemini 2.0 Flash では、次の機能を利用できます。

機能 可用性レベル
テキスト生成 一般提供
Google 検索によるグラウンディング 一般提供
Gen AI SDK 一般提供
Multimodal Live API 公開プレビュー版
境界ボックス検出 公開プレビュー版
画像生成 限定公開プレビュー版
音声生成 限定公開プレビュー版
  • 一般提供: この機能は一般公開されており、本番環境レベルのコードでの使用がサポートされています。
  • 公開プレビュー版: この機能は、制限付きで一般公開されています。公開プレビュー版としてリリースされている機能は、本番環境コードで使用しないでください。この機能のサポートレベルと動作は、予告なく変更される可能性があります。
  • 限定公開プレビュー版: この機能は、承認済みの許可リストに登録されているユーザーのみが利用できます。限定公開プレビュー版としてリリースされている機能は、本番環境コードで使用しないでください。この機能のサポートレベルと動作は予告なく変更される可能性があります。

料金

Gemini 2.0 Flash の料金については、料金ページをご覧ください。

割り当てと上限

Gemini 2.0 Flash の一般提供機能は動的共有割り当てを使用します。

Gemini 2.0 Flash の Google 検索によるグラウンディングには、レート制限が適用されます。

2.0 Flash-Lite

Gemini 2.0 Flash-Lite は、Google 史上最も高速で費用対効果に優れた Flash モデルです。

Gemini 2.0 Flash-Lite には以下が含まれています。

  • マルチモーダル入力、テキスト出力
  • 100 万トークンの入力コンテキスト ウィンドウ
  • 8,000 トークンの出力コンテキスト ウィンドウ

2.0 Flash-Lite には、次の機能は含まれません

  • マルチモーダル出力の生成
  • Multimodal Live API とのインテグレーション
  • 思考モード
  • 組み込みツールの使用

Gen AI SDK で Gemini 2.0 Flash-Lite を使用するには、モデル ID gemini-2.0-flash-lite を使用します。

2.5 Pro

Gemini 2.5 Pro プレビューは、マルチモーダル理解、コーディング、世界中の知識に特に優れた、Google の最先端の推論 Gemini モデルです。Gemini 2.5 Pro プレビュー版は、Vertex AI でプレビュー モデルとして利用できます。

Gemini 2.5 Pro プレビュー版の機能:

  • 思考と推論
  • マルチモーダル入力
  • テキスト出力
  • プロンプト オプティマイザー
  • 生成制御機能
  • 関数呼び出し(コンポジション関数呼び出しを除く)
  • Google 検索によるグラウンディング
  • コードの実行
  • トークンのカウント

Gen AI SDK で Gemini 2.5 Pro プレビューを使用するには、モデル ID gemini-2.5-pro-preview-03-25 を使用します。

割り当てと上限

Gemini 2.5 Pro プレビュー版は、プレビュー期間中は 1 分あたり 20 クエリ(QPM)にレート制限されています。

Gemini 2.5 Pro プレビュー版の Google 検索によるグラウンディングには、レート制限が適用されます。

Google Gen AI SDK

Gen AI SDK は、Gemini Developer API と Vertex AI の Gemini API の両方を介して Gemini 2 への統合インターフェースを提供します。いくつかの例外を除き、1 つのプラットフォームで実行されるコードは両方のプラットフォームで実行されます。つまり、Developer API を使用してアプリケーションのプロトタイプを作成してから、コードを書き換えることなくアプリケーションを Vertex AI に移行できます。

この SDK は Python で一般提供されています。Go のサポートはプレビュー版です。Java と JavaScript のサポートは近日提供予定です。

SDK の使用を開始するには、次のようにします。

Gen AI SDK for Python

インストール

pip install --upgrade google-genai
詳細については、 SDK リファレンス ドキュメントをご覧ください。

Vertex AI で Gen AI SDK を使用するための環境変数を設定します。

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="How does AI work?",
)
print(response.text)
# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#
# Here's a simplified overview:
# ...