このページは Cloud Translation API によって翻訳されました。

Gemini モデルの教師ありファインチューニングについて

教師ありファインチューニングは、ラベル付きデータが利用可能な、明確に定義されたタスクがある場合に適しています。これは、言語やコンテンツが、大規模モデルのトレーニングに使用されたデータと大きく異なるドメイン固有のアプリケーションに特に有効です。テキスト、画像、音声、ドキュメントのデータ型をチューニングできます。

教師ありファインチューニングでは、ラベル付きデータセットを使用してモデルの動作を調整します。このプロセスでは、予測と実際のラベルの差を最小限に抑えるために、モデルの重みを調整します。たとえば、次のタイプのタスクでモデルのパフォーマンスを向上させることができます。

分類
要約
抽出型の質問応答
チャット

主なチューニングのユースケースについては、ブログ投稿「Hundreds of organizations are fine-tuning Gemini models.Here's their favorite use cases」をご覧ください。

詳細については、Gemini で教師ありファインチューニングをいつ使用するかをご覧ください。

サポートされているモデル

教師ありファインチューニングは、次の Gemini モデルでサポートされています。

思考をサポートするモデルでは、思考予算をオフまたは最小値に設定することをおすすめします。これにより、チューニングされたタスクのパフォーマンスを向上させ、費用を削減できます。教師ありファインチューニングでは、モデルはトレーニングデータから学習し、思考プロセスを省略します。そのため、チューニングされたモデルは、思考予算なしでチューニングされたタスクを効果的に実行できます。

制限事項

Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

仕様	値
入力トークンと出力トークンの最大トレーニング数	131,072
入力トークンと出力トークンの最大サービング数	ベースの Gemini モデルと同じ
検証データセットの最大サイズ	5,000 例
トレーニングデータセットファイルの最大サイズ	JSONL の場合は 1 GB
トレーニングデータセットの最大サイズ	テキストのみの例 100 万件、マルチモーダルの例 30 万件
アダプタサイズ	サポートされる値は 1、2、4、8、16 です。

Gemini 2.5 Pro

仕様	値
入力トークンと出力トークンの最大トレーニング数	131,072
入力トークンと出力トークンの最大サービング数	ベースの Gemini モデルと同じ
検証データセットの最大サイズ	5,000 例
トレーニングデータセットファイルの最大サイズ	JSONL の場合は 1 GB
トレーニングデータセットの最大サイズ	テキストのみの例 100 万件、マルチモーダルの例 30 万件
アダプタサイズ	サポートされる値は 1、2、4、8 です。

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

仕様	値
入力トークンと出力トークンの最大トレーニング数	131,072
入力トークンと出力トークンの最大サービング数	ベースの Gemini モデルと同じ
検証データセットの最大サイズ	5,000 例
トレーニングデータセットファイルの最大サイズ	JSONL の場合は 1 GB
トレーニングデータセットの最大サイズ	テキストのみの例 100 万件、マルチモーダルの例 30 万件
アダプタサイズ	サポートされる値は 1、2、4、8 です。

既知の問題

チューニングされた Gemini モデルに推論リクエストを送信するときに制御された生成を適用すると、チューニング時と推論時のデータ不整合により、モデルの品質が低下する可能性があります。チューニング中は生成制御が適用されないため、チューニングされたモデルは推論時に生成制御を適切に処理できません。教師ありファインチューニングでは、モデルを効果的にカスタマイズして構造化された出力を生成します。そのため、チューニング済みモデルで推論リクエストを行うときに、制御された生成を適用する必要はありません。

教師ありファインチューニングを使用するユースケース

基盤モデルは、期待される出力やタスクがプロンプトで明確かつ簡潔に定義可能で、プロンプトが常に期待される出力を生成する場合に適しています。一般的なパターンから逸脱するニッチな、または特定の情報をモデルに学習させるときは、そのモデルのチューニングを検討してください。たとえば、モデルのチューニングを使用して、モデルに次のことを学習させられます。

出力を生成するための特定の構造や形式
場合に応じて出力を簡潔または詳細にするなどの、特定の動作
入力のタイプに合わせてカスタマイズされた特定の出力

次の例は、プロンプトの指示だけではキャプチャが難しいユースケースです。

分類: 期待されるレスポンスが特定の単語やフレーズ。

プロンプト: 次のテキストを [ビジネス, エンターテイメント] のいずれかに分類してください。 Text: 投資ポートフォリオを多様化する

レスポンス: ビジネス

モデルをチューニングすると、モデルが冗長なレスポンスを生成しないようにできます。

要約: 要約は特定の形式に従っています。たとえば、チャットの概要で個人情報（PII）の削除が必要な場合があります。

プロンプト: 要約: Jessica: それはよかったです。タイムズスクウェアで会いましょう。 Alexander: 10 時に会いましょう。

レスポンス: #Person1 と #Person2 は、タイムズスクウェアで午前 10 時に会うことに合意しました。

この形式では、話者の名前を #Person1 と #Person2 で置き換えていますが、記述しにくく、基盤モデルではこのようなレスポンスが自然に得られない可能性があります。

抜粋された質問応答: 質問はコンテキストに関するもので、回答はコンテキストの部分文字列です。

プロンプト: コンテキスト: 最終氷期極大期（LGM）とその後の退氷期が続いた過去 21,000 年の間に、アマゾン熱帯雨林が大きく変貌したエビデンスが確認されました。質問: LGM は何の略ですか？

レスポンス: 最終氷期極大期

「最終氷期極大期」というレスポンスは、コンテキストから抜き出した特定のフレーズです。

チャット: ペルソナ、ロール、キャラクターに合わせて、モデルのレスポンスをカスタマイズする必要があります。

プロンプト: ユーザー: 今日の天気は？

レスポンス: アシスタント: Example Organization のバーチャルショップキーパーとしてお手伝いできるのは、購入と配送のみです。

次のような状況でも、モデルをチューニングできます。

プロンプトが、希望する結果を十分に一貫して生成しない。
タスクが複雑すぎて、プロンプトで定義できない。たとえば、プロンプトで表現するのが難しい動作について、モデルに動作を再現させることができます。
タスクについての直感が複雑で、プロンプトとして定式化するのが難しい。
少数ショットの例を削除して、コンテキストを短くしたい。

チューニングジョブのリージョンを構成する

変換済みデータセットやチューニング済みモデルなどのユーザーデータは、チューニングジョブのリージョンに保存されます。チューニング中、計算は使用可能なアクセラレータの他の US または EU リージョンにオフロードされる可能性があります。オフロードをユーザーが意識することはありません。

Vertex AI SDK を使用する場合は、初期化時にリージョンを指定できます。例:
```
import vertexai
vertexai.init(project='myproject', location='us-central1')
```
tuningJobs.create メソッドで POST リクエストを送信して教師ありファインチューニングジョブを作成する場合は、URL を使用してチューニングジョブが実行されるリージョンを指定します。たとえば、次の URL で、TUNING_JOB_REGION の両方のインスタンスを、ジョブが実行されるリージョンに置き換えてリージョンを指定します。
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
Google Cloud コンソールを使用している場合は、[モデルの詳細] ページの [リージョン] プルダウンフィールドでリージョン名を選択できます。これは、ベースモデルとチューニング済みモデル名を選択するページと同じです。

チューニング済みモデルの評価

チューニングされたモデルは、次の方法で評価できます。

チューニングと検証の指標: チューニングジョブの完了後に、チューニングと検証の指標を使用してチューニングされたモデルを評価します。
Gen AI Evaluation Service との統合評価（プレビュー）: チューニング中に Gen AI Evaluation Service を使用して評価を自動的に実行するように、チューニングジョブを構成します。Gen AI Evaluation Service とのチューニング統合では、次のインターフェース、モデル、リージョンがサポートされています。
- サポートされているインターフェース: Google Gen AI SDK と REST API。
- サポートされているモデル: gemini-2.5-pro、gemini-2.5-flash、gemini-2.5-flash-lite。
- サポートされているリージョン: サポートされているリージョンの一覧については、サポートされているリージョンをご覧ください。

割り当て

同時チューニングジョブの数に割り当てが適用されます。どのプロジェクトにも、少なくとも 1 つのチューニングジョブを実行するためのデフォルトの割り当てがあります。これはグローバル割り当てであり、利用可能なすべてのリージョンとサポートされているモデルで共有されます。複数のジョブを同時に実行する場合は、Global concurrent tuning jobs の追加の割り当てをリクエストする必要があります。

チューニング中に評価を自動的に実行するように Gen AI Evaluation Service を構成する場合は、Gen AI Evaluation Service の割り当てをご覧ください。

料金

Gemini の教師ありファインチューニングの料金については、Vertex AI の料金をご覧ください。

トレーニングトークンの数は、トレーニングデータセット内のトークンの数にエポック数を掛けて計算されます。チューニング後も、チューニング済みモデルの推論（予測リクエスト）費用は引き続き適用されます。推論の料金は、Gemini の各安定版で同じです。詳細については、利用可能な Gemini モデルの安定版をご覧ください。

チューニング中に自動的に実行するように Gen AI Evaluation Service を構成すると、評価はバッチ予測ジョブとして課金されます。詳細については、料金をご覧ください。

次のステップ

教師ありファインチューニングデータセットを準備する。
チューニング済み Gemini モデルのデプロイについて確認する。