このページでは、教師あり学習を使用してドキュメント データで Gemini をファインチューニングするための前提条件と詳細な手順について説明します。
ユースケース
ファインチューニングを使用すると、強力な言語モデルを特定のニーズに合わせてカスタマイズできます。独自の PDF セットでファインチューニングすることでモデルのパフォーマンスを大幅に向上させることができる主なユースケースは次のとおりです。
- 社内ナレッジベース: 社内ドキュメントを AI を活用したナレッジベースに変換して、即時回答と分析情報を提供します。たとえば、営業担当者は過去のトレーニング資料から商品の仕様や価格の詳細にすぐにアクセスできます。
- 研究アシスタント: 研究論文、記事、書籍のコレクションを分析できる研究アシスタントを作成します。気候変動を研究している研究者は、科学論文を迅速に分析して海面上昇の傾向を特定したり、さまざまな緩和戦略の効果を評価したりできます。
- 法務または規制のコンプライアンス: 法律文書を微調整することで、契約書の審査を自動化し、潜在的な不整合やリスクのある箇所を報告できます。これにより、法務担当者はコンプライアンスを確保しながら、より高度なタスクに集中できます。
- レポートの自動生成: 複雑な財務レポートの分析、重要業績評価指標の抽出、関係者向けの概要の生成を自動化します。これにより、手動分析と比較して時間の節約とエラーのリスクの軽減が実現します。
- コンテンツの要約と分析: 長い PDF ドキュメントを要約し、重要な分析情報を抽出してトレンドを分析します。たとえば、市場調査チームは、顧客アンケートのコレクションを分析して、主なテーマと感情を特定できます。
- ドキュメントの比較とバージョン管理: ドキュメントの異なるバージョンを比較して変更を特定し、リビジョンを追跡します。これは、複数の作成者がドキュメントに貢献するコラボレーション環境で特に便利です。
制限事項
- 例あたりの最大ページ数: 16
- サンプルあたりの PDF ファイルの最大数: 4
- PDF ファイルの最大サイズ: 20 MB
ドキュメント理解の要件の詳細については、ドキュメント理解をご覧ください。
データセットのフォーマット
ドキュメント データセットの例を次に示します。
汎用形式の例については、Gemini 1.5 Pro と Gemini 1.5 Flash のデータセットの例をご覧ください。
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist.Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 1.5 Pro, a multimodal AI model developed by Google DeepMind. The report positions Gemini 1.5 Pro as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
次のステップ
- Gemini モデルのドキュメント理解機能の詳細については、ドキュメント理解の概要をご覧ください。
- チューニングを開始するには、教師ありファインチューニングを使用して Gemini モデルをチューニングするをご覧ください。
- 生成 AI ナレッジベースを構築するソリューションで教師ありファインチューニングを使用する方法について、ジャンプ スタート ソリューション: 生成 AI ナレッジベースを確認する。