画像のチューニング

このページでは、教師あり学習を使用して画像データで Gemini をファインチューニングするための前提条件と詳細な手順について説明します。

ユースケース

ファインチューニングにより、ベースの Gemini モデルを特定のタスクに適応させることができます。以下に、画像の使用例をいくつか示します。

商品カタログの強化: 画像から主要な属性（例: ブランド、色、サイズ）を抽出し、商品カタログを自動的に構築して充実させます。
画像のモデレーション: 画像内の不適切または有害なコンテンツを検出し、フラグを立てるためにモデルをファインチューニングして、より安全なオンラインエクスペリエンスを実現します。
外観検査: 画像内の特定の物体や欠陥を識別するようにモデルをトレーニングし、品質管理や検査プロセスを自動化します。
画像分類: 医用画像や衛星画像の分析など、特定のドメインに対する画像分類の精度を向上させます。
画像ベースのレコメンデーション: 画像を分析して、パーソナライズされたレコメンデーション（類似商品や補完品の提案など）を提供します。
テーブルコンテンツの抽出: 画像内のテーブルからデータを抽出し、スプレッドシートやデータベースなどの構造化された形式に変換します。

制限事項

例あたりの最大画像数: 30
画像ファイルの最大サイズ: 20 MB

画像サンプルの要件の詳細については、画像理解のページをご覧ください。

データセットのフォーマット

データセットの fileUri は、Cloud Storage バケット内のファイルの URI にすることも、一般公開されている HTTP または HTTPS URL にすることもできます。

汎用フォーマットの例については、Gemini のデータセットの例をご覧ください。

画像データセットの例を次に示します。

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "image/jpeg",
            "fileUri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/image/longcap100/100.jpeg"
            }
        }, 
        {
          "text": "Describe this image in detail that captures the essence of it."
        }
      ]
    }, 
    {
      "role": "model",
      "parts": [
        {
          "text": "A man stands on a road, wearing a blue denim jacket, tan pants, and white sneakers. He has his hands in his pockets and is wearing a white t-shirt under his jacket. The man's pants are cuffed, and his shoes are white. The road is dark grey, and the leaves are green. The man is standing in the shade, and the light is shining on the ground."
        }
      ]
    }
  ]
}

サンプルデータセット

次のサンプルデータセットを使用して、Gemini モデルのチューニング方法を学習できます。これらのデータセットを使用するには、テキストモデルの教師ありファインチューニングジョブの作成時に、該当するパラメータで URI を指定します。

サンプルチューニングデータセットを使用するには、ロケーションを次のように指定します。

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/image/sft_train_data.jsonl",

サンプル検証データセットを使用するには、ロケーションを次のように指定します。

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/image/sft_validation_data.jsonl",

次のステップ

Gemini の画像理解機能の詳細について、画像理解のドキュメントを確認する。
教師ありファインチューニングを使用して Gemini モデルをチューニングするを確認して、チューニングを開始する。
生成 AI ナレッジベースを構築するソリューションで教師ありファインチューニングを使用する方法について、ジャンプスタートソリューション: 生成 AI ナレッジベースを確認する。