このページでは、AutoML Text と Gemini の違いについて説明します。このページは、AutoML Text のユーザーが Gemini の使用方法を理解する際に役立ちます。
ユースケースに該当する表で、ワークフローに影響を与える可能性のある変更を確認してください。
一般的な使用方法
この違いは、すべての Gemini ユーザーに適用されます。
オペレーション | AutoML Text | Gemini |
---|---|---|
トレーニング データ形式 | テキスト エンティティ抽出を除いて、CSV または JSON Lines ファイルを使用すると、インライン テキスト スニペットや TXT 型のドキュメントを参照できます。エンティティ抽出は JSON Lines ファイルのみをサポートします。 |
JSON Line ファイルのみを使用できます。ファイル内の各行は、単一のトレーニング例を表す必要があります。Gemini モデルのファインチューニング用にサンプル データセットをダウンロードできます。ファイルは Cloud Storage に保存する必要があります。 |
データセット アノテーション |
アノテーションは、AnnotationSet オブジェクトとしてグループ化されます。同じデータセットで複数のアノテーション セットを使用できます。 |
データセット アノテーションは Gemini では使用できません。 |
データセットのインポート | ML の使用値は、CSV のオプション列(データと同じ行)で指定するか、データと同じ JSON オブジェクトにある JSON Lines 内のタグとして指定します。ML の使用値を指定しない場合、データはトレーニング、テスト、検証用に自動的に分割されます。 感情分析の場合、CSV ファイルで各行の最後の列に感情の最大値を含める必要があります。 |
トレーニング用と検証用の 2 つの JSONL ファイルが必要です。検証ファイルは省略可能です。検証ファイルには 10~256 個のサンプルが必要です。 |
ストレージの費用 | データセットを作成すると、プロジェクトの Cloud Storage にデータが読み込まれます。このストレージに対して料金が発生します。詳細 | データセットを作成すると、プロジェクトの Cloud Storage にデータが読み込まれます。このストレージに対して料金が発生します。詳細 |
データラベル付け |
URL を使用してラベル付けの手順を指定します。アノテーションは Dataset オブジェクトの一部であり、API を使用して操作することはできません。 |
データラベル付けは Gemini では適用されません。 |
モデルのデプロイ |
オンライン予測で使用するリソースを提供するためのエンドポイント オブジェクトを作成する。作成したエンドポイントに、モデルをデプロイする。予測をリクエストするには、predict() メソッドを呼び出します。 |
Gemini では、ファインチューニング後にモデルが Vertex AI Model Registry に保存され、エンドポイントが自動的に作成されます。チューニング済みモデルのオンライン予測は、Python SDK、REST API、またはコンソールを使用してリクエストできます。予測をリクエストするには、まずチューニング済みのエンドポイントを取得し、次に generate_content() メソッドを使用します。 |
プロジェクト番号またはプロジェクト ID の使用 |
project-number と project-id はどちらも Vertex AI で動作します。 |
Gemini は project-id を使用します。 |
信頼スコア | AutoML Text は信頼スコアに対応しています。 | Gemini は信頼スコアに対応していません。 |
API のユーザー
API の詳細については、Vertex AI Generative AI Tuning API リファレンス ドキュメントをご覧ください。
オペレーションまたはエンティティ | AutoML Text | Gemini |
---|---|---|
モデルの作成 |
トレーニング ジョブを返す TrainingPipeline オブジェクトを作成します。 |
チューニング ジョブを返す教師ありファインチューニング ジョブを作成します。 |
クライアント ライブラリの使用 | API リソースごとに異なる API クライアントがあります。 | Python SDK、REST API、またはコンソールを使用して、Gemini の教師ありファインチューニング ジョブを作成できます。 |
予測のリクエスト |
予測をリクエストするには、エンドポイント リソースの predict() メソッドを呼び出します。 |
予測をリクエストするには、まずチューニング済みのエンドポイントを取得し、次に generate_content メソッドを使用します。 |
オンライン予測エンドポイント | 次のコマンドで、REGION は予測モデルのあるリージョンに置き換えます。REGION-aiplatform.googleapis.com 例:us-central1-aiplatform.googleapis.com |
次のコマンドで、TUNING_JOB_REGION はチューニング ジョブが実行されるリージョンに置き換えます。TUNING_JOB_REGION-aiplatform.googleapis.com 例:us-central1-aiplatform.googleapis.com |
スキーマと定義ファイル | 一部のリクエストとレスポンスのフィールドは、スキーマ ファイルと定義ファイルで定義されています。データ形式は、事前定義されたスキーマ ファイルを使用して定義します。これにより、API とデータ形式が柔軟になります。 | リクエスト本文、モデル パラメータ、レスポンス本文は、チューニングされていない Gemini モデルと同じです。サンプル リクエストをご覧ください。 |
ホスト名 | aiplatform.googleapis.com |
aiplatform.googleapis.com |
リージョン ホスト名 | 必須。例:us-central1-aiplatform.googleapis.com |
必須。例:us-central1-aiplatform.googleapis.com |
次のステップ
チューニングを開始するには、Gemini テキストモデルのモデル チューニングをご覧ください。