信頼できるラベル付きトレーニング ドキュメント項目のセットを含むデータセットを用意したら、カスタムモデルの作成とトレーニングを行うことができます。
モデルのトレーニングが完了するまで数時間かかることがあります。トレーニングに必要な時間は、データセットのサイズ、トレーニング項目の性質、モデルの複雑さなどの要素によって異なります。AutoML Natural Language は早期停止を使用して、過学習のない、可能な限り最適なモデルを生成します。
分類モデルの場合、平均トレーニング時間は約 6 時間、最長で 24 時間です。エンティティ抽出および感情分析モードの場合、平均トレーニング時間は 5 時間、最大で 6 時間です。
モデルのトレーニングが完了すると、プロジェクトに関連付けられたメールアドレスにメッセージが送信されます。
カスタムモデルの最大寿命は 18 か月です。この時間が経過した後も予測を続けるには、新しいモデルを作成してトレーニングする必要があります。
ウェブ UI
モデルをトレーニングする手順は次のとおりです。
AutoML Natural Language UI を開き、トレーニングするモデルのタイプに対応するボックスの [開始] を選択します。
[データセット] ページに移り、現在のプロジェクトでこれまでに作成されたデータセットのステータスが表示されます。別のプロジェクトのデータセットを使用してトレーニングするには、タイトルバーの右上にあるプルダウン リストからプロジェクトを選択します。
カスタムモデルのトレーニングに使用するデータセットを選択します。
選択したデータセットの表示名がタイトルバーに表示され、データセット内の個々のドキュメントがラベルと一緒にページに一覧表示されます。
データセットの確認を終えたら、タイトルバーのすぐ下にある [トレーニング] タブをクリックします。
このデータセットから最初のモデルをトレーニングする場合、トレーニング ページにデータセットの基本的な分析とデータセットがトレーニングに適しているかどうかのアドバイスが表示されます。AutoML Natural Language によって変更が提案される場合は、[テキスト アイテム] ページに戻ってドキュメントやラベルを追加することを検討してください。
このデータセットから他のモデルをトレーニングしたことがある場合、トレーニング ページにモデルの基本的な評価指標が表示されます。
[トレーニングを開始] をクリックします。
モデルの名前を入力します。
モデル名は最大 32 文字で、英字、数字、アンダースコアのみ使用できます。最初の文字は英字でなければなりません。
(省略可): 医療用語のエンティティ抽出モデルをトレーニングするには、[医療エンティティの抽出を有効にする] を選択します(ベータ版)。このオプションでは、医療データの処理に最適化され、ヘルスケア用に医療調整されたモデルを使用できます。詳しくは、AutoML Entity Extraction for Healthcare をご覧ください。
モデルを自動的にデプロイする場合は、[トレーニング完了後にモデルをデプロイする] のチェックボックスをオンにします。
[トレーニングを開始] をクリックします。
コードサンプル
分類
REST
リクエストのデータを使用する前に、次のように置き換えます。
- project-id: プロジェクト ID
- location-id: リソースのロケーション。グローバル ロケーションの場合は
us-central1
、EU の場合はeu
。 - dataset-id: データセット ID
HTTP メソッドと URL:
POST https://automl.googleapis.com/v1/projects/project-id/locations/location-id/models
JSON 本文のリクエスト:
{ "displayName": "test_model", "dataset_id": "dataset-id", "textClassificationModelMetadata": { } }
リクエストを送信するには、次のいずれかのオプションを展開します。
出力は次のようになります。オペレーション ID を使用して、タスクのステータスを取得できます。例については、オペレーションのステータスの取得をご覧ください。
{ "name": "projects/434039606874/locations/us-central1/operations/1979469554520652445", "metadata": { "@type": "type.googleapis.com/google.cloud.automl.v1beta1.OperationMetadata", "createTime": "2018-04-27T01:28:41.338120Z", "updateTime": "2018-04-27T01:28:41.338120Z", "cancellable": true } }
Python
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Java
Node.js
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Go
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
その他の言語
C#: クライアント ライブラリ ページの C# の設定手順を行ってから、.NET 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
PHP: クライアント ライブラリ ページの PHP の設定手順を行ってから、PHP 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
Ruby: クライアント ライブラリ ページの Ruby の設定手順を行ってから、Ruby 用の AutoML Natural Language のリファレンス ドキュメントをご覧ください。
エンティティの抽出
REST
リクエストのデータを使用する前に、次のように置き換えます。
- project-id: プロジェクト ID
- location-id: リソースのロケーション。グローバル ロケーションの場合は
us-central1
、EU の場合はeu
。 - dataset-id: データセット ID
- model-hint: 使用するベースライン モデル。
default
、healthcare
(ベータ版)など。
HTTP メソッドと URL:
POST https://automl.googleapis.com/v1/projects/project-id/locations/location-id/models
JSON 本文のリクエスト:
{ "displayName": "test_model", "dataset_id": "dataset-id", "textExtractionModelMetadata": { "model_hint": "model-hint" } }
リクエストを送信するには、次のいずれかのオプションを展開します。
出力は次のようになります。オペレーション ID を使用して、タスクのステータスを取得できます。例については、オペレーションのステータスの取得をご覧ください。
{ "name": "projects/434039606874/locations/us-central1/operations/1979469554520652445", "metadata": { "@type": "type.googleapis.com/google.cloud.automl.v1beta1.OperationMetadata", "createTime": "2018-04-27T01:28:41.338120Z", "updateTime": "2018-04-27T01:28:41.338120Z", "cancellable": true } }
Python
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Java
Node.js
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Go
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
その他の言語
C#: クライアント ライブラリ ページの C# の設定手順を行ってから、.NET 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
PHP: クライアント ライブラリ ページの PHP の設定手順を行ってから、PHP 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
Ruby: クライアント ライブラリ ページの Ruby の設定手順を行ってから、Ruby 用の AutoML Natural Language のリファレンス ドキュメントをご覧ください。
感情分析
REST
リクエストのデータを使用する前に、次のように置き換えます。
- project-id: プロジェクト ID
- location-id: リソースのロケーション。グローバル ロケーションの場合は
us-central1
、EU の場合はeu
。 - dataset-id: データセット ID
HTTP メソッドと URL:
POST https://automl.googleapis.com/v1/projects/project-id/locations/location-id/models
JSON 本文のリクエスト:
{ "displayName": "test_model", "dataset_id": "dataset-id", "textSentimentModelMetadata": { } }
リクエストを送信するには、次のいずれかのオプションを展開します。
出力は次のようになります。オペレーション ID を使用して、タスクのステータスを取得できます。例については、オペレーションのステータスの取得をご覧ください。
{ "name": "projects/434039606874/locations/us-central1/operations/1979469554520652445", "metadata": { "@type": "type.googleapis.com/google.cloud.automl.v1beta1.OperationMetadata", "createTime": "2018-04-27T01:28:41.338120Z", "updateTime": "2018-04-27T01:28:41.338120Z", "cancellable": true } }
Python
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Java
Node.js
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
Go
AutoML Natural Language への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。
その他の言語
C#: クライアント ライブラリ ページの C# の設定手順を行ってから、.NET 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
PHP: クライアント ライブラリ ページの PHP の設定手順を行ってから、PHP 用の AutoML Natural Language リファレンス ドキュメントをご覧ください。
Ruby: クライアント ライブラリ ページの Ruby の設定手順を行ってから、Ruby 用の AutoML Natural Language のリファレンス ドキュメントをご覧ください。