この古いバージョンの AI Platform Prediction は非推奨になりました。2025 年 1 月 31 日を過ぎると Google Cloud で使用できなくなります。2025 年 1 月 31 日以降、すべてのモデル、関連するメタデータ、デプロイが削除されます。リソースを Vertex AI に移行することで、AI Platform にはない新しい機械学習機能を利用できます。

このページは Cloud Translation API によって翻訳されました。

評価指標の表示

Data Labeling Service は、評価ジョブの実行時に一連の評価指標を生成します。生成される指標は機械学習モデルの特性に応じて異なります。このガイドでは、評価指標の種類とその確認方法について説明します。

始める前に

指標を確認する前に、評価ジョブを作成して、そのジョブが実行されるまで待機する必要があります。デフォルトでは、評価ジョブは毎日午前 10 時（UTC）に実行されます。

ジョブが実行されると、最初にグラウンドトゥルースラベリングの審査担当者にデータが送信されます（このオプションを有効にしている場合）。次に、評価指標が計算されます。人手によるラベル付けは時間がかかります。ジョブで大量のデータがサンプリングされる場合、最初の評価指標が表示されるまでに数日かかる場合もあります。

モデルの平均適合率を比較する

AI Platform Prediction では、複数のモデルバージョンをグループ化し、1 つのモデルリソースにまとめることができます。1 つのモデルの各モデルバージョンは同じタスクを実行する必要がありますが、バージョンによってトレーニング方法を変えることは可能です。

1 つのモデルに複数のモデルバージョンが存在し、各バージョンに評価ジョブを作成している場合、モデルバージョンの平均適合率の変化をグラフで確認できます。

Google Cloud コンソールで AI Platform の [モデル] ページを開きます。

AI Platform の [モデル] ページに移動
モデルバージョンを比較するモデルの名前をクリックします。
[評価] タブをクリックします。

このページのグラフでは、各モデルの平均適合率の変化を比較できます。グラフの間隔は変更できます。

最近の実行でモデルバージョンの評価ジョブにエラーが発生している場合、そのエラーもこのページに表示されます。

特定のモデルバージョンの指標を表示する

評価指標の詳細を確認するには、1 つのモデルバージョンを表示します。

Google Cloud Console で AI Platform の [モデル] ページを開きます。

AI Platform の [モデル] ページに移動
目的のモデルバージョンを含むモデルの名前をクリックします。
目的のモデルバージョンの名前をクリックします。
[評価] タブをクリックします。

前のセクションで説明した比較表示と同様に、このページのグラフは平均適合率の変化を表します。モデルバージョンで最近実行された評価ジョブのエラーも表示されます。

個々の評価ジョブで生成された指標を表示するには、[日付を入力] フィールドに日付を入力します。[すべてのラベル] をクリックして、プルダウンメニューから特定のラベルを選択すると、表示される指標をさらに絞り込むことができます。以降のセクションでは、個別の評価ジョブで確認できる指標について説明します。

適合率と再現率の曲線

適合率と再現率の曲線では、分類しきい値を調整した場合に機械学習モデルの適合率と再現率がどのように変化しているのかを確認できます。

混同行列

混同行列には、グラウンドトゥルースラベルと予測ラベルのすべてのペアが表示されます。これにより、機械学習モデルが特定のモデルを誤認識するパターンを確認できます。

混同行列は、分類を行うモデルバージョンにのみ生成されます。

並べて比較

モデルバージョンで画像分類またはテキスト分類を行う場合、予測入力ごとに機械学習モデルの予測ラベルとグラウンドトゥルースラベルを並べて比較できます。

モデルバージョンで画像オブジェクトの検出を行う場合、機械学習モデルの予測境界ボックスとグラウンドトゥルースの境界ボックスを並べて比較できます。境界ボックスの上にマウスカーソルを置くと、関連するラベルが表示されます。

次のステップ

評価ジョブの更新、一時停止、削除の方法について学習する。

評価ジョブの作成

評価ジョブの更新、一時停止、削除