Vertex AI 永続リソースは、カスタム トレーニング ジョブを実行するために作成できる長時間実行クラスタです。トレーニング ジョブの完了後、この永続リソースはユーザーが削除するまで、他のトレーニング ジョブを実行できます。永続リソースを使用すると、コンピューティング リソースの可用性を確保し、コンピューティング リソースの作成に必要なジョブの起動時間を短縮できます。永続リソースでは、カスタム トレーニング ジョブでサポートされているすべての VM と GPU がサポートされます。このページでは、永続リソースを使用するタイミングと、課金と割り当てについて説明します。
永続リソースを使用する場合
次のシナリオでは、永続リソースを使用することをおすすめします。
- 重要な ML ワークロードやピークシーズンに十分な容量を確保する必要がある。ジョブの完了後にトレーニング サービスがリソースを解放するカスタムジョブとは異なり、永続リソースは削除されるまで残ります。
- 同じジョブを複数回送信するため、同じ永続リソースでジョブを実行するときに、データとイメージのキャッシュを利用できる。
- 実際のトレーニング時間がジョブの起動時間よりも短い、短期的なトレーニング ジョブを多数実行する。
永続リソースを使用するタイミングと理由について詳しくは、ブログ投稿、Vertex AI Training で容量保証と起動時間の短縮を実現するをご覧ください。
お支払い情報
永続リソース上でジョブが実行されているかどうかにかかわらず、永続リソースが実行状態にある期間全体に対して課金されます。永続リソースプール内のインスタンスごとに、コア時間で課金されます。永続リソースで実行されるすべてのジョブが個別に課金されることはありません。永続リソースに対してのみ課金されます。
永続リソースの自動スケーリングを設定する場合は、プロビジョニングされたインスタンスに対してのみ料金が発生します。たとえば、min-replica-count
が 4
に設定されている場合、4
インスタンスは常にプロビジョニングされ、これは請求される最小金額です。ワークロードが増加すると、需要の増加に対応するためにリソースプールを 6
までスケールアップすることがあります。その後は、リソースプールが再びスケールダウンされるまで、6
プロビジョニングされたインスタンスに対して課金されます。アイドル状態のノードに対する課金を回避するには、永続リソースに自動スケーリングを使用するか、不要になったら削除します。料金の詳細については、Vertex AI の料金ページのカスタム トレーニング モデルをご覧ください。
割り当て
永続リソースはトレーニングの割り当てを使用するため、永続リソースの作成に十分な割り当てがあることを確認してください。割り当ての詳細については、トレーニングの割り当てと上限をご覧ください。