Flex Start VM について

このドキュメントでは、Flex Start VM の概要について説明します。主な特性と、作成時に適用する要件と制限事項について詳しく説明します。

Flex Start VM は、Flex Start プロビジョニング モデルを使用して作成する仮想マシン(VM)インスタンスです。このモデルでは、Dynamic Workload Scheduler(DWS)を使用して、安全な容量プールから割引されたコンピューティング リソースをプロビジョニングするため、GPU などの需要の高いリソースを取得する可能性が高まります。Flex Start VM を作成すると、Compute Engine は特定の期間内にリクエストされたリソースを割り当てようとします。割り当てが成功すると、Flex Start VM は実行を開始し、最大 7 日間実行を継続します。

7 日を超えるリソースを必要とするワークロードや、より確実な容量確保が必要なワークロードの場合は、カレンダー モードで将来の予約リクエストを作成して、DWS 割引のメリットを享受できます。

Flex Start VM のユースケース

Flex Start VM は、次のような、いつでも開始できるワークロードの実行に最適です。

  • 小規模モデルの事前トレーニング

  • モデルのファインチューニング

  • ハイ パフォーマンス コンピューティング(HPC)シミュレーション

  • バッチ推論

Flex Start VM の主な特性

他のタイプの Compute Engine インスタンスと比較すると、Flex Start VM には次の特徴があります。

  • リソース割り当ての待機時間: Compute Engine がリクエストされたリソースを割り当てる前に、Flex Start VM を作成できます。ただし、VM は指定した期間内にリソースが使用可能になった場合にのみ起動します。リソースが使用できない場合、VM 作成リクエストは失敗します。

    詳細については、このドキュメントの Flex Start VM の待機時間をご覧ください。

  • 実行期間の制限: Flex Start VM は最大 7 日間実行できます。その後、Compute Engine は VM のプロパティで指定された終了アクションに基づいて、VM を自動的に停止または削除します。

    詳細については、このドキュメントの Flex Start VM の実行時間の制限をご覧ください。

  • Flex Start プロビジョニング モデル: Flex Start プロビジョニング モデルを使用して Flex Start VM を作成します。このプロビジョニング モデルでは、標準プロビジョニング モデルを使用して作成した VM と比較して、リソースの可用性が向上し、割引価格が適用されます。

    各プロビジョニング モデルの詳細については、Compute Engine インスタンスのプロビジョニング モデルをご覧ください。

Flex Start VM の待機時間

Flex Start VM を作成しても、VM はすぐに起動しません。Compute Engine は、特定の時間枠内にリクエストされたリソースの割り当てと VM の起動を試みます。リクエストされたリソースの割り当てが十分にあり、Compute Engine が待機時間の終了までにリソースを割り当てた場合、Flex Start VM は容量が使用可能になってから 2 分以内に起動します。それ以外の場合、VM 作成リクエストは失敗します。

待機時間は、VM の作成に使用するメソッドによって異なります。

スタンドアロン Flex Start VM の待機時間

スタンドアロン Flex Start VM を作成するには、requestValidForDuration フィールドを使用して待機時間を指定する必要があります。待機時間は 0 秒、または 90 秒から 7,200 秒(2 時間)までの間で設定できます。

ワークロードのゾーン要件に基づいて、Flex Start VM の作成リクエストの成功確率を高めるために、次の待機時間をおすすめします。

  • 厳格なゾーン要件: ワークロードで特定のゾーンに Flex Start VM を作成する必要がある場合は、requestValidForDuration フィールドを 90 秒以上(最大 2 時間)に設定することをおすすめします。待機時間を長くすると、リソースを取得できる可能性が高くなります。この間、VM は PENDING 状態のままです。

  • ゾーン要件なし: Flex Start VM がリージョン内のいずれのゾーンでも実行できる場合は、requestValidForDuration フィールドを 0 秒に設定することをおすすめします。この値は、Compute Engine が即時利用可能なリソースのみを割り当てることを指定します。リソースが利用できないためリクエストが失敗した場合は、別のゾーンで Flex Start VM の作成を試みてください。

Compute Engine がリソースの割り当てを試行している間に VM 作成リクエストを停止するには、Flex Start VM を削除します。

MIG のサイズ変更リクエストの待機時間

サイズ変更リクエストを使用して Flex Start VM をマネージド インスタンス グループ(MIG)に一括で追加すると、リクエストされたすべてのリソースをプロビジョニングするまでの待機時間は無期限になります。MIG サイズ変更リクエストを作成すると、リソースが利用可能になるまでリクエストは ACCEPTED 状態を維持します。リクエストされたリソースが利用可能になると、MIG サイズ変更リクエストの状態が SUCCEEDED に変わり、Compute Engine が Flex Start VM を作成します。

Compute Engine がリソースの割り当てを試行しているときに VM 作成リクエストを停止するには、MIG のサイズ変更リクエストをキャンセルします。詳細については、MIG でのサイズ変更リクエストについてをご覧ください。

Flex Start VM の実行時間の制限

Flex Start VM を作成する場合は、次のものを指定する必要があります。

  • VM の実行時間: VM の実行時間を指定する必要があります。実行期間は 10 分~7 日の範囲で指定できます。VM が不要になった場合は、必要に応じてスタンドアロン VM を停止または削除するか、MIG サイズ変更リクエストを使用して作成された VM を削除できます。

  • VM の終了アクション: 実行期間の終了時に Compute Engine が VM を自動的に停止するか削除するかを選択する必要があります。

割り当て

Flex Start VM を作成または再起動するには、リクエストされた vCPU、メモリ、アタッチされた GPU またはローカル SSD ディスクに十分なプリエンプティブル割り当てが必要です。

十分な割り当てがない状態で Flex Start VM を作成または再起動しようとすると、次のいずれかが発生します。

  • VM 作成リクエスト: 十分な割り当てを取得するまで、リクエストは保留状態のままです。待機時間が終了する前に必要な割り当てを取得しないと、リクエストは失敗します。

  • VM 再起動リクエスト: リクエストは直ちに失敗します。

料金

Flex Start VM の場合、次のような課金が発生します。

  • 従量課金制(PAYG)で支払います。VM のライフサイクルにおける料金の詳細については、料金をご覧ください。

  • A4、A3、A2、H4D の各マシンタイプの場合、vCPU、メモリ、接続されている GPU は割引料金で利用できます。サポートされている他のアクセラレータ最適化マシンタイプは、割引の対象外です。詳細については、DWS の料金をご覧ください。

制限事項

Flex Start VM には次の制限があります。

次のステップ

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル