Google Cloud パイプライン コンポーネントの概要

Google Cloud パイプライン コンポーネント(GCPC)SDK には、本番環境の品質、パフォーマンス、使いやすさを備えた一連のビルド済み Kubeflow パイプライン コンポーネントが備わっています。Google Cloud パイプライン コンポーネントを使用して、Kubeflow Pipelines を遵守する Vertex AI Pipelines やその他の ML パイプライン実行バックエンドで ML パイプラインを定義して実行できます。

たとえば、コンポーネントを使用して、以下の処理を行うことができます。

  • 新しいデータセットを作成し、さまざまな種類のデータ(画像、表形式、テキスト、動画)を読み込む。
  • データセットから Cloud Storage にデータをエクスポートする。
  • AutoML で、画像、表形式、テキスト、動画のデータを使用してモデルをトレーニングする。
  • カスタム コンテナまたは Python パッケージを使用して、カスタム トレーニング ジョブを実行する。
  • 既存のモデルを Vertex AI にアップロードしてバッチ予測をアップロードする。
  • 新しいエンドポイントを作成し、オンライン予測に使用するモデルをデプロイする。

また、ビルド済みの Google Cloud Pipeline コンポーネントは Vertex AI Pipelines でサポートされており、次のような利点があります。

  • デバッグが容易: コンポーネントから起動された基盤となるリソースを確認できるので、デバッグを容易に行うことができます。
  • 標準化されたアーティファクト タイプ: 入出力に標準のアーティファクト タイプを使用する一貫したインターフェースが提供されます。これらの標準アーティファクトは Vertex ML Metadata で追跡されるため、パイプラインのアーティファクトのリネージを簡単に分析できます。アーティファクトのリネージの詳細については、パイプライン アーティファクトのリネージの追跡をご覧ください。
  • 請求ラベルによるパイプライン費用について理解する: リソースラベルは、パイプライン実行の Google Cloud パイプライン コンポーネントにより、生成された Google Cloud サービスに自動的に伝達されます。BigQuery に Cloud Billing をエクスポートするときに合わせて課金ラベルを使用すると、パイプライン実行の費用を確認できます。ラベルを使用してパイプライン実行のコストを理解するには、パイプラインの実行費用を理解するをご覧ください。パイプラインの実行から Google Cloud パイプライン コンポーネントによって生成されたリソースにラベルが伝播される方法の詳細については、Vertex AI Pipelines によるリソースのラベル付けをご覧ください。
  • 費用対効果*: Vertex AI Pipelines は、コンテナを起動せずに Google Cloud リソースを起動することで、これらのコンポーネントの実行を最適化します。これにより、起動時のレイテンシが短縮され、ビジー待機中のコンテナの費用を抑えることができます。

次のステップ