コンテンツに移動
AI & 機械学習

Vertex AI での迅速で安全なサービス提供に向けた予測プライベート エンドポイントの導入

2021年9月9日
Google Cloud Japan Team

※この投稿は米国時間 2021 年 8 月 26 日に、Google Cloud blog に投稿されたものの抄訳です。

機械学習モデルを提供する際の最大の課題の 1 つに、リアルタイムでの予測の実現があります。サイトでオンライン ショッピングするユーザーへの推奨商品案を生成する小売業者であっても、納品時刻を見積もる飲食品提供企業であっても、遅滞なく結果を提供できることが重要です。Vertex Prediction の新機能である Vertex AI 上のプライベート エンドポイントの発表が画期的である理由はこの点にあります。VPC ピアリングを使用すると、公共のインターネットでデータをやりとりすることなくエンドポイントと通信するプライベート接続を設定できます。これにより、オンライン予測のセキュリティ強化とレイテンシ低減が実現します。

VPC ネットワーク ピアリングの構成

プライベート エンドポイントを使用するには、まず VPC(Virtual Private Cloud)ネットワークと Vertex AI との接続を作成する必要があります。VPC ネットワークは、データセンターにある地域的な仮想サブネットワーク(サブネット)をすべてグローバル ネットワークで接続して構成したグローバル リソースで、物理ネットワークと同様の扱いで VPC ネットワークを考えることができます。異なる点は、VPC ネットワークが GCP 内部で仮想化されていることです。クラウド ネットワーキングになじみがなく、詳しくお知りになりたい場合は、VPC に関するこの紹介動画をご覧ください。

VPC ネットワーク ピアリングを使用すると、2 つの VPC ネットワーク間で内部 IP アドレスを接続できます。これらの IP アドレスが同じプロジェクトや同じ組織に属しているかどうかは問題ではありません。これにより、すべてのトラフィックが Google のネットワークの範囲に収まります。

Vertex Prediction によるモデルのデプロイ

Vertex Prediction は、機械学習モデルを提供するためのサーバーレスな手段です。クラウドでモデルをホストし、REST API を使用して予測を立てることができます。オンライン予測を必要とするユースケースでは、エンドポイントにモデルをデプロイする必要があります。エンドポイントへのモデルのデプロイでは、少ないレイテンシで予測を提供できるように、モデルに物理リソースを関連付けます。

エンドポイントにモデルをデプロイするときに、マシンタイプや自動スケーリングのパラメータなどの詳細情報を指定できます。また、現在ではプライベート エンドポイントの作成もできます。プライベート エンドポイントでは、予測のリクエストに応答して予測を提供するまでの時間を短縮できるほか、データが公共インターネットを通過しないので、セキュリティ上の利点が得られます。プライベート エンドポイントの導入に伴うオーバーヘッドは最小限なので、GKE 上や GCE 上での DIY 提供とほぼ同等のパフォーマンスが実現します。プライベート エンドポイントにデプロイしたモデルに対するペイロード サイズの上限もありません。

Vertex AI でのプライベート エンドポイントの作成は容易です。

Cloud Console の [モデル] セクションで、デプロイするモデルのリソースを選択します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/models-private-endpoint_2.max-1300x1300.jpg

次に [エンドポイントへのデプロイ] を選択します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/deployment-model-private-endpoints_2.max-900x900.jpg

コンソールの右側ウィンドウで、[アクセス] セクションに移動して [非公開] を選択します。デプロイのピアリング相手とする VPC ネットワークの完全な名前を追加する必要があります。

https://storage.googleapis.com/gweb-cloudblog-publish/images/private-deploy-private-endpoints_2.max-1000x1000.jpg

GCP 上にある他のマネージド サービスの多くは、Vertex Training、Cloud SQL、Firestore などの VPC ピアリングをサポートしています。エンドポイントは、これらに最近追加された VPC ピアリングです。

次のステップ

これで、VPC ピアリングの基本と、Vertex AI 上でプライベート エンドポイントを使用する方法を知ることができました。VPC の構成の詳細については、こちらの概要ガイドをご覧ください。また、Vertex AI を使用して ML のワークフローをサポートする方法については、こちらの紹介動画をご覧ください。これで、プライベート エンドポイントに ML モデルをデプロイして、きわめて高速な予測を実現できるようになります。

-デベロッパー アドボケイト Nikita Namjoshi

投稿先