Vertex AI の概要

Google Distributed Cloud(GDC)エアギャップ アプライアンス上の Vertex AI は、ML(機械学習)と AI(人工知能)プラットフォームの機能を安全なポータブル デバイスにもたらします。GDC エアギャップ アプライアンスは、事前トレーニング済みの Vertex AI API の一部にアクセスできるため、プライベート クラウド ソリューションで AI 機能を有効にできます。

主な機能

GDC エアギャップ アプライアンスの Vertex AI には、次の機能があります。

  • エアギャップ デプロイ: Vertex AI サービスをポータブル デバイス内で完全に実行し、データ主権とコンプライアンスを確保します。
  • 使い慣れた Vertex AI の操作性: Google Cloudと同じツールと API を活用して、開発と管理を簡素化します。
  • 事前構築済みのモデルとアルゴリズム: 一般的な ML タスクに対応した事前トレーニング済みモデルにアクセスして、価値実現までの時間を短縮できます。

利用可能なサービス

GDC のエアギャップ アプライアンス上の Vertex AI では、次の事前トレーニング済みサービスが提供されます。

キャパシティ プランニングとコンピューティング要件

Vertex AI サービスごとに異なるコンピューティング リソースが必要です。次の表に、各事前トレーニング済みモデルの要件を示します。

事前トレーニング済み API コンピューティング リソース GPU 数の要件 GPU メモリ要件
光学式文字認識(OCR) GPU 1 つの A100 80 GB GPU 40 GB
Speech-to-Text CPU 該当なし(CPU のみ) 該当なし(CPU のみ)
Vertex AI Translation GPU 1 つの A100 80 GB GPU 50 GB

GDC エアギャップ アプライアンスには、NVIDIA A100 80 GB GPU が 1 つ含まれています。これにより、デバイスは一度に 1 つの GPU 依存の Vertex AI 事前トレーニング済み API のみ実行できます。Vertex AI Translation と OCR の両方を有効にしようとすると、2 番目の API は有効にならず、GPU リソースが不足していることを示すエラー メッセージが表示されます。ただし、Speech-to-Text は CPU リソースのみを必要とするため、Vertex AI Translation または OCR とともに実行できます。

AI/ML ワークロードに必要なアプライアンス ユニットの数を判断するには、各 Vertex AI 事前トレーニング済み API の容量上限を確認してください。

事前トレーニング済み API アプライアンス ユニットあたりの容量
光学式文字認識(OCR) 1 分あたり最大 30 枚(2 秒ごとに 1 枚)。
Speech-to-Text 1 分あたり最大 7 分の音声の文字起こし(1 秒あたり 7 秒の音声の文字起こし)。
Vertex AI Translation 1 分あたり最大 61,000 文字(1 秒あたり 1,024 文字)。

デプロイを計画する際は、次のガイダンスを考慮してください。

  • 容量上限は概算であり、保証されるものではありません。実際の容量は、次のような要因によって異なる場合があります。

    • 入力データの複雑さ(翻訳の言語、OCR の画像品質、音声文字変換の音声の明瞭さなど)。
    • アプライアンスの特定の構成。
    • アプライアンスでの他のサービスの同時使用。
  • GDC エアギャップ アプライアンスは単一の A100 80 GB GPU に制限されているため、一度にアクティブにできる GPU を多用する API(Vertex AI Translation または OCR)は 1 つのみです。

  • ピーク時の使用量と将来の増加の可能性を見積もります。

  • 高いスループットを必要とする負荷の高いワークロードの場合は、複数のアプライアンス ユニットのデプロイを検討してください。

次の表に、GDC エアギャップ アプライアンス上の各 Vertex AI サービスのストレージ要件を示します。

コンポーネント ストレージ要件
OCR フロントエンド 0.1 GB
OCR バックエンド 5 GB
OCR エクストラクタ 0.1 GB
Speech-to-Text フロントエンド 0.1 GB
Speech-to-Text バックエンド 1.5 GB
Vertex AI Translation フロントエンド 0.7 GB
Vertex AI Translation バックエンド 61.4 GB

使用する Vertex AI サービスに対応できる十分なストレージ容量がアプライアンスにあることを確認します。

利点

GDC エアギャップ アプライアンス上の Vertex AI には、次のメリットがあります。

  • シームレスな開発エクスペリエンス: Google Cloudで Vertex AI の同じツール、API、ワークフローを使用することで、開発と管理を直感的かつ効率的に行うことができます。
  • 強化されたセキュリティとプライバシー: データを完全に制御し、規制要件を遵守します。
  • 価値創出までの時間を短縮: 一般的な ML タスクに事前トレーニング済みモデルを使用します。
  • MLOps の合理化: 強力な ML オペレーション機能を利用して、エアギャップ環境内で AI をシームレスに統合できます。

ご利用にあたって

GDC エアギャップ アプライアンスで Vertex AI を使用するには、次の操作を行います。