Vertex AI – Übersicht

Mit der Air-Gap-Appliance für Vertex AI auf Google Distributed Cloud (GDC) können Sie die Leistungsfähigkeit einer Plattform für maschinelles Lernen (ML) und künstliche Intelligenz (KI) auf Ihrem sicheren tragbaren Gerät nutzen. Die GDC-Air-Gap-Appliance bietet Zugriff auf eine ausgewählte Gruppe vortrainierter Vertex AI-APIs, die KI-Funktionen in Ihrer privaten Cloud-Lösung ermöglichen.

Wichtige Features

Vertex AI auf der GDC-Appliance mit Air Gap bietet Ihnen die folgenden Funktionen:

  • Air-gapped-Bereitstellung: Führen Sie Vertex AI-Dienste vollständig auf Ihrem tragbaren Gerät aus, um Datenhoheit und Compliance zu gewährleisten.
  • Vertraute Vertex AI-Umgebung: Nutzen Sie dieselben Tools und APIs wie bei Google Cloud, um die Entwicklung und Verwaltung zu vereinfachen.
  • Vorgefertigte Modelle und Algorithmen: Sie haben Zugriff auf eine Reihe vortrainierter Modelle für gängige Aufgaben im Bereich maschinelles Lernen, was die Wertschöpfung beschleunigt.

Verfügbare Dienste

Vertex AI auf der GDC-Air-Gap-Appliance bietet die folgenden vortrainierten Dienste:

Kapazitätsplanung und Computing-Anforderungen

Für jeden Vertex AI-Dienst sind unterschiedliche Computing-Ressourcen erforderlich. Die folgende Tabelle enthält die Anforderungen für die einzelnen vortrainierten Modelle:

Vortrainierte API Rechenressourcen Anforderungen an die GPU-Anzahl GPU-Arbeitsspeicheranforderungen
Optische Zeichenerkennung (Optical Character Recognition, OCR) GPU Eine einzelne A100-GPU mit 80 GB 40 GB
Speech-to-Text CPU Nicht zutreffend (nur CPU) Nicht zutreffend (nur CPU)
Vertex AI Translation GPU Eine einzelne A100-GPU mit 80 GB 50 GB

Die GDC-Appliance für Air-Gap-Umgebungen enthält eine einzelne NVIDIA A100-GPU mit 80 GB. Dadurch kann auf dem Gerät jeweils nur eine GPU-abhängige vortrainierte Vertex AI API ausgeführt werden. Wenn Sie versuchen, sowohl Vertex AI Translation als auch OCR zu aktivieren, schlägt die Aktivierung der zweiten API mit einer Fehlermeldung fehl, die auf unzureichende GPU-Ressourcen hinweist. Sie können Speech-to-Text jedoch zusammen mit Vertex AI Translation oder OCR ausführen, da für Speech-to-Text nur CPU-Ressourcen erforderlich sind.

Die folgenden Kapazitätslimits für die einzelnen vortrainierten Vertex AI-APIs können Ihnen helfen, die Anzahl der Appliance-Einheiten zu ermitteln, die für Ihre KI-/ML-Arbeitslasten erforderlich sind:

Vortrainierte API Kapazität pro Geräteeinheit
Optische Zeichenerkennung (Optical Character Recognition, OCR) Bis zu 30 Bilder pro Minute (ein Bild alle zwei Sekunden).
Speech-to-Text Bis zu sieben Minuten Audio transkribiert pro Minute (sieben Sekunden Audio transkribiert pro Sekunde).
Vertex AI Translation Bis zu 61.000 Zeichen pro Minute (1.024 Zeichen pro Sekunde).

Beachten Sie bei der Planung der Bereitstellung Folgendes:

  • Die Kapazitätslimits sind Näherungswerte und können nicht garantiert werden. Die tatsächliche Kapazität kann je nach Faktoren wie den folgenden variieren:

    • Komplexität der Eingabedaten (z. B. Sprache für die Übersetzung, Bildqualität für die OCR und Audioqualität für Speech-to-Text).
    • Spezifische Konfiguration der Appliance.
    • Gleichzeitige Nutzung anderer Dienste auf dem Gerät.
  • Es kann jeweils nur eine GPU-intensive API (Vertex AI Translation oder OCR) aktiv sein, da die GDC-Air-Gap-Appliance auf eine einzelne A100-GPU mit 80 GB beschränkt ist.

  • Schätzen Sie Ihre maximale Nutzung und das potenzielle zukünftige Wachstum.

  • Für anspruchsvolle Arbeitslasten, die einen höheren Durchsatz erfordern, sollten Sie mehrere Appliance-Einheiten bereitstellen.

In der folgenden Tabelle sind die Speicheranforderungen für jeden Vertex AI-Dienst auf der GDC-Appliance ohne Internetverbindung aufgeführt:

Komponente Speicherbedarf
OCR-Frontend 0,1 GB
OCR-Backend 5 GB
OCR-Extraktor 0,1 GB
Speech-to-Text-Frontend 0,1 GB
Speech-to-Text-Backend 1,5 GB
Vertex AI Translation-Frontend 0,7 GB
Vertex AI Translation-Backend 61,4 GB

Achten Sie darauf, dass Ihre Appliance ausreichend Speicherkapazität für die Vertex AI-Dienste hat, die Sie verwenden möchten.

Vorteile

Vertex AI auf der GDC-Appliance mit Air-Gap bietet folgende Vorteile:

  • Nahtlose Entwicklung: Verwenden Sie dieselben Tools, APIs und Workflows von Vertex AI auf Google Cloud, um die Entwicklung und Verwaltung intuitiv und effizient zu gestalten.
  • Höhere Sicherheit und mehr Datenschutz: Sie behalten die vollständige Kontrolle über Ihre Daten und halten die gesetzlichen Anforderungen ein.
  • Schnellere Wertschöpfung: Verwenden Sie vortrainierte Modelle für gängige Aufgaben im Bereich des maschinellen Lernens.
  • Optimierte MLOps: Profitieren Sie von robusten Machine Learning-Funktionen für die nahtlose KI-Integration in Ihrer Air-Gap-Umgebung.

Erste Schritte

So beginnen Sie mit Vertex AI auf der GDC-Appliance mit Air-Gap: