Für die einzelnen Vertex AI-Dienste sind unterschiedliche Computing-Ressourcen erforderlich, einschließlich Grafikprozessoren (GPUs), wie unter Kapazitätsplanung und Computing-Anforderungen beschrieben. Auf dieser Seite wird beschrieben, wie Sie GPU-Ressourcen bereitstellen, um KI- und ML-Arbeitslasten in einer GPU-Umgebung auszuführen. Auf dieser Seite wird auch beschrieben, wie Sie die vortrainierten Vertex AI APIs auf der Air-Gap-Appliance von Google Distributed Cloud (GDC) aktivieren, damit Sie mit der Implementierung von Vertex AI-Funktionen beginnen können.
Für die meisten Aufgaben zum Konfigurieren von GPU-Ressourcen und zum Aktivieren oder Deaktivieren von vortrainierten Vertex AI-APIs ist Administratorzugriff erforderlich. Wenn Sie nicht die erforderlichen Berechtigungen haben, bitten Sie Ihren Administrator, GPUs und die vortrainierten Vertex AI-APIs in Ihrem Namen zu aktivieren.
Vertex AI auf der GDC-Appliance mit Air Gap umfasst drei APIs, eine für jedes der vortrainierten Modelle. Weitere Informationen zu diesen vortrainierten Modellen finden Sie in der folgenden Dokumentation:
- Optische Zeichenerkennung (OCR): Informationen zu Funktionen zur Zeichenerkennung
- Speech-to-Text: Informationen zu Spracherkennungsfunktionen
- Vertex AI Translation: Informationen zu Übersetzungsfunktionen
In der GDC-Konsole können Sie die Endpunkte der vortrainierten Vertex AI-APIs aktivieren, deaktivieren und ansehen.
Hinweise
Bitten Sie Ihren IAM-Administrator der Organisation oder Ihren IAM-Administrator des Projekts, Ihnen die Rolle „AI Platform-Administrator“ (ai-platform-admin
) im Projekt-Namespace zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Aktivieren vortrainierter APIs benötigen.
Informationen zu dieser Rolle finden Sie unter IAM-Berechtigungen vorbereiten. Informationen zum Zuweisen von Berechtigungen zu einem Subjekt finden Sie unter Zugriff gewähren und widerrufen.
Führen Sie die folgenden Schritte aus, um GPUs bereitzustellen, bevor Sie die vortrainierten APIs aktivieren:
- Projekt für die Verwendung von Vertex AI einrichten
- Prüfen Sie, ob für Ihr Projekt die entsprechende Ingress-Kommunikation konfiguriert ist.
- GPU-Arbeitslasten verwalten
- Melden Sie sich in der GDC-Konsole an. Wenn Sie sich nicht anmelden können, lesen Sie den Abschnitt Gerät wiederherstellen, wenn der Identitätsanbieter nicht verfügbar ist.
Vortrainierte APIs aktivieren
Sie können die vortrainierten APIs für OCR, Speech-to-Text und Vertex AI Translation über die GDC-Konsole aktivieren.
Nachdem Sie die Voraussetzungen erfüllt haben, gehen Sie so vor, um die vortrainierten APIs zu aktivieren:
- Melden Sie sich in der GDC-Konsole an.
- Klicken Sie im Navigationsmenü auf Vertex AI > Vortrainierte APIs.
Klicken Sie auf der Seite Vortrainierte APIs bei einem bestimmten Dienst auf Aktivieren, um die entsprechende API zu aktivieren.
Klicken Sie im Bestätigungsdialogfeld auf Aktivieren. Eine Fortschrittsmeldung wird angezeigt.
Die Dauer der Aktivierung variiert. Das kann 15 bis 45 Minuten dauern.
Wenn Sie den Status der vortrainierten APIs aufrufen möchten, sehen Sie sich den Dienststatus und die Endpunkte an.
Vortrainierte APIs deaktivieren
Sie können die vortrainierten APIs für OCR, Speech-to-Text und Vertex AI Translation über die GDC-Konsole deaktivieren.
Nachdem Sie die Voraussetzungen erfüllt haben, gehen Sie so vor, um die vortrainierten APIs zu deaktivieren:
- Melden Sie sich in der GDC-Konsole an.
- Klicken Sie im Navigationsmenü auf Vertex AI > Vortrainierte APIs.
Klicken Sie auf der Seite Vortrainierte APIs bei einem bestimmten Dienst auf Deaktivieren, um die entsprechende API zu deaktivieren.
Geben Sie im Bestätigungsdialogfeld
disable
in das Textfeld ein, um zu bestätigen, dass Sie diese Aktion ausführen möchten. Klicken Sie dann auf Deaktivieren. Eine Fortschrittsmeldung wird angezeigt.
Wenn Sie den Status der vortrainierten APIs aufrufen möchten, sehen Sie sich den Dienststatus und die Endpunkte an.