Auf dieser Seite finden Sie Informationen, die Sie vor dem Abonnieren von Provisioned Throughput berücksichtigen sollten, die Berechtigungen, die Sie zum Aufgeben oder Ansehen einer Bestellung von Provisioned Throughput benötigen, sowie eine Anleitung zum Aufgeben und Ansehen Ihrer Bestellungen.
Was Sie vor dem Kauf beachten sollten
Folgende Aspekte können Ihnen bei der Entscheidung helfen, ob Sie Provisioned Throughput erwerben möchten:
Sie können Ihre Bestellung nicht während der Laufzeit stornieren.
Der Kauf von Provisioned Throughput ist eine Zusicherung. Das bedeutet, dass Sie die Bestellung nicht während der Laufzeit stornieren können. Sie können jedoch die Anzahl der gekauften GSUs erhöhen. Wenn Sie versehentlich eine Zusicherung kaufen oder ein Problem mit Ihrer Konfiguration vorliegt, wenden Sie sich bitte an Ihren Google Cloud Account Manager.
Sie können Ihr Abo automatisch verlängern lassen.
Wenn Sie Ihre Bestellung aufgeben, können Sie festlegen, dass Ihr Abo am Ende der Laufzeit automatisch verlängert wird, oder es auslaufen lassen. Sie können die automatische Verlängerung abbrechen. Wenn Sie Ihr Abo kündigen möchten, bevor es automatisch verlängert wird, müssen Sie die automatische Verlängerung 30 Tage vor Beginn des nächsten Abozeitraums kündigen.
Sie können monatliche Abos so konfigurieren, dass sie jeden Monat automatisch verlängert werden. Bei wöchentlichen Laufzeiten ist keine automatische Verlängerung möglich.
Weitere Informationen finden Sie unter Bestellten Durchsatzauftrag ändern. Sie können sich auch an Ihren Google Cloud Kundenbetreuer wenden.
Sie können Ihre Modellversion oder Region innerhalb einer Frist ändern.
Nachdem Sie das Projekt, die Region, das Modell und die Version ausgewählt haben und Ihre Bestellung genehmigt und aktiviert wurde, wird Provisioned Throughput aktiviert. Sie können Ihr Google-Modell oder Ihre Google-Modellversion mit der Google Cloud Console in ein neues Google-Modell oder eine neue Google-Modellversion ändern.
Weitere Informationen finden Sie unter Bestellten Durchsatzauftrag ändern. Sie können sich auch an Ihren Google Cloud Account Manager wenden.
Änderungen werden nach dem Best-Effort-Prinzip bearbeitet und normalerweise innerhalb von 10 Arbeitstagen nach der ursprünglichen Anfrage umgesetzt. Wenn Sie Ihre Region oder Ihr Projekt ändern möchten, müssen Sie eine neue Bestellung aktivieren, bevor Sie die vorherige Bestellung stornieren.
Sie können nur zwischen Modellen desselben Anbieters wechseln. Sie können beispielsweise zwischen den Modellen von Google oder zwischen den Modellen von Partner A wechseln. Sie können jedoch nicht zwischen den Modellen von Google und Partner A wechseln.
Standardmäßig wird die Überschreitung als „Pay-as-you-go“ abgerechnet.
Wenn Ihr Durchsatz den bestellten Betrag für Provisioned Throughput übersteigt, werden Überschreitungen verarbeitet und als standardmäßige „Pay-as-you-go“-Abrechnung abgerechnet. Sie können Überschreitungen pro Anfrage steuern. Weitere Informationen finden Sie unter Zugewiesenen Durchsatz verwenden.
Informationen zu den Preisen finden Sie unter Vorab bereitgestellter Durchsatz.
Berechtigungen
Für die Verwendung des bereitgestellten Durchsatzes muss die folgende Rolle gewährt werden:
roles/aiplatform.provisionedThroughputAdmin
: Sie können auf Vertex AI-Ressourcen mit bereitgestelltem Durchsatz zugreifen.
Mit dieser Rolle erhalten Sie die folgenden Berechtigungen:
aiplatform.provisionedThroughputs.create
: Sie können einen Auftrag für Provisioned Throughput in einem Projekt einreichen.aiplatform.provisionedThroughputs.list
: Sie können sich alle Bestellungen für Provisioned Throughput in einem Projekt ansehen.
Provisioned Throughput bestellen
Bevor Sie eine Bestellung für die Verwendung von Imagen-Modellen aufgeben, reichen Sie das Antragsformular zur Gewährung von Berechtigungen ein, um Berechtigungen zu erhalten.
Bevor Sie eine Bestellung für MedLM-large-1.5 aufgeben, wenden Sie sich an Ihren Google Cloud Account Manager, um Zugriff anzufordern. Wenn Sie davon ausgehen,dass Ihre Anzahl der Abfragen pro Minute 30.000 überschreitet, können Sie die Leistung Ihrer Provisioned Throughput-Bestellung maximieren, indem Sie Ihr Standardkontingent für das Vertex AI-System erhöhen. Verwenden Sie dazu die folgenden Informationen:
- Dienst: Die Vertex AI API.
- Name:
Online prediction requests per minute per region
- Diensttyp: Ein Kontingent.
- Dimensionen: Die Region, in der Sie den bereitgestellten Durchsatz bestellt haben.
- Wert: Das ist das von Ihnen ausgewählte Traffic-Limit für die Online-Prognose.
So kaufen Sie Provisioned Throughput:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Klicken Sie auf Erstellen, um eine neue Bestellung zu starten.
- Geben Sie den Namen einer Bestellung ein.
- Wählen Sie das Modell aus.
- Wählen Sie die Region aus.
- Geben Sie die Anzahl der Skalierungseinheiten der generativen KI (GSUs) ein, die Sie erwerben müssen. Wenn Sie die Anzahl der GSUs schätzen müssen, klicken Sie auf das Schätzungstool.
- Wählen Sie Ihr Modell aus.
- Geben Sie die Anzahl der Abfragen pro Sekunde ein.
- Geben Sie die Anzahl der Eingabezeichen pro Abfrage ein.
- Geben Sie die Anzahl der Eingabebilder pro Abfrage ein.
- Geben Sie die Anzahl der Videosekunden pro Abfrage ein.
- Geben Sie die Anzahl der Audiosekunden pro Abfrage ein.
- Geben Sie die Anzahl der Ausgabezeichen pro Abfrage ein.
- Wenn Sie die Werte verwenden möchten, die Sie in das Schätzungstool eingegeben haben, klicken Sie auf Berechnung verwenden.
- Wählen Sie die Laufzeit aus.
Wenn Sie eine Woche auswählen, können Sie ein Startdatum und eine Uhrzeit innerhalb von zwei Wochen angeben, zu der eine Bestellung aufgegeben werden soll. Wenn Sie kein Startdatum und keine Uhrzeit angeben, bearbeiten wir die Bestellung, sobald wir sicher sein können, dass die Kapazität verfügbar ist. Die Bearbeitung der gewünschten Startdaten und ‑zeiten erfolgt auf Best-Effort-Basis. Es kann nicht garantiert werden, dass Bestellungen bis zu diesen Terminen erfüllt sind. Dies ist erst dann sicher, wenn der Bestellstatus auf Genehmigt gesetzt ist.
Wenn das von Ihnen angegebene Startdatum zu nah am aktuellen Datum liegt, wird Ihre Bestellung möglicherweise erst nach dem angegebenen Startdatum genehmigt und aktiviert. Das Enddatum bleibt dann sieben Tage nach dem Aktivierungsdatum.
- Wählen Sie die Option Verlängerung aus.
- Klicken Sie auf Weiter.
- Prüfen Sie im Abschnitt Zusammenfassung die Preis- und Durchsatzschätzungen für Ihre Bestellung. Lesen Sie die im Formular aufgeführten und verlinkten Nutzungsbedingungen.
- Klicken Sie auf Bestätigen, um die Bestellung abzuschließen.
Bestellung für bereitgestellten Durchsatz ändern
In dieser Tabelle wird beschrieben, wie Sie Ihre Bestellungen für bereitgestellten Durchsatz über die Google Cloud Console entsprechend dem Status Ihrer Bestellung und den vorhandenen Bedingungen ändern können. Wenn Sie Zugriff auf diese Vorschaufunktionen anfordern möchten, füllen Sie das Formular zur Zugriffssteuerung für bereitgestellten Durchsatz aus und reichen Sie es ein.
Bestellstatus | Aktion | Hinweis | Schritte in der Google Cloud Console |
---|---|---|---|
Überprüfung steht aus | Sie können Ihre Bestellung stornieren. |
Wenn Sie weitere Änderungen an Ihrer Bestellung vornehmen möchten, stornieren Sie die ausstehende Bestellung und geben Sie eine neue Bestellung auf. Wenn Sie mehrere Modelle haben, kann für jedes Modell jeweils nur eine ausstehende Bestellüberprüfung oder eine ausstehende Bestellung vorhanden sein. |
So stornierst du eine ausstehende Bestellung in der Google Cloud Console:
|
Aktiv |
Sie können die Anzahl der GSUs bei bestehenden Bestellungen erhöhen. Sie können automatische Verlängerungen aktivieren oder deaktivieren. Sie können das Modell oder die Modellversion ändern. |
Wenn diese beiden Bedingungen erfüllt sind, können Sie Ihre Bestellung nicht ändern:
|
So ändern Sie Ihre aktive Bestellung in der Google Cloud Console:
|
Bestellstatus prüfen
Nachdem Sie Ihre Bestellung für Provisioned Throughput eingereicht haben, kann der Bestellstatus einen der folgenden Werte haben:
- Überprüfung ausstehend: Sie haben Ihre Bestellung aufgegeben. Da die Genehmigung von der verfügbaren Kapazität für die Bereitstellung Ihrer Bestellung abhängt, wird Ihre Bestellung derzeit geprüft und genehmigt. Weitere Informationen zum Status Ihrer ausstehenden Bestellung erhalten Sie von Ihrem Google Cloud Kundenbetreuer.
- Genehmigt: Google hat Ihren Auftrag genehmigt.
- Aktiv: Google hat Ihre Bestellung aktiviert und die Abrechnung beginnt.
- Abgelaufen: Ihre Bestellung ist abgelaufen.
Bestellungen von Provisioned Throughput ansehen
So rufen Sie Ihre Bestellungen für Provisioned Throughput auf:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Wählen Sie die Region aus. Ihre Bestellliste wird angezeigt.