Vertex AI Service Level Agreement (SLA)

Letzte Änderung am 18. Mai 2021 | Vorherige Versionen

Während der Laufzeit der Vereinbarung, in der Google dem Kunden die Google Cloud Platform bereitstellt (je nach Fall die "Vereinbarung"), stellt der "abgedeckte Dienst" dem Kunden die folgenden prozentualen monatlichen Betriebszeiten zur Verfügung (das "Service Level Objective" oder "SLO"):

Abgedeckter Dienst Prozentsatz monatlicher Betriebszeit
Training, Bereitstellung und Batchvorhersage >= 99,9 %
AutoML Tabular und AutoML Image Online Prediction für Modelle, die auf 2 oder mehr Knoten bereitgestellt werden >= 99,9 %
AutoML Text Language Online Prediction >= 99,9 %
Custom Model Online Prediction für Modelle, die auf zwei oder mehr Knoten bereitgestellt werden >= 99,5 %

Sollte Google das SLO nicht erfüllen, während der Kunde seinen Verpflichtungen gemäß diesem SLA nachkommt, hat der Kunde Anspruch auf die unten beschriebenen Finanzgutschriften. Dieses SLA ist das einzige und ausschließliche Rechtsmittel des Kunden für den Fall, dass Google das SLO nicht erfüllt. Begriffe, die in diesem SLA verwendet werden, aber nicht innerhalb dieses SLA definiert sind, haben die in der Vereinbarung festgelegte Bedeutung. Wenn die Vereinbarung den Weiterverkauf oder die Bereitstellung der Google Cloud Platform im Rahmen eines Google Cloud-Partner- oder Reseller-Programms zulässt, beziehen sich alle Verweise auf den Kunden in diesem SLA auf Partner oder Reseller (je nach Fall). Finanzgutschriften gelten nur für die betroffenen Partner- oder Reseller-Aufträge im Rahmen der Vereinbarung.

Definitionen

Die folgenden Definitionen gelten für das SLA:

  • "Backoff-Anforderungen" bedeutet, dass beim Auftreten eines Fehlers der Kunde dafür verantwortlich ist, eine bestimmte Zeit zu warten, bevor eine weitere Anfrage gesendet wird. Nach dem ersten Fehler muss ein Backoff-Mindestintervall von einer Sekunde eingehalten werden, das sich bei jedem weiteren Fehler exponentiell bis zu einer Zeitspanne von 32 Sekunden verlängert.
  • "Abgedeckter Dienst" bezieht sich auf den entsprechenden Vertex AI-Dienst, der in der obigen Tabelle unter der Spalte "Abgedeckter Dienst" aufgeführt ist.
  • "Ausfallzeit" bedeutet eine Fehlerrate von mehr als 5 %. Die Ausfallzeit wird auf Grundlage der serverseitigen Fehlerhäufigkeit gemessen.
  • Ausfallzeitraum bezieht sich auf eine Ausfallzeit von einer oder mehreren aufeinanderfolgenden Minuten. Teilminuten oder intermittierende Ausfallzeiten mit Zeiträumen von weniger als einer Minute werden nicht zu den Ausfallzeiträumen hinzugerechnet.
  • "Fehlerrate" bezeichnet die Anzahl gültiger Anfragen, für die als Antwort der HTTP-Status 500 oder 503 zurückgegeben wird, geteilt durch die Gesamtzahl der gültigen Anfragen während dieses Zeitraums. Wiederholte identische Anfragen werden bei der Fehlerrate nicht berücksichtigt, außer sie erfüllen die Backoff-Anforderungen.
  • "Finanzgutschrift" bedeutet Folgendes für Training, Deployment und Batchvorhersage; AutoML Tabular and AutoML Image Online Prediction für Modelle, die auf zwei oder mehr Knoten bereitgestellt werden oder AutoML Text Online Prediction:

    Prozentsatz monatlicher Betriebszeit Prozentsatz der monatlichen Rechnung für den jeweiligen "abgedeckten Dienst", der das SLO nicht erfüllt und zukünftigen monatlichen Rechnungen des Kunden gutgeschrieben wird
    99,0 % bis < 99,9 % 10 %
    95 % bis < 99 % 25 %
    < 95 % 50 %
  • "Finanzgutschrift" bedeutet Folgendes für Custom Model Online Prediction für Modelle, die auf zwei oder mehr Knoten bereitgestellt werden:

    Prozentsatz monatlicher Betriebszeit Prozentsatz der monatlichen Rechnung für den jeweiligen "abgedeckten Dienst", der das SLO nicht erfüllt und zukünftigen monatlichen Rechnungen des Kunden gutgeschrieben wird
    99 % bis < 99,5 % 10 %
    95 % bis < 99 % 25 %
    < 95 % 50 %
  • Der "Prozentsatz monatlicher Betriebszeit" errechnet sich aus der Gesamtzahl der Minuten in einem Monat, abzüglich der Ausfallzeit in Minuten aller Ausfallzeiträume in einem Monat, dividiert durch die Gesamtzahl der Minuten in einem Monat.

  • "Gültige Anfragen" sind Anfragen, die der Dokumentation entsprechen und die normalerweise eine fehlerfreie Antwort zur Folge haben.

Kunde muss Finanzgutschrift anfordern

Zum Erhalt der oben aufgeführten Finanzgutschriften muss der Kunde den technischen Support von Google innerhalb von 30 Tagen ab dem Zeitpunkt benachrichtigen, an dem der Kunde Anspruch auf eine Finanzgutschrift hat. Der Kunde muss Google außerdem identifizierende Informationen (z. B. Projekt-ID und Job-IDs) sowie Datum und Uhrzeit des Auftretens dieser Fehler zur Verfügung stellen. Wenn der Kunde diesen Anforderungen nicht nachkommt, verfällt sein Anspruch auf eine Finanzgutschrift.

Maximale Finanzgutschrift

Der Gesamtbetrag von Finanzgutschriften, die Google dem Kunden für alle Ausfallzeiten gewährt, die in einem einzelnen Abrechnungsmonat entstehen, beträgt maximal 50 % des Betrags, der dem Kunden für den abgedeckten Dienst im jeweiligen Monat berechnet wird. Finanzgutschriften erfolgen in Form einer monetären Gutschrift für die zukünftige Nutzung des Dienstes. Sie werden innerhalb von 60 Tagen nach ihrer Anforderung durchgeführt.

SLA-Ausschlüsse

Das SLA gilt nicht für (a) Funktionen, die als allgemeine Verfügbarkeit ausgewiesen sind (sofern in der zugehörigen Dokumentation keine anderen Angaben gemacht werden), (b) Funktionen, die (in der zugehörigen Dokumentation) aus dem SLA ausgeschlossen sind, oder (c) Fehler, (i) die durch Faktoren verursacht werden, die außerhalb der Kontrolle von Google liegen, (ii) die durch Software oder Hardware des Kunden und/oder Software oder Hardware von Drittanbietern verursacht werden, (iii) die durch Missbrauch oder andere Verhaltensweisen entstanden sind, die gegen die Vereinbarung verstoßen, oder (iv) die auf Kontingente zurückzuführen sind, die vom System angewendet wurden und/oder in der Admin-Konsole aufgeführt sind, oder (v) die sich daraus ergeben, dass der Kunde den "abgedeckten Dienst" nicht in Übereinstimmung mit der Dokumentation verwendet, einschließlich, aber nicht beschränkt auf ungültige Anfragefelder, nicht autorisierte Nutzer oder unzugängliche Daten, oder die Nutzung eines Modells, das die in der jeweiligen Dokumentation empfohlene Modelllebensdauer überschritten hat.

Vorherige Versionen