Kontingente und Limits

In diesem Dokument werden die quotas und quotas aufgeführt, die für Media CDN gelten.

Ein Kontingent schränkt ein, wie viel von einer bestimmten gemeinsam genutzten Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen kann, einschließlich Hardware, Software und Netzwerkkomponenten. Daher sind Kontingente Teil eines Systems, das Folgendes tut:

  • Ihre Nutzung oder Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen.
  • Ihren Verbrauch dieser Ressourcen einschränken, um u. a. für Fairness zu sorgen und Nutzungsspitzen zu reduzieren.
  • Konfigurationen verwalten, die automatisch vorgeschriebene Einschränkungen erzwingen.
  • Möglichkeit, das Kontingent anzufordern oder zu ändern.

Wenn ein Kontingentlimit überschritten wird, blockiert das System in den meisten Fällen den Zugriff auf die entsprechende Google-Ressource und die Aufgabe, die Sie ausführen möchten, schlägt fehl. In den meisten Fällen gelten Kontingente für jedes Google Cloud-Projekt und werden von allen Anwendungen und IP-Adressen geteilt, die dieses Google Cloud-Projekt verwenden.

Es gibt auch Limits für Media CDN-Ressourcen. Diese Limits stehen nicht im Zusammenhang mit dem Kontingentsystem. Limits können nur geändert werden, wenn dies angegeben ist.

Limits

Die folgenden Limits gelten für Media CDN.

Konfiguration

Element Limits Notes
Maximale Anzahl von EdgeCacheService 20 pro Projekt Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten.
Maximale Anzahl von EdgeCacheOrigin 30 pro Projekt Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten.
Maximale Anzahl von EdgeCacheKeyset 10 pro Projekt Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten.
Maximale Anzahl von RouteRules pro EdgeCacheService 2000

Jede EdgeCacheService kann bis zu 10 PathMatchers definieren und jede PathMatcher kann bis zu 200 RouteRules definieren.

Dieses Limit kann nicht erhöht werden.

Maximale SSL-Zertifikate pro Dienst 5 Dieses Limit kann nicht erhöht werden. Weitere Informationen finden Sie unter SSL-Zertifikate pro Projekt.
Maximale Anzahl öffentlicher Schlüssel pro EdgeCacheKeyset 3 Dieses Limit kann nicht erhöht werden. Mehrere Schlüssel in einem Schlüsselsatz wurden für die Schlüsselrotation entwickelt: Sie sollten ältere und nicht verwendete Schlüssel im Laufe der Zeit entfernen.
Maximale Anzahl für Validierungen freigegebener Schlüssel pro EdgeCacheKeyset 3 Dieses Limit kann nicht erhöht werden. Mehrere Schlüssel in einem Schlüsselsatz wurden für die Schlüsselrotation entwickelt: Sie sollten ältere und nicht verwendete Schlüssel im Laufe der Zeit entfernen.

HTTP-Header, -Anfragen und -Antworten

Element Limits Notes
Maximale Anfrageheader-Größe Ca. 11 KiB Dieses Limit kann nicht erhöht werden.

Die Anfrage-URL und der Anfrageheader dürfen zusammen maximal 15 KB groß sein.

Anfragen werden mit einer HTTP 431-Antwort für HTTP/1.1-Verbindungen abgelehnt.

HTTP/2-Verbindungen werden ohne das Schreiben eines Antwortcodes geschlossen.

Diese Anfragen werden mit dem statusDetails headers_too_long protokolliert, wenn Logging aktiviert ist.

Maximale Größe des Anfragetexts 16 KiB Anfragen, deren Text das Limit überschreitet, werden mit dem HTTP-Statuscode 413 Content Too Large abgelehnt.
Maximale Größe des Antwortheaders Ca. 128 KiB Dieses Limit kann nicht erhöht werden.

Ursprungsantworten mit Headern, die dieses Limit überschreiten, führen dazu, dass ein HTTP 502 an den Client gesendet wird. Diese werden mit dem statusDetails backend_response_headers_too_long protokolliert, wenn Logging aktiviert ist.

Maximale Größe von im Cache speicherbaren Objekten 100 GiB Dieses Limit kann nicht erhöht werden.

Dies ist die maximale Größe von Objekten am Ursprung, die Media CDN im Cache speichern kann. Größere Objekte werden als nicht im Cache speicherbar behandelt.

Maximale Antwortgröße, die nicht im Cache gespeichert werden kann 500 MiB Dieses Limit kann nicht erhöht werden.

Dies ist die maximale Anzahl von Byte in einem Antworttext, die Media CDN über einen Proxy weiterleitet, wenn ein Objekt nicht im Cache gespeichert werden kann. Nicht im Cache speicherbare Antworten werden nach Erreichen des Limits abgeschnitten.

Umwandlung der Header in Kleinbuchstaben Immer, für Media CDN Media CDN folgt den HTTP/2-Konventionen für Groß- und Kleinschreibung von Anfrage- und Antwortheadern.

Alle Header werden unabhängig vom verwendeten Protokoll in Kleinbuchstaben umgewandelt.

Aus Host wird beispielsweise host und aus Keep-Alive wird keep-alive.

Die Groß- und Kleinschreibung von Headerwerten wird nicht geändert.

Limits für API-Anfrageraten

Wenn Sie ein höheres Ratenlimit für API-Anfragen benötigen, können Sie die aktuelle Verwendung prüfen und eine Erhöhung beantragen.

Element Limits
Entwertungen 10 pro Minute pro EdgeCacheService
Alle Aufrufe, die nicht im Namespace networkservices enthalten sind 1.200 Aufrufe pro Minute und Projekt
Schreibgeschützt: GetEdgeCache*, ListEdgeCache* 100 pro Minute und Projekt
Lesen/Schreiben: alles im Namespace networkservices, das nicht als schreibgeschützt markiert ist 100 pro Minute und Projekt

Client-Zeitlimits

Zeitlimit Maximale Dauer Antwortcode Beschreibung
Maximum request duration 5 Minuten HTTP 408 (Request Timeout) Die maximale Dauer für die Antwort auf eine einzelne Anfrage.
Header timeout 10 Sekunden HTTP 408 (Request Timeout) Wie lange der Client benötigen darf, um den vollständigen Satz von Anfrageheadern zu senden.

Ursprungszeitüberschreitungen

  • connectTimeout und maxAttemptsTimeout begrenzen, wie lange Media CDN braucht, um eine verwendbare Antwort zu finden.

    Beide Zeitlimits umfassen die Zeit, die der Ursprung benötigt, um Header zurückzugeben und zu bestimmen, ob ein Failover oder eine Weiterleitung verwendet werden soll. connectTimeout gilt unabhängig für jeden Ursprungsversuch, während maxAttemptsTimeout die Zeit einschließt, die für die Verbindung bei allen Ursprungsversuchen erforderlich ist, einschließlich Failovers und Weiterleitungen. Das Folgen einer Weiterleitung zählt als zusätzlicher Versuch, eine Verbindung zum Ursprung herzustellen, und wird auf die für den konfigurierten Ursprung festgelegten maxAttempts angerechnet.

    Wenn Media CDN auf eine Antwort ohne Weiterleitung stößt, z. B. von einer Weiterleitungs- oder Failover-Quelle, gelten die Werte readTimeout und responseTimeout. Weitergeleitete Ursprünge verwenden die Werte connectTimeout, readTimeout und responseTimeout, die für den EdgeCacheOrigin konfiguriert sind, der auf die Weiterleitung gestoßen ist.

  • Mit responseTimeout und readTimeout wird gesteuert, wie lange eine gestreamte Antwort dauern kann. Nachdem Media CDN feststellt, dass eine vorgelagerte Antwort verwendet wird, sind weder connectTimeout noch maxAttemptsTimeout relevant. Ab diesem Zeitpunkt treten readTimeout und responseTimeout in Kraft.

Media CDN führt maximal vier Ursprungsversuche über alle Ursprünge hinweg aus, unabhängig von den von jedem EdgeCacheOrigin festgelegten maxAttempts. Media CDN verwendet den Wert maxAttemptsTimeout aus dem primären EdgeCacheOrigin. Die Zeitlimitwerte pro Versuch (connectTimeout, readTimeout und responseTimeout) werden für den EdgeCacheOrigin jedes Versuchs konfiguriert.

In der folgenden Tabelle werden die Zeitlimitfelder beschrieben:

Feld Standard Beschreibung
connectTimeout 5 Sekunden

Der maximale Zeitraum, den Media CDN ab dem Starten der Anfrage an den Ursprung benötigen darf, bis Media CDN bestimmt, ob die Antwort verwendbar ist. In der Praxis deckt connectTimeout den Zeitraum ab, der mit dem Erstellen der Anfrage beginnt und in der Folge das Ausführen von DNS-Lookups und TLS-Handshakes, das Herstellen einer TCP/QUIC-Verbindung und schließlich das Abrufen der Antwortheader umfasst, die den HTTP-Statuscode enthalten.

Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 15 Sekunden sein.

maxAttemptsTimeout 15 Sekunden

Die maximale Zeit für alle Verbindungsversuche zum Ursprung, einschließlich Failover-Ursprünge, bevor ein Fehler an den Client zurückgegeben wird. Wenn das Zeitlimit erreicht ist, bevor eine Antwort zurückgegeben wird, wird ein HTTP 504 zurückgegeben.

Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 30 Sekunden sein.

Diese Einstellung definiert die Gesamtdauer für alle Ursprungsverbindungsversuche, einschließlich Failover-Ursprünge, um die Gesamtzeit zu begrenzen, die Clients warten müssen, bis das Streamen von Inhalten startet. Es wird nur der erste maxAttemptsTimeout-Wert verwendet, wobei der erste durch den für die angegebene Route konfigurierten Ursprung definiert wird.

readTimeout 15 Sekunden

Die maximale Wartezeit zwischen Lesevorgängen einer einzelnen HTTP-Antwort. Das readTimeout wird durch das responseTimeout begrenzt. Alle Lesevorgänge der HTTP-Antwort müssen innerhalb der durch das responseTimeout festgelegten Frist abgeschlossen werden. Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 30 Sekunden sein. Wenn dieses Zeitlimit erreicht ist, bevor die Antwort abgeschlossen ist, wird die Antwort abgeschnitten und protokolliert.

responseTimeout 30 Sekunden

Die maximale Dauer, bis eine Antwort abgeschlossen sein muss.

Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 120 Sekunden sein.

Die Dauer wird ab dem Zeitpunkt gemessen, an dem die ersten Textbyte empfangen werden. Wenn dieses Zeitlimit erreicht ist, bevor die Antwort abgeschlossen ist, wird die Antwort abgeschnitten und protokolliert.

Kontingente verwalten

MitMedia CDN werden Kontingente für die Ressourcennutzung aus verschiedenen Gründen festgelegt. Kontingente schützen unter anderem die gesamte Google Cloud -Community vor unerwarteten Nutzungsspitzen. Außerdem unterstützen Kontingente Nutzer, die Google Cloud mit der kostenlosen Stufe prüfen, dabei, im Rahmen der Testversion zu verbleiben.

Alle Projekte beginnen mit den gleichen Kontingenten, die Sie ändern können, indem Sie zusätzliche Kontingente anfordern. Einige Kontingente könnten entsprechend Ihrer Nutzung eines Produkts automatisch erhöht werden.

Berechtigungen

Zur Anzeige von Kontingenten oder zur Anforderung von Kontingenterhöhungen benötigen IAM-Hauptkonten (Identity and Access Management) eine der folgenden Rollen:

Aufgabe Erforderliche Rolle
Kontingente für ein Projekt prüfen Beispiele:
Kontingente ändern, zusätzliche Kontingente anfordern Beispiele:
  • Project Owner (roles/owner)
  • Project Editor (roles/editor)
  • Quota Administrator (roles/servicemanagement.quotaAdmin)
  • Eine benutzerdefinierte Rolle mit der Berechtigung serviceusage.quotas.update

Kontingent prüfen

Console

  1. Öffnen Sie in der Google Cloud Console die Seite Kontingente.

    Kontingente aufrufen

  2. Mit dem Feld Tabelle filtern können Sie nach den zu aktualisierenden Kontingenten suchen. Wenn Sie den Namen des Kontingents nicht kennen, verwenden Sie stattdessen die Links auf dieser Seite.

gcloud

Führen Sie mit der Google Cloud CLI den folgenden Befehl aus, um Ihre Kontingente zu prüfen. Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID:

      gcloud compute project-info describe --project PROJECT_ID

Mit dem folgenden Befehl prüfen Sie das genutzte Kontingent in einer Region:

    gcloud compute regions describe example-region
    

Fehler beim Überschreiten Ihres Kontingents

Wenn Sie ein Kontingent mit einem gcloud-Befehl überschreiten, gibt gcloud eine quota exceeded-Fehlermeldung aus und liefert den Exit-Code 1.

Wenn Sie ein Kontingent mit einer API-Anfrage überschreiten, liefert Google Cloud folgenden HTTP-Statuscode: 413 Request Entity Too Large.

Weitere Kontingente anfordern

Verwenden Sie zur Erhöhung/Verringerung der meisten Kontingenten die Google Cloud Console. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.

Console

  1. Öffnen Sie in der Google Cloud Console die Seite Kontingente.

    Kontingente aufrufen

  2. Wählen Sie auf der Seite Kontingente die Kontingente aus, die Sie ändern möchten.
  3. Klicken Sie oben auf der Seite auf Kontingente bearbeiten.
  4. Geben Sie unter Name Ihren Namen ein.
  5. Optional: Geben Sie unter Telefon eine Telefonnummer ein.
  6. Senden Sie die Anfrage. Die Bearbeitung von Kontingentanforderungen dauert 24 bis 48 Stunden.

Ressourcenverfügbarkeit

Jedes Kontingent stellt die maximale Anzahl an Ressourcen eines bestimmten Typs dar, die Sie erstellen können, sofern der Ressourcentyp verfügbar ist. Beachten Sie, dass Kontingente die Verfügbarkeit von Ressourcen nicht garantieren. Selbst wenn Sie ein verfügbares Kontingent haben, können Sie keine neue Ressource erstellen, wenn keine verfügbar ist.

Beispiel: Sie haben noch ein ausreichendes Kontingent zum Erstellen einer neuen regionalen, externen IP-Adresse in der Region us-central1. Dies ist jedoch nicht möglich, wenn in dieser Region keine externen IP-Adressen verfügbar sind. Die Verfügbarkeit von zonalen Ressourcen kann sich auch auf Ihre Fähigkeit auswirken, eine neue Ressource zu erstellen.

Es kommt nur selten vor, dass Ressourcen in einer kompletten Region nicht verfügbar sind. Ressourcen innerhalb einer Zone können aber manchmal vorübergehend ausgeschöpft sein, ohne dass sich das auf das Service Level Agreement (SLA) für den Ressourcentyp auswirkt. Weitere Informationen finden Sie im entsprechenden SLA für die Ressource.