In diesem Dokument sind die Kontingente und Systemlimits für Media CDN. Kontingente geben die Menge einer zählbaren, freigegebenen Ressource an, die Sie verwenden können. Sie werden von Google Cloud-Diensten wie Media CDN definiert. Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Media CDN-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Limits
Die folgenden Limits gelten für Media CDN.
Konfiguration
Element | Limits | Hinweise |
---|---|---|
Maximale Anzahl von EdgeCacheService |
20 pro Projekt | Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten. |
Maximale Anzahl von EdgeCacheOrigin |
30 pro Projekt | Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten. |
Maximale Anzahl von EdgeCacheKeyset |
10 pro Projekt | Wenden Sie sich an Ihr Google Cloud-Vertriebsteam, wenn Sie dieses Limit erhöhen möchten. |
Maximale Anzahl von RouteRules pro EdgeCacheService |
2000 | Für jedes Dieses Limit kann nicht erhöht werden. |
Maximale Anzahl von SSL-Zertifikaten pro Dienst | 5 | Dieses Limit kann nicht erhöht werden. Weitere Informationen finden Sie im Kontingent pro Projekt für SSL-Zertifikate. |
Maximale Anzahl öffentlicher Schlüssel pro EdgeCacheKeyset |
3 | Dieses Limit kann nicht erhöht werden. Mehrere Schlüssel in einem Schlüsselsatz wurden für die Schlüsselrotation entwickelt: Sie sollten ältere und nicht verwendete Schlüssel im Laufe der Zeit entfernen. |
Maximale Anzahl für Validierungen freigegebener Schlüssel pro EdgeCacheKeyset |
3 | Dieses Limit kann nicht erhöht werden. Mehrere Schlüssel in einem Schlüsselsatz wurden für die Schlüsselrotation entwickelt: Sie sollten ältere und nicht verwendete Schlüssel im Laufe der Zeit entfernen. |
HTTP-Header, -Anfragen und -Antworten
Element | Limits | Hinweise |
---|---|---|
Maximale Anfrageheader-Größe | Ca. 11 KiB | Dieses Limit kann nicht erhöht werden.
Die Anfrage-URL und der Anfrageheader dürfen zusammen maximal 15 KB groß sein. Anfragen werden mit einer HTTP-431-Antwort für HTTP/1.1-Verbindungen abgelehnt. HTTP/2-Verbindungen werden ohne das Schreiben eines Antwortcodes geschlossen.
Diese Anfragen werden mit einem |
Maximale Größe des Anfragetexts | 16 KiB | Anfragen mit einem Textkörper, der dieses Limit überschreitet, werden mit einem HTTP-
413 Content Too Large -Statuscode.
|
Maximale Größe des Antwortheaders | Ca. 128 KiB | Dieses Limit kann nicht erhöht werden.
Ursprungsantworten mit Headern, die dieses Limit überschreiten, führen dazu, dass ein HTTP 502 an den Client gesendet wird. Diese werden mit einem |
Maximale cachefähige Objektgröße | 100 GiB | Dieses Limit kann nicht erhöht werden.
Dies ist die maximale Größe von Objekten am Ursprungsort, Media CDN kann im Cache gespeichert werden. Größere Objekte werden als nicht im Cache speicherbar behandelt. |
Maximale Antwortgröße, die nicht im Cache gespeichert werden kann | 500 MiB | Dieses Limit kann nicht erhöht werden.
Das ist die maximale Anzahl von Byte in einem Antworttext, die Media CDN-Proxys senden, wenn ein Objekt nicht im Cache gespeichert werden kann. Nicht im Cache speicherbare Antworten werden nach Erreichen des Limits abgeschnitten. |
Umwandlung der Header in Kleinbuchstaben | Immer, für Media CDN | Media CDN folgt den HTTP/2-Konventionen für Groß- und Kleinschreibung von Anfrage- und Antwortheadern.
Alle Header werden ungeachtet des verwendeten Protokolls in Kleinbuchstaben umgewandelt. Beispiel: Die Groß- und Kleinschreibung von Headerwerten wird nicht geändert. |
Limits für API-Anfrageraten
Wenn Sie eine höhere Ratenbegrenzung für API-Anfragen benötigen, können Sie die aktuelle Verwendung und eine Erhöhung beantragen.
Element | Limits |
---|---|
Entwertungen | 10 pro Minute pro EdgeCacheService |
Alle Aufrufe, die sich nicht im Namespace networkservices befinden |
1.200 Aufrufe pro Minute und Projekt |
Schreibgeschützt: GetEdgeCache* ,
ListEdgeCache* |
100 pro Minute und Projekt |
Lesen/Schreiben: alles im Namespace networkservices , das nicht als schreibgeschützt markiert ist |
100 pro Minute und Projekt |
Zeitüberschreitungen des Clients
Zeitlimit | Maximale Dauer | Antwortcode | Beschreibung |
---|---|---|---|
Maximum request duration | 5 Minuten | HTTP 408 (Request Timeout) | Die maximale Dauer für die Antwort auf eine einzelne Anfrage. |
Header timeout | 10 Sekunden | HTTP 408 (Request Timeout) | Wie lange der Client benötigen darf, um den vollständigen Satz von Anfrageheadern zu senden. |
Zeitlimits für den Ursprung
Mit
connectTimeout
undmaxAttemptsTimeout
wird begrenzt, wie lange es dauert, bis Media CDN eine verwendbare Antwort findet.Beide Zeitüberschreitungen umfassen die Zeit, die der Ursprung benötigt, um Header zurückzugeben und zu bestimmen, ob ein Failover oder eine Weiterleitung verwendet werden soll.
connectTimeout
gilt unabhängig für jeden Ursprungsversuch, währendmaxAttemptsTimeout
die Zeit einschließt, die für die Verbindung bei allen Ursprungsversuchen erforderlich ist, einschließlich Failovers und Weiterleitungen. Das Folgen einer Weiterleitung zählt als zusätzlicher Versuch, eine Verbindung zum Ursprung herzustellen, und wird auf die für den konfigurierten Ursprung festgelegtenmaxAttempts
angerechnet.Wenn Media CDN auf eine Antwort ohne Weiterleitung stößt, z. B. von einem Weiterleitungs- oder Failover-Ursprung, gelten die Werte
readTimeout
undresponseTimeout
. Weitergeleitete Ursprünge verwenden die WerteconnectTimeout
,readTimeout
undresponseTimeout
, die für denEdgeCacheOrigin
konfiguriert sind, der auf die Weiterleitung gestoßen ist.Mit
responseTimeout
undreadTimeout
wird gesteuert, wie lange eine gestreamte Antwort dauern darf nehmen. Nachdem Media CDN feststellt, dass eine vorgelagerte Antwort verwendet wird, sind wederconnectTimeout
nochmaxAttemptsTimeout
relevant. Ab diesem Zeitpunkt tretenreadTimeout
undresponseTimeout
in Kraft.
Media CDN führt maximal vier Ursprungsversuche über alle Ursprünge hinweg aus, unabhängig von den von jedem EdgeCacheOrigin
festgelegten maxAttempts
.
Media CDN verwendet den maxAttemptsTimeout
-Wert aus dem primären EdgeCacheOrigin
. Die Zeitlimitwerte pro Versuch (connectTimeout
, readTimeout
und responseTimeout
) werden für den EdgeCacheOrigin
jedes Versuchs konfiguriert.
In der folgenden Tabelle werden die Zeitlimitfelder beschrieben:
Feld | Standard | Beschreibung |
---|---|---|
connectTimeout | 5 Sekunden | Der maximale Zeitraum, den Media CDN ab dem Starten der Anfrage an den Ursprung benötigen darf, bis Media CDN bestimmt, ob die Antwort verwendbar ist. In der Praxis deckt Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 15 Sekunden sein. |
maxAttemptsTimeout | 15 Sekunden | Die maximale Zeit für alle Verbindungsversuche zum Ursprung, einschließlich Failover-Ursprünge, bevor ein Fehler an den Client zurückgegeben wird. Wenn das Zeitlimit erreicht ist, bevor eine Antwort zurückgegeben wird, wird ein HTTP 504 zurückgegeben. Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 30 Sekunden sein. Diese Einstellung definiert die Gesamtdauer für alle Ursprungsverbindungsversuche, einschließlich Failover-Ursprünge, um die Gesamtzeit zu begrenzen, die Clients warten müssen, bis das Streamen von Inhalten startet. Es wird nur der erste |
readTimeout | 15 Sekunden | Die maximale Wartezeit zwischen Lesevorgängen einer einzelnen HTTP-Antwort.
Das |
responseTimeout | 30 Sekunden | Die maximale Dauer, bis eine Antwort abgeschlossen sein muss. Das Zeitlimit muss ein Wert zwischen 1 Sekunde und 120 Sekunden sein. Die Dauer wird ab dem Zeitpunkt gemessen, an dem die ersten Body-Bytes empfangen werden. Wenn diese Zeitüberschreitung erreicht wird, bevor die Antwort abgeschlossen ist, Antwort wird abgeschnitten und protokolliert. |
Kontingente verwalten
MitMedia CDN werden Kontingente für die Ressourcennutzung aus verschiedenen Gründen festgelegt. Kontingente schützen unter anderem die gesamte Google Cloud -Community vor unerwarteten Nutzungsspitzen. Außerdem unterstützen Kontingente Nutzer, die Google Cloud mit der kostenlosen Stufe prüfen, dabei, im Rahmen der Testversion zu verbleiben.
Alle Projekte beginnen mit den gleichen Kontingenten, die Sie ändern können, indem Sie zusätzliche Kontingente anfordern. Einige Kontingente könnten entsprechend Ihrer Nutzung eines Produkts automatisch erhöht werden.
Berechtigungen
Zur Anzeige von Kontingenten oder zur Anforderung von Kontingenterhöhungen benötigen IAM-Hauptkonten (Identity and Access Management) eine der folgenden Rollen:
Aufgabe | Erforderliche Rolle |
---|---|
Kontingente für ein Projekt prüfen | Beispiele:
|
Kontingente ändern, zusätzliche Kontingente anfordern | Beispiele:
|
Kontingent prüfen
Console
- Öffnen Sie in der Google Cloud Console die Seite Kontingente.
- Mit dem Feld Tabelle filtern können Sie nach den zu aktualisierenden Kontingenten suchen. Wenn Sie den Namen des Kontingents nicht kennen, verwenden Sie stattdessen die Links auf dieser Seite.
gcloud
Führen Sie mit der Google Cloud CLI den folgenden Befehl aus, um Ihre Kontingente zu prüfen. Ersetzen Sie PROJECT_ID
durch Ihre Projekt-ID:
gcloud compute project-info describe --project PROJECT_ID
Mit dem folgenden Befehl prüfen Sie das genutzte Kontingent in einer Region:
gcloud compute regions describe example-region
Fehler beim Überschreiten Ihres Kontingents
Wenn Sie ein Kontingent mit einem gcloud
-Befehl überschreiten, gibt gcloud
eine quota exceeded
-Fehlermeldung aus und liefert den Exit-Code 1
.
Wenn Sie ein Kontingent mit einer API-Anfrage überschreiten, liefert Google Cloud folgenden HTTP-Statuscode: 413 Request Entity Too Large
.
Weitere Kontingente anfordern
Verwenden Sie zur Erhöhung/Verringerung der meisten Kontingenten die Google Cloud Console. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.
Console
- Öffnen Sie in der Google Cloud Console die Seite Kontingente.
- Wählen Sie auf der Seite Kontingente die Kontingente aus, die Sie ändern möchten.
- Klicken Sie oben auf der Seite auf Kontingente bearbeiten.
- Geben Sie unter Name Ihren Namen ein.
- Optional: Geben Sie unter Telefon eine Telefonnummer ein.
- Senden Sie die Anfrage. Die Bearbeitung von Kontingentanforderungen dauert 24 bis 48 Stunden.
Ressourcenverfügbarkeit
Jedes Kontingent stellt die maximale Anzahl an Ressourcen eines bestimmten Typs dar, die Sie erstellen können, sofern der Ressourcentyp verfügbar ist. Beachten Sie, dass Kontingente die Verfügbarkeit von Ressourcen nicht garantieren. Selbst wenn Sie ein verfügbares Kontingent haben, können Sie keine neue Ressource erstellen, wenn keine verfügbar ist.
Beispiel: Sie haben noch ein ausreichendes Kontingent zum Erstellen einer neuen regionalen, externen IP-Adresse in der Region us-central1
. Dies ist jedoch nicht möglich, wenn in dieser Region keine externen IP-Adressen verfügbar sind. Die Verfügbarkeit von zonalen Ressourcen kann sich auch auf Ihre Fähigkeit auswirken, eine neue Ressource zu erstellen.
Es kommt nur selten vor, dass Ressourcen in einer kompletten Region nicht verfügbar sind. Ressourcen innerhalb einer Zone können aber manchmal vorübergehend ausgeschöpft sein, ohne dass sich das auf das Service Level Agreement (SLA) für den Ressourcentyp auswirkt. Weitere Informationen finden Sie im entsprechenden SLA für die Ressource.