Auf dieser Seite werden Best Practices für die Verwaltung des Cloud Healthcare API-Kontingents beschrieben. Diese Seite ist für Sie geeignet, wenn Ihr Google Cloud Projekt einen hohen Traffic hat oder haben könnte und Sie mehr Kontingent benötigen, als die Cloud Healthcare API standardmäßig bietet.
Standardkontingente der Cloud Healthcare API
Die Standardkontingente für die Cloud Healthcare API sind nicht für alle Anwendungsfälle geeignet, insbesondere wenn Ihr Google Cloud Projekt einen hohen Traffic hat. Das Kontingent wird von der Cloud Healthcare API nicht automatisch erhöht. Sie müssen Ihre Kontingentnutzung planen und im Blick behalten.
Best Practices für die Überwachung und Anzeige des Kontingents
Es gibt mehrere Möglichkeiten, die Kontingentnutzung aufzurufen. Wenn Sie das Kontingent für die Cloud Healthcare API schätzen und ansehen möchten, empfehlen wir Ihnen, das Modell für Dienstkontingente zu verwenden. Mit dem Modell können Sie Ihr verfügbares Kontingent anhand der folgenden Kriterien genau bewerten:
- Gibt an, ob eine Administratorüberschreibung vorhanden ist. Ein Hauptkonto, dem die Rolle Kontingentadministrator in einer Organisation gewährt wurde, kann eine Administratorüberschreibung auf das Kontingent inGoogle Cloud -Projekten innerhalb der Organisation anwenden. Eine Überschreibung durch den Administrator ersetzt Standardlimits und Überschreibungen durch den Ersteller.
Gibt an, ob eine Überschreibung durch den Ersteller vorhanden ist. Ein Dienstinhaber gewährt einem Nutzer eines Dienstes eine Überschreibung durch den Dienstersteller. Google Cloud ist der Dienstinhaber des Cloud Healthcare API-Dienstes. Jede Kontingentüberschreibung, die Google Cloud anbietet, ist eine Überschreibung durch den Ersteller.
Ob eine Überschreibung durch Nutzer vorliegt. Nutzer, die Anfragen an die Cloud Healthcare API senden, sind Nutzer des Cloud Healthcare API-Dienstes. Sie können Überschreibungen durch den Nutzer in verschiedenen Situationen anwenden, z. B. um Kontingente in IhremGoogle Cloud -Projekt als Kostenkontrollmaßnahme einzuschränken, um eine Budgetüberschreitung zu verhindern.
Wenn eine dieser Überschreibungen aktiv ist, können Sie das Limit für Ihr Nutzerkontingent berechnen, um eine genaue Einschätzung Ihres verfügbaren Kontingents zu erhalten.
Best Practices für das Anfordern eines zusätzlichen Kontingents
Google Cloud hat Verfahren, um ein höheres Kontingent anzufordern. Weitere Informationen zur Bearbeitung von Anfragen zur Kontingenterhöhung finden Sie unter Anfragen zur Kontingenterhöhung.
Bevor Sie ein zusätzliches Kontingent beantragen, müssen Sie Folgendes implementiert haben:
Durch diese Implementierungen kann das erforderliche Kontingent aus folgenden Gründen reduziert werden:
- Bei beiden Implementierungen werden Lastspitzen über mehrere Stunden oder Minuten statt über Sekunden verteilt.
- Bei beiden Implementierungen wird das Kontingent über einen Zeitraum von 24 Stunden effizient genutzt. Wenn Anfragen, die das Standardkontingent deutlich überschreiten, über einen Zeitraum von 24 Stunden hinweg konstant sind, können dem Cloud Healthcare API-Dienst größere Ressourcenpools zugewiesen werden. Die zusätzliche Ressourcenzuweisung erfolgt nur auf Anfrage und wird von Fall zu Fall entschieden.
- Eine gleichbleibende Ressourcennutzung erleichtert es uns, Ihre Kontingentanforderungen zu verstehen und Ihnen das benötigte Kontingent zur Verfügung zu stellen. Google Cloud
Um Ihre Kapazität und Ihr Kontingent effizient verwalten zu können, müssen Sie die Kapazitätsanforderungen Ihrer Organisation kennen. Wenn Sie Ihre Kapazitätsanforderungen planen und der Meinung sind, dass Sie für die Produktion Ihres Google Cloud Projekts ein großes Kontingent benötigen, fordern Sie eine Erhöhung beim Google Cloud Kundenservice an. Der Kundensupport kann Ihnen bei der Zuweisung und Erhöhung des Kontingents während der Test- und Einführungsphase Ihres Google Cloud Projekts helfen.
Sie benötigen keinen kostenpflichtigen Kundendienst, um eine Kontingenterhöhung anzufordern. Einige Anfragen zur Kontingenterhöhung werden innerhalb von 2–3 Arbeitstagen abgeschlossen. Wir empfehlen Ihnen jedoch, mehr Zeit einzuplanen. Bei einer großen Kontingenterhöhung kann es zehn Arbeitstage oder länger dauern, bis der Antrag bearbeitet ist. Ein Teil Ihrer Planung muss die Zeit umfassen, die Sie für die Beantwortung von Fragen des Kundensupports benötigen, um alle Fragen zu beantworten oder offene Probleme im Zusammenhang mit der Anfrage zu lösen. Wenn Sie dafür sorgen, dass Ihr ursprünglicher Antrag auf Kontingenterhöhung ausreichend detailliert ist, können Sie die Wartezeit auf die Bearbeitung des Antrags möglicherweise verkürzen.
Best Practices für die Bedarfsplanung für Kontingente
Bevor Ihr Google Cloud Projekt in die Produktion geht, sollten Sie das erforderliche Kontingent schätzen und planen. Wenn Sie Ihre Kontingentanforderungen planen, können Sie unerwartete Einschränkungen bei der Ressourcennutzung vermeiden.
In den folgenden Abschnitten wird erläutert, was Sie bei der Planung des Kontingents beachten sollten.
Gesamtnutzung für alle Datenspeicher und ‑clients vorhersagen
Sie können die Gesamtnutzung aller Cloud Healthcare API-Datenspeicher und die Gesamtnutzung aller Clients abrufen, die Anfragen an IhrGoogle Cloud -Projekt senden.
- In einigen Google Cloud Projekten werden mehrere Anwendungsfälle der Cloud Healthcare API implementiert. In Ihrem Google Cloud Projekt werden beispielsweise mehrere Cloud Healthcare API-Datasets und Datenspeicher für verschiedene Datentypen verwendet, wodurch die Gesamtnutzung des Kontingents steigt.
- Kontingente werden proGoogle Cloud-Projekt und pro Region erzwungen. Achten Sie darauf, dass Sie Ihr erforderliches Kontingent in mehreren Regionen genau messen. Wenn Sie mehrere Google Cloud Projekte haben, benötigen Sie möglicherweise genauere Messungen für alle Projekte. Weitere Informationen zur Planung von Kontingenten pro Region finden Sie unter Nutzung pro Region vorhersagen.
- Die Cloud Healthcare API verteilt das Kontingent nicht auf Clients, Datasets oder Datenspeicher. Der Kunde muss entscheiden, ob er ein Priorisierungsschema implementieren möchte, damit beim wichtigsten Traffic keine
429 RESOURCE_EXHAUSTED
-Fehler auftreten.
Nutzung pro Region vorhersagen
Die Cloud Healthcare API misst Kontingente proGoogle Cloud-Projekt und pro Region. Kontingente werden in der Regel pro Minute gemessen. So können kleine Spitzen bei den Anfragen pro Sekunde auf Minutenbasis ausgeglichen werden.
Wenn für Ihr Google Cloud Projekt mehrere Regionen verwendet werden, können Sie pro Region Kontingente festlegen.
Wenn sich Ihr Cloud Healthcare API-Dataset am multiregionalen Standort us
befindet und Sie ein zusätzliches Kontingent anfordern möchten, geben Sie in Ihrem Kontingentantrag an, dass das Kontingent für die „Metaregion USA“ gilt. Der multiregionale Standort us
besteht aus den folgenden Unterregionen:
us-central1
us-east1
us-west1
Wenn Sie bereits Cloud Healthcare API-Traffic in einer der us-
-Unterregionen nutzen, müssen Sie den vorhandenen Traffic in diesen Unterregionen berücksichtigen, wenn Sie eine Kontingenterhöhung für die us
-Region beantragen.
Wenn Sie beispielsweise Datasets in us-central1
und us
haben und eine Kontingenterhöhung in us
beantragen, geben Sie in Ihrer Anfrage an, dass Sie Datasets in us-central1
haben.
Transaktionen mit geringem Volumen sollten regelmäßig bevorzugt werden
Im folgenden Szenario wird erläutert, wie wichtig es ist, regelmäßig kleinere Datenmengen zu senden, anstatt Transaktionen mit hohem Volumen mit einem längeren Intervall zwischen den Transaktionen zu senden.
Der Traffic-Volumen wird mit der Formel request payload * time = traffic volume
berechnet.
Eine Transaktion mit hohem Volumen besteht aus einer oder mehreren Anfragen an die Cloud Healthcare API in einem kurzen Intervall, die eine große Nutzlast enthalten.
Eine Reihe von Anfragen kann auch als hochvolumig eingestuft werden, wenn viele Anfragen innerhalb eines kurzen Intervalls gesendet werden, unabhängig von der Nutzlastgröße.
Angenommen, ein Client erfasst Transaktionen in großem Umfang und sendet sie alle fünf Minuten in einem Burst an die Cloud Healthcare API. Folgendes geschieht:
- Der anfängliche Trafficanstieg verbraucht das Kontingent in der ersten Minute (je nach Minutenübergang), bis es aufgebraucht ist.
- Für den verbleibenden Burst-Traffic werden
429 RESOURCE_EXHAUSTED
-Fehler ausgegeben. Wenn diese Funktion konfiguriert ist, wird für alle betroffenen Anfragen ein exponentieller Backoff angewendet. - Ein bestimmter Prozentsatz der Anfragen, bei denen das ursprüngliche exponentielle Backoff aufgetreten ist, wird neu geplant, um in der nächsten Minute noch einmal versucht zu werden. Einige Anfragen werden innerhalb einer Minute mehrmals versucht und dann in der nächsten Minute noch einmal.
- Wenn das Anfragevolumen hoch genug ist, kann es bei wiederholten Anfragen zu
429 RESOURCE_EXHAUSTED
-Fehlern und wieder zu einem exponentiellen Backoff kommen. Bei bestimmten Traffic-Spitzen kann es zu unterschiedlichen Zeiten zu einem exponentiellen Backoff kommen und die Versuche, wieder Traffic zu senden, können in Zukunft in derselben Minute zusammenfallen. - Wenn das Anfragevolumen weiterhin hoch ist, wird ein Teil des Traffics beim nächsten Traffic-Anstieg noch einmal versucht. Das Problem wird dadurch verschärft, dass dem bestehenden Rückstau an Anfragen mehr Traffic hinzugefügt wird. Ihre Anwendung hat möglicherweise Schwierigkeiten, den Rückstau an Anfragen zu bewältigen und sie regelmäßig an die Cloud Healthcare API zu senden.
Dieses Szenario zeigt, wie wichtig es ist, das Volumen Ihres Traffics pro Minute zu kennen. Implementieren Sie Ihr Traffic-Volumen und Backoffs, um Netzwerküberlastungen zu vermeiden und dafür zu sorgen, dass Ihre Anwendung nicht häufig Fehler auftritt, die Neuversuche erfordern.
DICOM- und FHIR-Kontingente prüfen
Informationen zu den Cloud Healthcare API-Kontingenten für FHIR- und DICOM-Speicher und ‑Vorgänge finden Sie unter Kontingentlimits.