Kontingente und Limits

In diesem Dokument werden die quotas und quotas für Duet AI aufgeführt.

Ein Kontingent schränkt ein, wie viel von einer bestimmten gemeinsam genutzten Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen kann, einschließlich Hardware, Software und Netzwerkkomponenten. Daher sind Kontingente Teil eines Systems, das Folgendes tut:

  • Ihre Nutzung oder Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen.
  • Ihren Verbrauch dieser Ressourcen einschränken, um u. a. für Fairness zu sorgen und Nutzungsspitzen zu reduzieren.
  • Konfigurationen verwalten, die automatisch vorgeschriebene Einschränkungen erzwingen.
  • Möglichkeit, das Kontingent anzufordern oder zu ändern.

Wenn ein Kontingentlimit überschritten wird, blockiert das System in den meisten Fällen den Zugriff auf die entsprechende Google-Ressource und die Aufgabe, die Sie ausführen möchten, schlägt fehl. In den meisten Fällen gelten Kontingente für jedes Google Cloud-Projekt und werden von allen Anwendungen und IP-Adressen geteilt, die dieses Google Cloud-Projekt verwenden.

Für Duet-KI-Ressourcen gelten auch Limits. Diese Limits stehen nicht im Zusammenhang mit dem Kontingentsystem. Limits können nur geändert werden, wenn dies angegeben ist.

Anfragen pro Sekunde

Duet AI erzwingt Kontingente für Anfragen pro Sekunde für jeden Nutzer in einem Projekt.

Kontingent Wert
Anfragen pro Sekunde 2

Anfragen pro Tag

Duet AI erzwingt Kontingente für die Gesamtzahl der Anfragen pro Tag für jeden Nutzer in einem Projekt.

Kontingent Wert
Anfragen pro Tag für Duet AI-Codeanfragen wie Codegenerierung und Codevervollständigung. 6.000
Anfragen pro Tag für Chat- und andere Anfragen, bei denen Antworten im Duet-KI-Bereich in der Google Cloud Console und in IDEs angezeigt werden. 240

Kontingenterhöhung anfordern

Verwenden Sie zur Erhöhung/Verringerung der meisten Kontingenten die Google Cloud Console. Weitere Informationen finden Sie unter Höheres Kontingentlimit anfordern.