Lokale API-Konfigurationsparameter

Die Speech-to-Text On-Prem-Lösung stellt einige Konfigurationsparameter bereit. Die folgenden Parameter werden sowohl in der Installation der Befehlszeile als auch in der Marketplace-App-Installation angezeigt.

Parametername Beschreibung
Name Der Name der Anwendung. Die Zeichenfolge "speech" ist eine sichere Standardeinstellung. Dieser Wert wird als $NAME bezeichnet.
Namespace Der Namespace, in dem die Anwendung bereitgestellt wird. Die Zeichenfolge "speech" ist eine sichere Standardeinstellung. Dieser Wert wird als $NAMESPACE bezeichnet.
Replikate Die Anzahl der Replikate, die die Lösung ausführen soll (Standard ist 3). So können Sie Ihre Anwendung horizontal skalieren. Dieser Wert wird als $REPLICAS bezeichnet.
CPUs pro Pod Wie viele CPUs den Pods zugeordnet werden, die die Speech-to-Text-Binärdatei ausführen. Der Standardwert ist 2 und mindestens 2 werden empfohlen. Dieser Wert wird als $CPU bezeichnet. Wenn Sie mehr CPUs angeben, als in Ihrem Cluster verfügbar sind, gibt die Anwendung Fehler wie "Hat keine Mindestverfügbarkeit" oder "Pod-Fehler: nicht planbar" aus.
Arbeitsspeicher pro Pod Wie viel RAM jedem Pod zugewiesen werden soll, wenn die Speech-to-Text-Binärdatei ausgeführt wird. Der Standardwert ist 1Gi und mindestens 1G empfohlen. Dieser Wert wird als $MEMORY bezeichnet. Wenn Sie mehr Arbeitsspeicher angeben als in Ihrem Cluster verfügbar ist, gibt die Anwendung Fehler wie "Hat keine Mindestverfügbarkeit" oder "Pod-Fehler: nicht planbar" aus.
Die Google Cloud Platform-Projekt-ID, in die Messwerte exportiert werden sollen (Optional) Sie können eine Google CloudPlatform-Projekt-ID angeben, damit der On-Prem-Server Messwerte in Stackdriver in diesem Google Cloud Platform-Projekt exportieren kann. Verwenden Sie dasselbe Google Cloud Platform-Projekt, in dem der lokale Server ausgeführt wird. Wenn Sie ein anderes Projekt angeben, muss das Dienstkonto, das den On-Prem-Server ausführt, die Berechtigung haben, Messwerte an dieses Projekt zu senden. Wenn dieses Feld leer ist, werden keine Messwerte gesendet. Dieser Wert wird als $METRIC_PROJECT bezeichnet.
Istio-Objekte für das Load-Balancing installieren (Optional) Sie können festlegen, ob Sie Istio-Objekte für das gRPC-Load-Balancing installieren möchten. Wenn diese Option aktiviert ist, werden eingehende gRPC-Anfragen an die verschiedenen Pods gesendet, die bereitgestellt werden sollen. Istio muss bereits im Cluster installiert sein. Andernfalls schlägt die Installation fehl. Dieser Wert wird als $ENABLE_ISTIO bezeichnet. Weitere Informationen zur Installation und Einrichtung von Istio finden Sie in der Kurzanleitung.
Öffentliche IP-Adresse Optional: In diesem Feld können Sie eine öffentliche IP-Adresse angeben, um Ihre Lösung öffentlich zugänglich zu machen. Dies gilt nur, wenn der Cluster öffentliche IP-Adressen unterstützt und Sie eine Region für die Region zugewiesen haben, in der Ihr Cluster ausgeführt wird. Wenn Sie keine öffentliche IP-Adresse angeben, müssen Sie Ihr Netzwerk selbst konfigurieren. Dieser Wert wird als $PUBLIC_IP bezeichnet. Beachten Sie, dass diese öffentliche IP-Adresse im Internet zugänglich ist.
Modell 1 Sie sollten die erste Sprache für den lokalen Server angeben, der eingehende ASR-Anfragen verarbeiten soll. Dieser Wert wird als $MODEL1 bezeichnet.
Modell 2 Geben Sie die zweite Sprache an, damit der lokale Server eingehende ASR-Anfragen verarbeitet. Wenn Sie keine zweite Sprache benötigen, wählen Sie "Keine" aus. Dieser Wert wird als $MODEL2 bezeichnet.
Modell 3 Geben Sie die dritte Sprache für den lokalen Server an, um eingehende ASR-Anfragen zu verarbeiten. Wenn Sie keine dritte Sprache benötigen, können Sie "Keine" auswählen. Dieser Wert wird als $MODEL3 bezeichnet.
Secret-Name (Optional für GKE, für GKE On-Prem und andere Hybrid-Clouds erforderlich) Für die Authentifizierung benötigen Sie ein Google-Dienstkonto aus der Zulassungsliste des Google Cloud Platform-Projekt, damit die k8s-Pods in GKE On-Prem-Clustern Google Cloud-Dienste abfragen können. Dieses Dienstkonto muss mindestens die Berechtigung "Projektbetrachter" haben. Laden Sie einen Schlüssel für das Google-Dienstkonto herunter und packen Sie ihn in ein Secret im selben Namespace wie die Anwendung. Die Datei muss key.json heißen. Dieser Wert wird als $GSA_SECRET bezeichnet. Weitere Informationen finden Sie in der Kubernetes-Dokumentation.