Parametri di configurazione dell'API On-Prem

La soluzione Speech-to-Text On-Prem espone alcuni parametri di configurazione. I parametri riportati di seguito sono esposti sia nell'interfaccia a riga di comando che nelle applicazioni di avvio app del marketplace.

Nome parametro Descrizione
Nome Il nome dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAME.
Spazio dei nomi Lo spazio dei nomi in cui è stato eseguito il deployment dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAMESPACE.
Repliche Il numero di repliche che vuoi che la soluzione venga eseguita (il valore predefinito è 3). Ciò consente di scalare la tua applicazione orizzontalmente. Questo valore è indicato come $REPLICAS.
CPU per pod Numero di CPU da allocare a ogni pod che esegue il programma binario di Speech-to-Text. Il valore predefinito è 2 e almeno 2 sono consigliati. Questo valore viene indicato come $CPU. Se specifichi più CPU di quelle disponibili nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori dei pod: non pianificabili".
Memoria per pod Quanta RAM allocare a ogni pod che esegue il programma binario di Speech-to-Text. Il valore predefinito è 1Gi e almeno 1Gi è consigliato. Questo valore viene denominato $MEMORY. Se specifichi più memoria di quella disponibile nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori dei pod: non pianificabili".
L'ID progetto Google Cloud Platform in cui esportare le metriche (Facoltativo) Puoi specificare un ID progetto di Google Cloud Platform in modo che il server On-Prem possa esportare le metriche in Stackdriver in quel progetto. Utilizza lo stesso progetto Google Cloud Platform in cui verrà eseguito il server On-Prem. Se fornisci un progetto diverso, assicurati che l'account di servizio che esegue il server On-Prem abbia l'autorizzazione per inviare metriche al progetto. Se questo campo è vuoto, non verrà inviata alcuna metrica. Questo valore è indicato come $METRIC_PROJECT.
Installa gli oggetti Istio per il bilanciamento del carico (Facoltativo) Puoi specificare se installare o meno gli oggetti Istio per il bilanciamento del carico gRPC. Se questa opzione è selezionata, le richieste gRPC in entrata verranno distribuite a diversi pod da gestire. Devi aver già installato Istio nel cluster, altrimenti l'installazione non riuscirà. Questo valore è indicato come $ENABLE_ISTIO. Per ulteriori informazioni sull'installazione e la configurazione di Istio, consulta la guida rapida prima di iniziare.
IP pubblico (Facoltativo) Puoi fornire un indirizzo IP pubblico in questo campo per rendere la tua soluzione raggiungibile pubblicamente. Questo si applica solo se il cluster supporta IP pubblici e ne hai assegnato uno alla regione in cui è in esecuzione il cluster. Se non fornisci un IP pubblico, dovrai configurare la rete autonomamente. Questo valore è indicato come $PUBLIC_IP. Tieni presente che questo IP pubblico è accessibile su Internet.
Modello 1 Devi specificare la prima lingua del server onprem per gestire le richieste ASR in entrata. Questo valore è indicato come $MODEL1.
Modello 2 Devi specificare il secondo linguaggio per il server onprem per gestire le richieste ASR in entrata. Se non hai bisogno di una seconda lingua, puoi scegliere Nessuno. Questo valore è indicato come $MODEL2.
Modello 3 Devi specificare la terza lingua del server onprem per gestire le richieste ASR in entrata. Se non hai bisogno di una terza lingua, puoi scegliere Nessuno. Questo valore è indicato come $MODEL3.
Nome secret (Facoltativo per GKE, obbligatorio per GKE On-Prem e altri cloud ibridi) È richiesto un account di servizio Google dalla lista consentita dei progetti Google Cloud Platform per l'autenticazione affinché i pod k8s all'interno dei cluster GKE On-Prem possano eseguire query sui servizi Google Cloud. Questo account di servizio deve disporre almeno dell'autorizzazione di Visualizzatore progetto. Scarica una chiave per l'account di servizio Google e inseriscila in un secret nello stesso spazio dei nomi dell'applicazione. Il nome del file deve essere key.json. Questo valore è indicato come $GSA_SECRET. Per ulteriori dettagli, consulta la documentazione di Kubernetes.