La soluzione Speech-to-Text On-Prem espone alcuni parametri di configurazione. I parametri riportati di seguito sono esposti sia nell'interfaccia a riga di comando che nelle applicazioni di avvio app del marketplace.
Nome parametro | Descrizione |
---|---|
Nome | Il nome dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAME. |
Spazio dei nomi | Lo spazio dei nomi in cui è stato eseguito il deployment dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAMESPACE. |
Repliche | Il numero di repliche che vuoi che la soluzione venga eseguita (il valore predefinito è 3). Ciò consente di scalare la tua applicazione orizzontalmente. Questo valore è indicato come $REPLICAS. |
CPU per pod | Numero di CPU da allocare a ogni pod che esegue il programma binario di Speech-to-Text. Il valore predefinito è 2 e almeno 2 sono consigliati. Questo valore viene indicato come $CPU. Se specifichi più CPU di quelle disponibili nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori dei pod: non pianificabili". |
Memoria per pod | Quanta RAM allocare a ogni pod che esegue il programma binario di Speech-to-Text. Il valore predefinito è 1Gi e almeno 1Gi è consigliato. Questo valore viene denominato $MEMORY. Se specifichi più memoria di quella disponibile nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori dei pod: non pianificabili". |
L'ID progetto Google Cloud Platform in cui esportare le metriche | (Facoltativo) Puoi specificare un ID progetto di Google Cloud Platform in modo che il server On-Prem possa esportare le metriche in Stackdriver in quel progetto. Utilizza lo stesso progetto Google Cloud Platform in cui verrà eseguito il server On-Prem. Se fornisci un progetto diverso, assicurati che l'account di servizio che esegue il server On-Prem abbia l'autorizzazione per inviare metriche al progetto. Se questo campo è vuoto, non verrà inviata alcuna metrica. Questo valore è indicato come $METRIC_PROJECT. |
Installa gli oggetti Istio per il bilanciamento del carico | (Facoltativo) Puoi specificare se installare o meno gli oggetti Istio per il bilanciamento del carico gRPC. Se questa opzione è selezionata, le richieste gRPC in entrata verranno distribuite a diversi pod da gestire. Devi aver già installato Istio nel cluster, altrimenti l'installazione non riuscirà. Questo valore è indicato come $ENABLE_ISTIO. Per ulteriori informazioni sull'installazione e la configurazione di Istio, consulta la guida rapida prima di iniziare. |
IP pubblico | (Facoltativo) Puoi fornire un indirizzo IP pubblico in questo campo per rendere la tua soluzione raggiungibile pubblicamente. Questo si applica solo se il cluster supporta IP pubblici e ne hai assegnato uno alla regione in cui è in esecuzione il cluster. Se non fornisci un IP pubblico, dovrai configurare la rete autonomamente. Questo valore è indicato come $PUBLIC_IP. Tieni presente che questo IP pubblico è accessibile su Internet. |
Modello 1 | Devi specificare la prima lingua del server onprem per gestire le richieste ASR in entrata. Questo valore è indicato come $MODEL1. |
Modello 2 | Devi specificare il secondo linguaggio per il server onprem per gestire le richieste ASR in entrata. Se non hai bisogno di una seconda lingua, puoi scegliere Nessuno. Questo valore è indicato come $MODEL2. |
Modello 3 | Devi specificare la terza lingua del server onprem per gestire le richieste ASR in entrata. Se non hai bisogno di una terza lingua, puoi scegliere Nessuno. Questo valore è indicato come $MODEL3. |
Nome secret | (Facoltativo per GKE, obbligatorio per GKE On-Prem e altri cloud ibridi) È richiesto un account di servizio Google dalla lista consentita dei progetti Google Cloud Platform per l'autenticazione affinché i pod k8s all'interno dei cluster GKE On-Prem possano eseguire query sui servizi Google Cloud. Questo account di servizio deve disporre almeno dell'autorizzazione di Visualizzatore progetto. Scarica una chiave per l'account di servizio Google e inseriscila in un secret nello stesso spazio dei nomi dell'applicazione. Il nome del file deve essere key.json. Questo valore è indicato come $GSA_SECRET. Per ulteriori dettagli, consulta la documentazione di Kubernetes. |