Cloud Speech-to-Text sul dispositivo

Panoramica

Speech-to-Text on Device consente una tecnologia di riconoscimento vocale di qualità server sui dispositivi incorporati. Questa funzione ti consente di eseguire il riconoscimento vocale in streaming sul dispositivo, senza alcuna connessione a una rete o ai server Google. La soluzione on-device offre diversi vantaggi per questo caso d'uso rispetto a una soluzione lato server: il riconoscimento vocale è disponibile anche se il dispositivo non è connesso alla rete o se la connessione di rete è limitata e i dati dell'utente rimangono dal dispositivo.

Funzionalità chiave
Trascrizione di alta qualità Applica gli algoritmi di Google al riconoscimento vocale automatico.
Offline Riconoscimento vocale senza connessione a internet.
Bassa latenza Il riconoscimento vocale viene eseguito velocemente in locale sul dispositivo.
Modelli efficienti Esegui il deployment in modo efficiente con modelli di dimensioni inferiori a 1 GB e che consumano risorse minime.
Rilevamento dell'attività vocale Rileva l'inizio e la fine del parlato.
Affidabilità Ottieni stime di affidabilità della trascrizione.
Adattamento del modello Aumenta l'accuratezza della trascrizione di parole o frasi rare e specifiche del dominio.

Passaggi successivi

L'app Speech on-device viene gestita in due tipi: come libreria o server gRPC.

  1. libgSpeech è un'interfaccia di libreria per Google Speech. libgSpeech fornisce ulteriore controllo sull'utilizzo della memoria e del grafico di inferenza alla base di Google Speech.
  2. Il server vocale è un'interfaccia server gRPC per Google Speech. Il server è adatto agli utenti che hanno familiarità con l'API Cloud Speech.

Contatta Google per richiedere l'accesso.