Scopri come creare applicazioni IA di nuova generazione. Partecipa all'Applied AI Summit il 13 dicembre. 
Vai a
Speech-to-Text

Speech-to-Text

Converti con precisione la voce in testo, utilizzando un'API basata sulle migliori ricerche e tecnologie AI di Google.

I nuovi clienti ricevono 300 $ di crediti gratuiti da spendere per Speech-to-Text. Tutti i clienti hanno 60 minuti di tempo al mese per trascrivere e analizzare l'audio gratuitamente, senza consumare i crediti.

  • Trascrivi i tuoi contenuti in modo accurato

  • Sfrutta il potenziale della voce per migliorare l'esperienza utente

  • Migliora il servizio offerto, con insight basati sulle interazioni con i clienti

  • Inizia con il nostro tutorial nella console

Vantaggi

Accuratezza all'avanguardia

Sfrutta i più avanzati algoritmi di rete neurale per il deep learning offerti da Google per il riconoscimento vocale automatico (ASR).

Personalizzazione semplificata dei modelli

Sperimenta, crea e gestisci risorse personalizzate con la UI Speech-to-Text.

Deployment flessibile dei modelli

Esegui il deployment di ASR ogni volta che ti serve, nel cloud con l'API oppure on-premise con Speech-to-Text on-prem.

Demo

Metti alla prova Speech-to-Text

Come in questa demo, puoi integrare facilmente la trascrizione del parlato nelle tue applicazioni con l'API Speech-to-Text.

Funzionalità principali

Funzionalità principali

Adattamento vocale

Fornisci suggerimenti per massimizzare l'accuratezza della trascrizione di parole e frasi settoriali o raramente utilizzate. Usa le classi per convertire automaticamente i numeri vocali in indirizzi, anni, valute e molto altro ancora.

Modelli specifici del dominio

Scegli da una selezione di modelli addestrati per il controllo vocale, le chiamate telefoniche e la trascrizione di video, ottimizzati per i requisiti di qualità specifici del dominio. 

Confronto semplificato della qualità

Sperimenta l'audio vocale con la nostra interfaccia utente facile da usare. Prova diverse configurazioni per ottimizzare qualità e accuratezza.

Speech on-device

Esegui gli algoritmi di riconoscimento e sintesi vocale di Google Cloud localmente su qualsiasi dispositivo, indipendentemente dalla connessione a internet. Prometti agli utenti che i loro dati vocali non lasceranno mai il loro dispositivo.

Modello di base per Speech-to-Text

Crea applicazioni vocali per un pubblico globale con modelli vocali basati su Chirp, il modello di base di Google Cloud per la sintesi vocale addestrato con milioni di ore di dati audio e miliardi di frasi di testo. 

Visualizza tutte le funzionalità

Documentazione

Tutorial e risorse per iniziare

Tutorial

Tutorial nella console su Speech-to-Text

Scopri come aggiungere Speech-to-Text alle app esistenti. Inizia con il nostro tutorial nella console.
Nozioni di base su Google Cloud

Nozioni di base su Speech-to-Text