Speech-to-Text

Converteer op nauwkeurige wijze spraak naar tekst met een API, mogelijk gemaakt door de AI-technologieën van Google.

Kosteloos proberen
  • action/check_circle_24px Gemaakt met Sketch.

    Maak een transcript van uw content met nauwkeurige ondertiteling

  • action/check_circle_24px Gemaakt met Sketch.

    Bied een betere gebruikerservaring in producten met behulp van spraakopdrachten

  • action/check_circle_24px Gemaakt met Sketch.

    Haal inzichten uit het contact met klanten om uw service te verbeteren

Voordelen

Uitstekende nauwkeurigheid

Pas de meest geavanceerde neurale netwerkalgoritmen voor deep learning voor automatische spraakherkenning (ASR) van Google toe.

Wereldwijd bereik

Kom uw gebruikers wereldwijd tegemoet met spraakherkenning in meer dan 125 talen en varianten.

Flexibele implementatie

Implementeer spraakherkenning waar nodig, in de cloud met de API of op locatie met Speech-to-Text On-Prem.

Demo

Speech-to-Text in de praktijk

Belangrijkste functies

Belangrijkste functies

Spraakaanpassing

Pas spraakherkenning aan om transcripties te maken van domeinspecifieke termen en ongebruikelijke woorden door hints op te geven en de nauwkeurigheid van uw transcriptie van specifieke woorden of zinnen te verbeteren. Converteer automatisch gesproken nummers naar adressen, jaren, valuta's en meer met behulp van klassen.

Domeinspecifieke modellen

Kies uit een selectie van getrainde modellen voor spraakbediening en telefoongesprek- en videotranscriptie die zijn geoptimaliseerd voor domeinspecifieke kwaliteitsvereisten. Ons verbeterde model voor telefoongesprekken is bijvoorbeeld afgestemd op audio die afkomstig is van telefonie, zoals telefoongesprekken die zijn opgenomen met een samplingsnelheid van 8 kHz.

Spraakherkenning tijdens het streamen

Ontvang realtime spraakherkenningsresultaten terwijl de API de audio verwerkt van de microfoon van uw app of van een eerder opgenomen audiobestand (inline of via Google Cloud Storage).

Speech-to-Text On-Prem

Houd volledige controle over uw infrastructuur en beveiligde spraakgegevens en gebruik tegelijkertijd de spraakherkenningstechnologie van Google op locatie, gewoon in uw eigen datacenters. Neem contact op met het verkoopteam om aan de slag te gaan.

Alle functies weergeven

Klanten

Klanten

Castbox gebruikt Speech-to-Text voor de audiozoekservice voor podcasts.
Het verhaal lezen

Kernpunten uit het verhaal

  • Gebruikers kunnen woorden of zinnen zoeken in audiocontent.

  • De nauwkeurigheid van de conversie van audio naar tekst is groter dan 96%.

  • Standaardzoekopdrachten hebben een wachttijd van slechts 50 milliseconden.

Branche

  • Technologie

Wat is er nieuw

Wat is er nieuw

Meld u aan voor Google Cloud-nieuwsbrieven met productupdates, informatie over evenementen, speciale aanbiedingen en meer.

Documentatie

Documentatie

De basisbeginselen van Google Cloud
De basisbeginselen van Speech-to-Text

Ontdek de basisconcepten van Speech-to-Text.

Snelstartgids
Snelstartgids: De gcloud-tool gebruiken

Gebruik de gcloud-tool om via de opdrachtregel een audiotranscriptieverzoek naar Speech-to-Text te sturen.

Praktische tips
Praktische tips

Bekijk praktische tips voor het maken van audiotranscripties met Speech-to-Text.

De basisbeginselen van Google Cloud
Ondersteunde talen

Ontdek welke talen beschikbaar zijn voor Speech-to-Text en wat de bijbehorende functies en herkenningsmodellen zijn.

De basisbeginselen van Google Cloud
Speech-to-Text On-Prem

Bekijk meer informatie over Speech-to-Text On-Prem, waarmee u eenvoudig de spraakherkenningstechnologie van Google integreert in uw oplossingen op locatie.

Toepassingen

Toepassingen

Toepassing
De klantenservice verbeteren

Geef uw klantenservicesysteem meer gewicht door interactieve spraakreactie (ISR) en medewerkergesprekken aan uw callcenters toe te voegen. Analyseer uw gespreksgegevens om meer inzicht te krijgen in de gesprekken en uw klanten. Speech-to-Text en de bijbehorende verbeterde telefoongesprekmodellen maken al gebruik van de krachtige Google Cloud-oplossing Contact Center AI.

Contact Center AI gebruiken met spraak-naar-tekst-technologie om de klantenservice te verbeteren
Toepassing
Spraakbediening inschakelen

Implementeer spraakopdrachten zoals 'Zet het volume hoger' en gesproken zoekopdrachten zoals 'Wat is de temperatuur in Parijs?'. Combineer deze met de Text-to-Speech API voor spraakgestuurde mogelijkheden in IoT-apps.

Workflow van spraakbediening met de Speech-to-Text API
Toepassing
Transcripties maken van multimediacontent

Maak transcripties van uw audio en video om ondertiteling toe te voegen en uw doelgroepbereik en de beleving te verbeteren. Voeg in realtime ondertiteling toe aan uw streamcontent. Ons videotranscriptiemodel is ideaal voor het indexeren of ondertitelen van video en/of opnamen van meerdere sprekers en maakt gebruik van machinelearning-technologie die vergelijkbaar is met YouTube-ondertiteling.

Workflow van transcripties van multimediacontent

Alle kenmerken

Alle kenmerken

Wereldwijde woordenschat Speech-to-Text biedt ondersteuning voor gebruikers wereldwijd dankzij de herkenning van meer dan 125 talen en varianten.
Spraakherkenning tijdens het streamen Ontvang realtime spraakherkenningsresultaten terwijl de API de audio verwerkt van de microfoon van uw app of van een eerder opgenomen audiobestand (inline of via Google Cloud Storage).
Spraakaanpassing Pas spraakherkenning aan om transcripties te maken van domeinspecifieke termen en ongebruikelijke woorden door hints op te geven en de nauwkeurigheid van uw transcriptie van specifieke woorden of zinnen te verbeteren. Converteer automatisch gesproken nummers naar adressen, jaren, valuta's en meer met behulp van klassen.
Speech-to-Text On-Prem Houd volledige controle over uw infrastructuur en beveiligde spraakgegevens en gebruik tegelijkertijd de spraakherkenningstechnologie van Google op locatie, gewoon in uw eigen datacenters. Neem contact op met het verkoopteam om aan de slag te gaan.
Herkenning via meerdere kanalen Speech-to-Text kan onderscheid maken tussen verschillende kanalen in situaties met meerdere kanalen (bijv. videoconferenties) en de transcripties annoteren om de volgorde te behouden.
Ruisbestendig Speech-to-Text kan lawaaierige audio uit allerlei omgevingen verwerken zonder extra ruisonderdrukking.
Domeinspecifieke modellen Kies uit een selectie van getrainde modellen voor spraakbediening en telefoongesprek- en videotranscriptie die zijn geoptimaliseerd voor domeinspecifieke kwaliteitsvereisten. Ons verbeterde model voor telefoongesprekken is bijvoorbeeld afgestemd op audio die afkomstig is van telefonie, zoals telefoongesprekken die zijn opgenomen met een samplingsnelheid van 8 kHz.
Contentfilters Het filter voor grof taalgebruik helpt u bij het detecteren van ongepaste of onprofessionele content in uw audiogegevens en filtert scheldwoorden uit tekstresultaten.
Automatische taaldetectie (bèta) Wanneer u meertalige scenario's moet ondersteunen, kunt u tot vier taalcodes opgeven. Speech-to-Text herkent dan de gesproken taal.
Automatische leestekens (bèta) Speech-to-Text voorziet transcripties op een nauwkeurige manier van leestekens (zoals komma's, vraagtekens en punten).
Sprekerdiarisatie (bèta) Weet wie wat zei: krijg automatisch voorspellingen over welke spreker in een gesprek wat heeft gezegd.

Prijzen

Prijzen

Kosten voor Speech-to-Text worden per 15 seconden aan verwerkte audio in rekening gebracht na een Free Tier van 60 minuten.