Speech-to-Text
Converteer op nauwkeurige wijze spraak naar tekst met een API, mogelijk gemaakt door de AI-technologieën van Google.
Kosteloos proberen-
Maak in realtime een transcript van uw content of gebruik opgeslagen bestanden
-
Verbeter de gebruikerservaring in producten met behulp van spraakopdrachten
-
Haal inzichten uit het contact met klanten om uw service te verbeteren
Voordelen
Uitstekende nauwkeurigheid
Pas de meest geavanceerde neurale netwerkalgoritmen voor deep learning voor automatische spraakherkenning (ASR) van Google toe.
Wereldwijd bereik
Kom uw gebruikers wereldwijd tegemoet met spraakherkenning in meer dan 125 talen en varianten.
Flexibele implementatie
Implementeer spraakherkenning waar nodig, in de cloud met de API of op locatie met Speech-to-Text On-Prem.
Demo
Speech-to-Text in de praktijk
Belangrijkste functies
Belangrijkste functies
Spraakaanpassing
Pas spraakherkenning aan om transcripties te maken van domeinspecifieke termen en ongebruikelijke woorden door hints op te geven en de nauwkeurigheid van uw transcriptie van specifieke woorden of zinnen te verbeteren. Converteer gesproken nummers automatisch naar adressen, jaren, valuta's en meer met behulp van klassen.
Domeinspecifieke modellen
Kies uit een selectie van getrainde modellen voor spraakbediening en telefoongesprek- en videotranscriptie die zijn geoptimaliseerd voor domeinspecifieke kwaliteitsvereisten. Ons verbeterde model voor telefoongesprekken is bijvoorbeeld afgestemd op audio die afkomstig is van telefonie, zoals telefoongesprekken die zijn opgenomen met een samplingsnelheid van 8 kHz.
Spraakherkenning tijdens het streamen
Ontvang realtime spraakherkenningsresultaten terwijl de API de audio verwerkt van de microfoon van uw app of van een eerder opgenomen audiobestand (inline of via Google Cloud Storage).
Speech-to-Text On-Prem
Houd volledige controle over uw infrastructuur en beveiligde spraakgegevens en gebruik tegelijkertijd de spraakherkenningstechnologie van Google op locatie, gewoon in uw eigen datacenters. Neem contact op met het salesteam om aan de slag te gaan.
Klanten
Klanten
Kernpunten uit het verhaal
-
Gebruikers kunnen woorden of zinnen zoeken in audiocontent.
-
De nauwkeurigheid van de conversie van audio naar tekst is groter dan 96%.
-
Standaardzoekopdrachten hebben een wachttijd van slechts 50 milliseconden.
Branche
-
Technologie
Wat is er nieuw
Wat is er nieuw
Meld u aan voor Google Cloud-nieuwsbrieven met productupdates, informatie over evenementen, speciale aanbiedingen en meer.
Documentatie
Documentatie
De basisbeginselen van Speech-to-Text
Ontdek de basisconcepten van Speech-to-Text.
Snelstartgids: De gcloud-tool gebruiken
Gebruik de gcloud-tool om via de opdrachtregel een audiotranscriptieverzoek naar Speech-to-Text te sturen.
Praktische tips
Bekijk praktische tips om audiotranscripties te maken met Speech-to-Text.
Ondersteunde talen
Ontdek welke talen beschikbaar zijn voor Speech-to-Text en wat de bijbehorende functies en herkenningsmodellen zijn.
Speech-to-Text On-Prem
Bekijk meer informatie over Speech-to-Text On-Prem, waarmee u eenvoudig de spraakherkenningstechnologie van Google integreert in uw oplossingen op locatie.
Toepassingen
Toepassingen
Geef uw klantenservicesysteem meer gewicht door interactieve spraakreactie (ISR) en medewerkergesprekken aan uw callcenters toe te voegen. Analyseer uw gespreksgegevens om meer inzicht te krijgen in de gesprekken en uw klanten. Speech-to-Text en de bijbehorende verbeterde telefoongesprekmodellen maken al gebruik van de krachtige Google Cloud-oplossing Contact Center AI.
Implementeer spraakopdrachten zoals 'Zet het volume hoger' en gesproken zoekopdrachten zoals 'Wat is de temperatuur in Parijs?'. Combineer deze met de Text-to-Speech API voor spraakgestuurde mogelijkheden in IoT-apps.
Maak transcripties van uw audio en video om ondertiteling toe te voegen en uw doelgroepbereik en de beleving te verbeteren. Voeg in realtime ondertiteling toe aan uw streamcontent. Ons videotranscriptiemodel is ideaal voor het indexeren of ondertitelen van video en/of opnamen van meerdere sprekers en maakt gebruik van machinelearning-technologie die vergelijkbaar is met YouTube-ondertiteling.
Alle kenmerken
Alle kenmerken
Wereldwijde woordenschat | Speech-to-Text biedt ondersteuning voor gebruikers wereldwijd dankzij de herkenning van meer dan 125 talen en varianten. |
Spraakherkenning tijdens het streamen | Ontvang realtime spraakherkenningsresultaten terwijl de API de audio verwerkt van de microfoon van uw app of van een eerder opgenomen audiobestand (inline of via Google Cloud Storage). |
Spraakaanpassing | Pas spraakherkenning aan om transcripties te maken van domeinspecifieke termen en ongebruikelijke woorden door hints op te geven en de nauwkeurigheid van uw transcriptie van specifieke woorden of zinnen te verbeteren. Converteer gesproken nummers automatisch naar adressen, jaren, valuta's en meer met behulp van klassen. |
Speech-to-Text On-Prem | Houd volledige controle over uw infrastructuur en beveiligde spraakgegevens en gebruik tegelijkertijd de spraakherkenningstechnologie van Google op locatie, gewoon in uw eigen datacenters. Neem contact op met het salesteam om aan de slag te gaan. |
Herkenning via meerdere kanalen | Speech-to-Text kan onderscheid maken tussen verschillende kanalen in situaties met meerdere kanalen (bijv. videoconferenties) en de transcripties annoteren om de volgorde te behouden. |
Ruisbestendig | Speech-to-Text kan lawaaierige audio uit allerlei omgevingen verwerken zonder extra ruisonderdrukking. |
Domeinspecifieke modellen | Kies uit een selectie van getrainde modellen voor spraakbediening en telefoongesprek- en videotranscriptie die zijn geoptimaliseerd voor domeinspecifieke kwaliteitsvereisten. Ons verbeterde model voor telefoongesprekken is bijvoorbeeld afgestemd op audio die afkomstig is van telefonie, zoals telefoongesprekken die zijn opgenomen met een samplingsnelheid van 8 kHz. |
Contentfilters | Het filter voor grof taalgebruik helpt u bij het detecteren van ongepaste of onprofessionele content in uw audiogegevens en filtert scheldwoorden uit tekstresultaten. |
Automatische taaldetectie (bèta) | Wanneer u meertalige scenario's moet ondersteunen, kunt u tot vier taalcodes opgeven. Speech-to-Text herkent dan de gesproken taal. |
Automatische leestekens (bèta) | Speech-to-Text voorziet transcripties op een nauwkeurige manier van leestekens (zoals komma's, vraagtekens en punten). |
Sprekerdiarisatie (bèta) | Weet wie wat zei: krijg automatisch voorspellingen over welke spreker in een gesprek wat heeft gezegd. |
Prijzen
Prijzen
Voor de eerste 60 minuten van spraak-naar-tekst die u elke maand verwerkt, worden geen kosten in rekening gebracht. Daarna betaalt u per 15 seconden aan audio. De specifieke tarieven variëren afhankelijk van het model dat u gebruikt, of er gegevens worden geregistreerd en het aantal audiokanalen.