Türkçe, 15 Ocak 2021’den itibaren cloud.google.com'da artık desteklenmeyecek.

Speech-to-Text

Google'ın AI teknolojileriyle desteklenen bir API kullanarak konuşmaları doğru şekilde yazıya dönüştürün.

Ücretsiz deneyin
  • action/check_circle_24px Sketch ile oluşturuldu.

    İçeriğinizi gerçek zamanlı olarak veya depolanan dosyalardan metne dönüştürün

  • action/check_circle_24px Sketch ile oluşturuldu.

    Sesli komutlar sayesinde ürünlerde daha iyi kullanıcı deneyimleri sunun

  • action/check_circle_24px Sketch ile oluşturuldu.

    Hizmetinizi iyileştirmek için müşteri etkileşimlerinden analizler elde edin

Avantajlar

Son teknoloji doğruluk

Otomatik konuşma tanıma (ASR) için Google'ın en gelişmiş derin öğrenme nöral ağ algoritmalarını uygulayın.

Küresel erişim

125'in üzerinde dili ve lehçeyi destekleyen ses tanıma özelliğiyle, dünyanın dört bir yanındaki kullanıcılarınıza bulundukları yerde hizmet verin.

Esnek dağıtım

Speech-to-Text On-Prem ile konuşma tanımayı ister bulutta API ile ister şirket içinde, nerede ihtiyacınız olursa orada dağıtın.

Demo

Speech-to-Text'i uygulamaya koyun

Temel özellikler

Temel özellikler

Konuşma uyarlaması

Alana özgü terimleri ve nadir rastlanan kelimeleri metne dönüştürmek için ipuçları sağlayarak konuşma tanımayı özelleştirin ve belirli kelime veya ifadelerde metne dönüştürme doğruluğunuzu artırın. Sınıflar kullanıp sesli numaraları otomatik olarak adrese, yıla, para birimine veya diğer biçimlere dönüştürün.

Alana özgü modeller

Alana özgü kalite gereksinimleri için optimize edilen, sesli kontrol veya telefon çağrılarını ve videoları metne dönüştürme için eğitilmiş modeller arasından seçim yapın. Örneğin, zenginleştirilmiş telefon çağrısı modelimiz, 8 khz örnekleme hızında kaydedilen telefon çağrıları gibi ses iletimlerinden gelen sesler için ayarlanmıştır.

Gerçek zamanlı konuşma tanıma

API, uygulamanızın mikrofonundan yayınlanan veya önceden kaydedilen bir ses dosyasından (satır içi olarak veya Cloud Storage üzerinden) gönderilen ses girişini işlerken gerçek zamanlı konuşma tanıma sonuçları elde edin.

Speech-to-Text On-Prem

Google'ın konuşma tanıma teknolojisini şirket içinde, özel veri merkezlerinizde kullanın ve hem altyapınız hem de korunan konuşma verileriniz üzerinde tam kontrol sahibi olun. Başlamak için satış ekibiyle iletişime geçin.

Tüm özellikleri göster

Yenilikler

Yenilikler

Ürün güncellemeleri, etkinlik bilgileri, özel teklifler ve daha fazlasını almak için Google Cloud bültenlerine kaydolun.

Belgeler

Belgeler

Google Cloud'un Temel Özellikleri
Speech-to-Text ile ilgili temel bilgiler

Speech-to-Text ile ilgili temel kavramları öğrenin.

Hızlı Başlangıç Kılavuzu
Hızlı başlangıç: gcloud aracını kullanma

Komut satırından gcloud aracını kullanarak Speech-to-Text'e sesi metne dönüştürme isteği gönderin.

En İyi Uygulama
En iyi uygulamalar

Speech-to-Text'i kullanarak sesleri metne dönüştürme ile ilgili en iyi uygulamaları inceleyin.

Google Cloud'un Temel Özellikleri
Desteklenen diller

Speech-to-Text'in hangi dillerde kullanılabildiğini ve her dil için sunulan özellikleri ve tanıma modellerini öğrenin.

Google Cloud'un Temel Özellikleri
Speech-to-Text On-Prem

Google konuşma tanıma teknolojisinin şirket içinde çözümlerle kolay entegrasyonuna olanak tanıyan Speech-To-Text On-Prem hakkında daha fazla bilgi edinin.

Kullanım alanları

Kullanım alanları

Kullanım alanı
Müşteri hizmetlerini iyileştirme

Çağrı merkezlerinize ESY (etkileşimli sesli yanıt) ve aracı sohbetleri ekleyerek müşteri hizmetleri sisteminizi güçlendirin. Konuşma verileriniz üzerinde analizler yürüterek çağrılarla ve müşterilerinizle ilgili daha fazla bilgi sahibi olun. Speech-to-Text ve gelişmiş telefon çağrısı modelleri, Google Cloud'un güçlü Contact Center AI çözümünü destekler.

Müşteri hizmetlerini iyileştirmek için Contact Center AI çözümünü sesle yazma teknolojisiyle birlikte kullanma
Kullanım alanı
Sesli kontrolü etkinleştirme

"Sesi yükselt" gibi sesli komutlar ve "Paris'te hava durumu nasıl?" gibi sesli aramalar kullanın. Bunları Text-to-Speech API ile birleştirerek IoT (Nesnelerin İnterneti) uygulamalarında sesle etkinleştirilen deneyimler sunun.

Speech-to-Text API kullanan sesli kontrol iş akışı
Kullanım alanı
Multimedya içeriklerini metne dönüştürme

Ses dosyalarınızı ve videolarınızı metne dönüştürerek oluşturduğunuz altyazılarla kitle erişiminizi ve sunduğunuz deneyimi iyileştirin. İçerik akışınızdaki içeriklere gerçek zamanlı altyazılar ekleyin. Videoyu metne dönüştürme modelimiz, videoları ve/veya çok konuşmacılı içerikleri dizine eklemek ya da bunlara altyazı hazırlamak için idealdir ve YouTube altyazı aracına benzer bir makine öğrenimi teknolojisi kullanır.

Multimedya içeriklerini metne dönüştürme iş akışı

Tüm özellikler

Tüm özellikler

Global kelime hazinesi Speech-to-Text'in 125'ten fazla dil ve lehçedeki kapsamlı dil desteğiyle küresel kullanıcı tabanınızı destekleyin.
Gerçek zamanlı konuşma tanıma API, uygulamanızın mikrofonundan yayınlanan veya önceden kaydedilen bir ses dosyasından (satır içi veya Cloud Storage) gönderilen ses girişini işlerken gerçek zamanlı konuşma tanıma sonuçları elde edin.
Konuşma uyarlaması Alana özgü terimleri ve nadir rastlanan kelimeleri metne dönüştürmek için ipuçları sağlayarak konuşma tanımayı özelleştirin ve belirli kelime veya ifadelerde metne dönüştürme doğruluğunuzu artırın. Sınıflar kullanıp sesli numaraları otomatik olarak adrese, yıla, para birimine veya diğer biçimlere dönüştürün.
Speech-to-Text On-Prem Google'ın konuşma tanıma teknolojisini şirket içinde, özel veri merkezlerinizde kullanın ve hem altyapınız hem de korunan konuşma verileriniz üzerinde tam kontrol sahibi olun. Başlamak için satış ekibiyle iletişime geçin.
Çok kanallı tanıma Speech-to-Text, çok kanallı durumlarda (ör. video konferans) farklı kanalları tanıyabilir ve dönüştürülen metinlere konuşma sırasını koruyacak şekilde notlar ekler.
Gürültüye karşı dayanıklılık Speech-to-Text, birçok ortamda gürültülü sesleri ek bir gürültü giderme işlemi gerekmeden işleyebilir.
Alana özgü modeller Alana özgü kalite gereksinimleri için optimize edilen, sesli kontrol veya telefon çağrılarını ve videoları metne dönüştürme için eğitilmiş modeller arasından seçim yapın. Örneğin, zenginleştirilmiş telefon çağrısı modelimiz, 8 khz örnekleme hızında kaydedilen telefon çağrıları gibi ses iletimlerinden gelen sesler için ayarlanmıştır.
İçerik filtreleme Küfür filtresi, ses verilerinizdeki uygunsuz veya profesyonelliğe aykırı içerikleri algılamanıza ve küfürlü kelimeleri metin sonuçlarından çıkarmanıza yardımcı olur.
Otomatik dil algılama (beta) Speech-to-Text, çok dilli senaryolarda konuşulan doğru dili belirler. Dört adede kadar dil kodu belirtebilirsiniz.
Otomatik noktalama (beta) Speech-to-Text metinlere doğru noktalama işaretlerini yerleştirir (ör. virgül, soru işareti, nokta).
Konuşmacı ayrıştırma (beta) Her bir ifadeyi konuşmadaki kişilerin hangisinin sarf ettiğine dair otomatik tahminler alarak neyi kimin söylediğini bilin.

Fiyatlandırma

Fiyatlandırma

Her ay başarıyla işlenen Speech-to-Text işlevinin ilk 60 dakikası ücretsizdir, ardından 15 saniyelik ses başına fiyatlandırılır. Belirli ücretler; kullanılan modele, veri günlük kaydı olup olmadığına ve ses kanallarının sayısına bağlı olarak değişir.