Cloud Text-to-Speech
Makine öğrenimi desteğiyle metin okuma dönüşümü.
Ücretsiz Deneyin Belgeleri GösterYüksek kaliteli konuşma sentezi
Google Cloud Text-to-Speech, metinleri 30'u aşkın dil ve bu dillerin lehçelerindeki 180'in üzerinde sesle gerçek kişinin konuşmasına benzer konuşmaya dönüştürür. Yüksek kaliteli ses sunmak için çığır açan konuşma sentezi araştırmalarını (WaveNet) ve Google'ın güçlü nöral ağlarını kullanır. Kullanımı kolay bu API sayesinde kullanıcılarınızla; müşteri hizmetlerini, cihazlarla etkileşimi ve diğer uygulamaları dönüştüren gerçekçi etkileşimler oluşturabilirsiniz.
Metinlerinizi hemen konuşmaya çevirin
İstediğiniz metni yazın, bir dil seçin ve ardından yazdığınızı duymak için "Konuş" düğmesine basın.
Google makine öğrenimi destekli
Metni çeşitli ses ve dillere sentezlemek için gelişmiş derin öğrenme nöral ağı algoritmaları uygulayın. Nöral ağlarımız Google'ın konuşma sentezi uzmanlığına dayanarak oluşturulmuştur.
180'i aşkın ses arasından seçim yapın
Google Cloud Text-to-Speech, 30'u aşkın dilde ve bu dillerin lehçelerinde 180'den fazla ses sunarak geliştiricilerin, uygulamaları için en uygun sesi seçebilmesine olanak tanır.
WaveNet teknolojisine özel erişim dahildir
DeepMind, insan seslerini taklit edip kulağa daha doğal gelen ve insan performansı ile arasındaki farkı %70 azaltan bir konuşma üretmek için makine öğrenimi modellerinde çığır açan araştırmalar yapmıştır. Cloud Text-to-Speech, 90'ın üzerinde WaveNet sesine özel erişim sunmaktadır ve zaman içinde bunların sayısını artıracaktır.
Mevcut uygulama ve cihazlara kolayca entegre olur
Cloud Text-to-Speech, REST veya gRPC isteği gönderebilen her uygulama ya da cihazı destekler. Buna telefon, bilgisayar, tablet ve IoT cihazları (ör. araba, TV, hoparlör) dahildir.
Pek çok yaygın kullanım alanını destekler
Kolay kullanımlı bir API olan Google Cloud Text-to-Speech, çeşitli kullanım alanları için doğal deneyimler oluşturmaya yönelik esnek bir çözümdür. Yaygın kullanım alanları; çağrı merkezi otomasyonu, IoT cihazlarından alınan etkileşimli yanıtlar veya metnin ses olarak tüketilebilecek şekilde dönüştürülmesini içerir.
Cloud Text-to-Speech özellikleri
- Çok Dilli
- Gelecekte yenileri eklenecek olan 30'u aşkın dil ve bu dillerin lehçelerinde 180'den fazla sesi destekler.
- WaveNet Sesleri
- Kulağa en doğal gelen konuşmayı sağlayan DeepMind WaveNet seslerine özel çok dilli erişim.
- Metin ve SSML Desteği
- Konuşmanızı duraklamalar, sayılar, tarih ve saat biçimlendirmesi ve diğer telaffuz talimatlarını eklemenize olanak tanıyan SSML etiketleriyle özelleştirin.
- Konuşma Hızı Ayarı
- Konuşma hızınızı normal hızdan 4 kat daha hızlı veya yavaş olacak şekilde özelleştirin.
- Ses Perdesi Ayarı
- Seçtiğiniz sesin perdesini varsayılan çıkıştan en fazla 20 yarım ses aralığı fazla veya az olacak şekilde özelleştirin.
- Ses Artışı Kontrolü
- Ses çıkışının gücünü 16 db'e kadar yükseltin veya sesi -96 db'e kadar kısın.
- Ses Biçimi Esnekliği
- mp3, Linear16 ve Ogg Opus'u içeren bir dizi ses biçimi arasından seçim yapın.
- Ses Profilleri
- Konuşmanızı, oynatırken kullanılacak olan kulaklıklar veya telefon hatları gibi hoparlör türleri için optimize edin.
Cloud Text-to-Speech fiyatlandırması
Yüksek Kaliteli Konuşma Sentezi
Cloud Text-to-Speech, 1 milyon karakterlik ücretsiz katmanın ardından işlenen her 1 milyon karakterlik metin için ücretlendirilir. Ayrıntılı bilgi için fiyatlandırma kılavuzumuzu inceleyin.
| Özellik | Aylık ücretsiz katman | Ücretli kullanım |
|---|---|---|
| Standart (WaveNet olmayan) sesler | 0 ila 4 milyon karakter | 4,00 ABD doları / 1 milyon karakter |
| WaveNet sesleri | 0 ila 1 milyon karakter | 16,00 ABD doları / 1 milyon karakter |