Text-to-Speech

Google'ın AI teknolojileriyle desteklenen bir API kullanarak metinleri doğal konuşmalara dönüştürün.

Ücretsiz deneyin
  • action/check_circle_24px Sketch ile oluşturuldu.

    Akıllı ve gerçekçi yanıtlarla müşteri etkileşimlerini iyileştirin

  • action/check_circle_24px Sketch ile oluşturuldu.

    Sesli kullanıcı arayüzü sayesinde cihazlarınızda ve uygulamalarınızda kullanıcılarla etkileşim kurun

  • action/check_circle_24px Sketch ile oluşturuldu.

    Kullanıcıların ses ve dil tercihlerine göre iletişiminizi kişiselleştirin

Yüksek doğruluk oranı sunan konuşma

İnsan sesine benzer tonlama sunan konuşmalar oluşturmak için Google'ın çığır açan teknolojilerini kullanarak dağıtım yapın. DeepMind'ın konuşma sentezi uzmanlığı temel alınarak derlenen API, insan sesi kalitesine yakın sesler sunar.

En geniş ses yelpazesi

40'ı aşkın dil ve lehçe genelinde 220'yi aşkın ses arasından seçim yapın. Kullanıcınız ve uygulamanız için en uygun sesi seçin.

Hızlandırılmış yenilikler

Çok dilli ses içerikleri ve ses botları gibi kullanım alanlarını açığa çıkarmak için Google'ın Çeviri ve Speech-to-Text çözümlerinde sunduğu en iyi teknolojilerden de faydalanın.

Text-to-Speech'i uygulamaya koyun

İstediğiniz metni yazın, bir dil seçin ve ardından yazdığınızı duymak için "Konuş" düğmesine basın.

Temel özellikler

WaveNet sesleri

DeepMind'ın insan performansı ile farkı büyük ölçüde azaltan konuşmalar üretmek için yürüttüğü çığır açan araştırmalara dayanarak derlenen 90'ı aşkın WaveNet sesinden faydalanın.

Ses ayarı

Seçtiğiniz sesin perdesini, varsayılan sesten en fazla 20 yarım ses aralığı yüksek veya düşük olacak şekilde kişiselleştirin. Konuşma hızınızı normal hızdan 4 kat daha hızlı veya yavaş olacak şekilde ayarlayın.

Metin ve SSML desteği

Konuşmanızı duraklamalar, sayılar, tarih ve saat biçimlendirmesi ve diğer telaffuz talimatlarını eklemenize olanak tanıyan SSML etiketleriyle özelleştirin.

Tüm özellikleri göster

Yenilikler

Ürün güncellemeleri, etkinlik bilgileri, özel teklifler ve daha fazlasını almak için Google Cloud bültenlerine kaydolun.

Belgeler

Google Cloud'un Temel Özellikleri
Text-to-Speech ile ilgili temel bilgiler

Text-to-Speech API kullanımıyla ilgili temel kavramlar kılavuzu.

Hızlı Başlangıç
Komut satırını kullanarak hızlı başlangıç

Google Cloud projenizi ve yetkilendirmenizi ayarlayın ve Text-to-Speech'in metinden ses oluşturması için istekte bulunun.

Google Cloud'un Temel Özellikleri
Desteklenen sesler ve diller

Text-to-Speech'in hangi dilleri desteklediğini görün ve her bir dil için kullanılabilen ses örneklerini dinleyin.

Eğitici
WaveNet ve diğer sentetik sesler

Premium WaveNet sesleri dahil Text-to-Speech'te kullanılabilen farklı sentetik sesler hakkında bilgi edinin.

Eğitici
SSML kullanarak adresleri seslendirme

Bu eğitici, adreslerden oluşan bir metin dosyasını seslendirmek için Konuşma Sentezi Biçimlendirme Dili (SSML) kullanımını gösterir.

Kullanım alanları

Kullanım alanı
İletişim merkezlerinde sesli botlar

Önceden kaydedilmiş statik sesleri çalmak yerine dinamik konuşmalar oluşturarak müşteri hizmetleri için daha iyi bir ses deneyimi sunun. Arayanlara aşinalık ve kişiselleştirme hissi sunan yüksek kaliteli sentezlenmiş seslerle etkileşim sağlayın.

İletişim merkezlerinde sesli botlar referans mimarisi
Kullanım alanı
Cihazlarda ses oluşturma

Cihazlarınızın insan benzeri seslerle konuşmasını sağlayarak kullanıcılarınızla doğal iletişimler kurun. Speech-to-Text ile birlikte uçtan uca sesli kullanıcı arayüzü oluşturun. Basit ve ilgi çekici etkileşimlerle kullanıcı deneyimini iyileştirin.

Cihazlarda ses oluşturma referans mimarisi

Tüm özellikler

Ses ve dil seçimi Gelecekte yenileri eklenecek olan 40'ı aşkın dil ve lehçede 220'den fazla ses arasından seçim yapın.
WaveNet sesleri DeepMind'ın insan performansı ile farkı büyük ölçüde azaltan konuşmalar üretmek için yürüttüğü çığır açan araştırmalara dayanarak derlenen 90'ı aşkın WaveNet sesinden faydalanın.
Metin ve SSML desteği Konuşmanızı duraklamalar, sayılar, tarih ve saat biçimlendirmesi ve diğer telaffuz talimatlarını eklemenize olanak tanıyan SSML etiketleriyle özelleştirin.
Ses perdesi ayarı Seçtiğiniz sesin perdesini, varsayılan sesten en fazla 20 yarım ses aralığı yüksek veya düşük olacak şekilde kişiselleştirin.
Konuşma hızı ayarı Konuşma hızınızı normal hızdan 4 kat daha hızlı veya yavaş olacak şekilde ayarlayın.
Ses artışı kontrolü Ses çıkışının gücünü 16 db'e kadar yükseltin veya sesi -96 db'e kadar kısın.
Entegre REST ve gRPC API'leri Telefon, bilgisayar, tablet ve IoT cihazları (ör. araba, TV, hoparlör) gibi REST veya gRPC isteği gönderebilen herhangi bir cihazla ya da uygulamayla kolayca entegrasyon sağlayın.
Ses biçimi esnekliği mp3, Linear16 ve Ogg Opus'u içeren bir dizi ses biçimi arasından seçim yapın.
Ses profilleri Konuşmanızı, oynatırken kullanılacak olan kulaklıklar veya telefon hatları gibi hoparlör türleri için optimize edin.

Fiyatlandırma

Text-to-Speech, ücretsiz katmandan sonra işlenen 1 milyon karakterli metin başına ücretlendirilir.

ABD dolarından farklı bir para biriminde ödeme yaparsanız Google Cloud SKU'larında para biriminizde listelenen fiyatlar geçerli olur.