Text-to-Speech

透過採用 Google AI 技術的 API,將文字轉換為自然流暢的語音。

免費試用
  • action/check_circle_24pxCreated with Sketch.

    以自然流暢的智慧型回應改善客戶互動

  • action/check_circle_24pxCreated with Sketch.

    在您的裝置和應用程式中為使用者提供語音使用者介面

  • action/check_circle_24pxCreated with Sketch.

    依據使用者偏好的語音和語言提供個人化的訊息

優點

高傳真語音

部署 Google 的創新技術,產生語調宛如真人的語音。這個 API 是以 DeepMind 的語音合成專業知識為基礎建立而成,可提供擬真的語音。

最豐富的語音選項

系統提供 220 多種語音選項,涵蓋 40 多種語言和方言,您可以挑選最適合使用者和應用程式的語音。

獨一無二的語音

創造獨特的語音,讓您在所有客戶接觸點上呈現自己的品牌特色,而不使用與其他機構一樣的普通語音。

示範

實際運用 Text-to-Speech

自由輸入內容、選取所需語言,然後按一下 [Speak It] 即可聆聽。

主要功能與特色

主要功能與特色

Custom Voice (Beta 版)

用自己錄製的音訊訓練自訂語音合成模型,為機構打造獨樹一格且聽起來更自然的語音。您可以定義及選擇適合貴機構的語音設定檔,並且能因應語音需求的變化而快速調整,完全不用錄製新的詞組。瞭解詳情

WaveNet 語音

運用以 DeepMind 創新研究為基礎而建立的 90 多種 WaveNet 音訊,產生極為擬真的語音。

語音微調

自訂所選語音的音調,最多可以比預設音調升高或降低 20 個半音。您可以將誦讀速度調整為比正常速度快或慢 4 倍。

文字與 SSML 支援

您可以使用 SSML 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。

查看所有功能與特色

最新資訊

最新資訊

訂閱 Google Cloud 電子報,即時掌握產品動態、活動資訊和特價優惠等最新消息。

說明文件

說明文件

Google Cloud 基本資訊
Text-to-Speech 基本資訊

使用 Text-to-Speech API 的基本概念指南。

快速入門導覽課程
快速入門導覽課程:使用指令列

設定您的 Google Cloud 專案與授權,並要求 Text-to-Speech 依據文字產生音訊。

Google Cloud 基本資訊
支援的語音和語言

瞭解 Text-to-Speech 支援哪些語言,並聆聽各種語言的語音範例。

Google Cloud 基本資訊
Custom Voice (Beta 版) 總覽

瞭解如何透過 Custom Voice 功能,用自己錄製的錄音室等級音訊,創造獨樹一格且聽起來更自然的音訊。

教學課程
WaveNet 和其他合成語音

瞭解可在 Text-to-Speech 中使用的不同合成語音,包括優質的 WaveNet 語音。

教學課程
以 SSML 朗讀地址

這個教學課程會示範如何使用語音合成標記語言 (SSML) 朗讀地址文字檔案。

用途

用途

用途
客服中心內的語音機器人

動態產生語音而非播放預先錄製的靜態語音,藉此提供更優質的客戶服務語音體驗。以高品質的合成語音產生互動,讓來電者享有熟悉且個人化的服務。

客服中心語音機器人的參考架構
用途
在裝置中產生語音

讓您的裝置發出擬真語音,與使用者自然地互動。搭配使用 Speech-to-Text 來建立端對端語音使用者介面,以輕鬆、吸引人的互動改善使用者體驗。

在裝置中產生語音的參考架構

所有功能與特色

所有功能與特色

Custom Voice (Beta 版) 用自己錄製的音訊訓練自訂語音合成模型,為機構打造獨樹一格且聽起來更自然的語音。您可以定義及選擇適合貴機構的語音設定檔,並且能因應語音需求的變化而快速調整,完全不用錄製新的詞組。瞭解詳情
語音和語言選項 支援 40 多種語言和方言,提供超過 220 種語音選項。不久後還會推出更多種類,供您自由選擇。
WaveNet 語音 運用以 DeepMind 創新研究為基礎而建立的 90 多種 WaveNet 音訊,產生極為擬真的語音。
文字與 SSML 支援 您可以使用 SSML 標記來自訂語音,例如加入停頓點、數字、日期與時間格式設定,以及其他發音指示。
音調微調 自訂所選語音的音調,最多可以比預設音調升高或降低 20 個半音。
誦讀速度微調 您可以將誦讀速度調整為比正常速度快或慢 4 倍。
音量增益控制 輸出音量最多可以提高 16db 或降低 96db。
經過整合的 REST 和 gRPC API 輕鬆整合可傳送 REST 或 gRPC 要求的任何應用程式或裝置,包括手機、桌上型電腦、平板電腦和 IoT 裝置 (例如汽車、電視與喇叭)。
多種音訊格式 多種音訊格式任您選擇,包括 MP3、Linear16 和 Ogg Opus。
音訊設定檔 可針對用來播放語音的喇叭類型進行最佳化處理,例如耳罩式耳機或電話聽筒。

定價

定價

免費方案到期之後,系統會依據 Text-to-Speech 處理的文字量向您收費 (計費單位為 100 萬個字元)。

如果您使用美元以外的貨幣付費,系統將按照 Google Cloud SKU 頁面上列出的相應貨幣價格來計費。