始める前に

Text-to-Speech は、Google の人工知能(AI)テクノロジーを活用した API です。API 呼び出しで音声文字変換データを Text-to-Speech に送信すると、自然に聞こえる人間の音声が合成され、再生可能な音声として返されます。Text-to-Speech の仕組みについては、基本ページをご覧ください。

API にリクエストを送信してレスポンスを受信するコードサンプルが用意されています。これらのサンプルの使用方法については、Text-to-Speech のクイックスタート入門ガイドをご覧ください。

このガイドでは、Text-to-Speech API にリクエストを送信する手順について説明します。

概要

Text-to-Speech の使用を開始する前に、Google Cloud Platform Console で API を有効にする必要があります。ここでは、以下の手順について説明します。

  • プロジェクトで Text-to-Speech を有効にする。
    1. Text-to-Speech で課金を有効にする確認する。
    2. プロジェクトに 1 つ以上のサービス アカウントがあることを確認する。
    3. サービス アカウントの認証情報キーをダウンロードする。
  • 認証情報の環境変数を設定する。

Google Cloud Platform プロジェクトの設定

  1. Cloud Console にログインします。

  2. [プロジェクトの選択] ページに移動

    既存のプロジェクトを選択するか、新しいプロジェクトを作成します。プロジェクトの作成方法については、Google Cloud Platform のドキュメントをご覧ください。

  3. 新しいプロジェクトを作成する場合、このプロジェクトに請求先アカウントを関連付けるように求められます。既存のプロジェクトを使用する場合は、そのプロジェクトで課金が有効になっていることを確認します。

    プロジェクトで課金が有効になっていることを確認する

  4. プロジェクトを選択して請求先アカウントを関連付けると、Text-to-Speech API を有効にできます。ページの上部にある [プロダクトとリソースを検索] バーに「speech」と入力します。結果のリストから [Cloud Text-to-Speech API] を選択します。

  5. プロジェクトに関連付けずに Text-to-Speech を試すには、[この API を試す] オプションを選択します。プロジェクトで Text-to-Speech API を有効にするには、[有効にする] をクリックします。

  6. 1 つ以上のサービス アカウントを Text-to-Speech API にリンクする必要があります。Text-to-Speech API ページの左側にある [認証情報] リンクをクリックします。

    このプロジェクトに関連付けられたサービス アカウントがない場合は、新しいサービス アカウントの作成の手順に沿ってアカウントを作成します。

    このプロジェクトに以前に作成したサービス アカウントが関連付けられている場合は、そのアカウントがこのページに表示されます。Text-to-Speech の認証で使用するサービス アカウントに関連付けられたダウンロード済みの JSON キーにアクセスできることを確認します。サービス アカウント キーは、作成時に 1 回だけダウンロードできます。サービス アカウントにキーが存在していても、ダウンロードした .json ファイルが見つからない場合は、そのサービス アカウントに新しいキーを作成して、その .json ファイルをダウンロードする必要があります。既存のサービス アカウントに新しいキーを作成する方法については、JSON キーの作成をご覧ください。

    サービス アカウントとその JSON キーがすでに存在する場合は、認証情報の環境変数を設定できます。

新しいサービス アカウントの作成

  1. プロジェクトにサービス アカウントがない場合は、新規に作成します。Text-to-Speech を使用するには、サービス アカウントを作成する必要があります。

    [サービス アカウントの作成] に移動

    [サービス アカウント名] ボックスに、新しいサービス アカウントの一意の名前を入力します。入力内容に従って [サービス アカウント ID] ボックスに ID が自動的に入力されます。[サービス アカウントの説明] ボックスは省略できます。ただし、複数のサービス アカウントをプロジェクトに関連付ける場合は入力することをおすすめします。このボックスにサービス アカウントの簡単な説明を入力し、[作成して続行] をクリックします。

  2. 基本的な IAM ロールの 1 つをサービス アカウントに割り当てることをおすすめします。1 つのサービス アカウントに複数のロールを割り当てることもできます。使用可能なロールと、それぞれに許可される権限については、IAM ロールをご覧ください。[ロールを選択] プルダウン メニューをクリックし、[基本] までスクロールします。このサービス アカウントのロールは、右側の列に表示される選択肢から選択できます。[続行] をクリックします。

  3. 最後のステップで、他のエンティティ(個人、Google グループなど)にサービス アカウントへのアクセスを許可できます。追加のアクセス権を付与する必要がない場合は、情報を入力せずに [完了] をクリックします。

  4. サービス アカウントが [サービス アカウント] ページに表示されます。サービス アカウントの権限の変更、新しいキーの追加と生成、アクセス権の付与はいつでも行うことができます。

サービス アカウントに JSON キーを作成する

  1. 新しく作成されたサービス アカウントが [サービス アカウント] ページに表示されます。このアカウントに関連付ける秘密鍵を作成します。この秘密鍵は、Text-to-Speech にリクエストを送信する際の認証プロセスで使用する必要があります。ここでキーを作成しない場合は、メインのナビゲーション メニューで [IAM と管理] -> [サービス アカウント] の順に移動すると、鍵の生成や個々のユーザー情報の変更を行うことができます。

    キーを作成するには、サービス アカウントをクリックして [キー] を選択します。[鍵を追加] > [新しい鍵を作成] の順にクリックします。JSON 形式のキーを作成することをおすすめします。

  2. 選択した形式で新しいキーが自動的にダウンロードされます。このファイルを安全な場所に保管し、ファイルパスをメモしておきます。新しい Text-to-Speech セッションを開始したときの認証プロセスで、GOOGLE_APPLICATION_CREDENTIALS 環境変数を使用してこのファイルを指定する必要があります。これは、Text-to-Speech へのリクエストの認証で重要なステップです。サービス アカウントの名前の横に鍵の一意の ID が表示されます。

認証情報の環境変数を設定する

GOOGLE_APPLICATION_CREDENTIALS を設定するには、プロジェクトに関連付けられたサービス アカウントがあり、そのサービス アカウントの JSON キーにアクセスできる必要があります。

環境変数 GOOGLE_APPLICATION_CREDENTIALS を設定して、アプリケーション コードに認証情報を指定します。この変数は、現在のシェル セッションにのみ適用されます。この変数を新しいシェル セッションに適用する場合は、シェル起動ファイル(~/.bashrc ファイルや ~/.profile ファイルなど)で変数を設定します。

Linux または macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH をサービス アカウント キーが含まれる JSON ファイルのパスに置き換えます。

例:

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

PowerShell の場合:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH をサービス アカウント キーが含まれる JSON ファイルのパスに置き換えます。

例:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

コマンド プロンプトの場合:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

KEY_PATH をサービス アカウント キーが含まれる JSON ファイルのパスに置き換えます。

詳細については、Google Cloud Platform の認証に関するドキュメントをご覧ください。

Text-to-Speech API の無効化

Text-to-Speech API を無効にするには、Google Cloud Platform ダッシュボードに移動して、[API] ボックス [API の概要に移動] のリンクをクリックします。[Text-to-Speech API] をクリックし、ページの上部にある [API を無効にする] ボタンを選択します。

次のステップ

クライアント ライブラリまたはコマンドラインを使用して Text-to-Speech API に音声文字変換リクエストを送信する方法を学習する。