시작하기 전에

Text-to-Speech는 Google의 인공지능(AI) 기술을 기반으로 한 API입니다. API 호출에서 텍스트 변환 데이터를 Text-to-Speech로 보낸 후 이에 대한 응답으로 자연스러운 합성 음성이 재생 가능한 오디오로 수신됩니다. Text-to-Speech의 작동 방식에 대한 자세한 내용은 기본 페이지를 참조하세요.

Google에서는 API에 요청하고 응답을 수신하는 방법을 보여주는 코드 샘플을 제공합니다. Text-to-Speech 빠른 시작안내 가이드에 따라 이러한 샘플을 사용하는 방법을 알아볼 수 있습니다.

이 가이드에서는 Text-to-Speech API로 요청을 보내는 방법을 단계별로 알아보겠습니다.

개요

Text-to-Speech를 사용하려면 먼저 Google Cloud Platform Console에서 API를 사용 설정해야 합니다. 아래 단계는 다음 작업을 안내합니다.

  • 프로젝트에서 Text-to-Speech를 사용 설정합니다.
    1. Text-to-Speech에 결제가 사용 설정되어 있는지 확인합니다.
    2. 프로젝트에 서비스 계정이 하나 이상 있어야 합니다.
    3. 서비스 계정 사용자 인증정보 키를 다운로드합니다.
  • 인증 환경 변수를 설정합니다.

Google Cloud Platform 프로젝트 설정

  1. Cloud Console에 로그인

  2. 프로젝트 선택기 페이지로 이동

    기존 프로젝트를 선택하거나 새 프로젝트를 만들 수 있습니다. 프로젝트를 만드는 방법에 대한 자세한 내용은 Google Cloud Platform 문서를 참조하세요.

  3. 새 프로젝트를 만들면 결제 계정을 이 프로젝트에 연결하라는 메시지가 표시됩니다. 기존 프로젝트를 사용중인 경우 결제가 사용 설정되어 있는지 확인합니다.

    프로젝트에 결제가 사용 설정되어 있는지 확인하는 방법을 알아보세요.

  4. 프로젝트를 선택하고 결제 계정에 연결하면 Text-to-Speech API를 사용 설정할 수 있습니다. 페이지 상단의 제품 및 리소스 검색 표시줄로 이동하여 'speech'를 입력합니다. 결과 목록에서 Cloud Text-to-Speech API를 선택합니다.

  5. Text-to-Speech API를 프로젝트에 연결하지 않고 사용해 보려면 이 API 사용해 보기 옵션을 선택합니다. Text-to-Speech API를 프로젝트에 사용하도록 설정하려면 사용 설정을 클릭합니다.

  6. 이제 하나 이상의 서비스 계정을 Text-to-Speech API에 연결해야 합니다. Text-to-Speech API 페이지 왼쪽에 있는 사용자 인증 정보 링크를 클릭합니다.

    이 프로젝트에 연결된 서비스 계정이 없는 경우 새 서비스 계정 만들기 섹션의 안내에 따라 계정을 만듭니다.

    이 프로젝트에 이전에 만든 서비스 계정이 있으면 이 페이지에 표시됩니다. Text-to-Speech로 인증하는 데 사용할 서비스 계정과 연결된 다운로드된 JSON 키에 대한 액세스 권한이 있는지 확인합니다. 서비스 계정 키는 생성 당시 한 번만 다운로드할 수 있습니다. 서비스 계정에 기존 키가 있지만 다운로드한 .json 파일을 찾을 수 없는 경우 서비스 계정의 키를 새로 만들고 .json 파일을 다운로드해야 합니다. 기존 서비스 계정에 새 키를 만드는 방법은 JSON 키 만들기 섹션의 안내를 따르세요.

    서비스 계정 및 JSON 키가 이미 있다면 이제 인증 환경 변수를 설정할 수 있습니다.

새 서비스 계정 만들기

  1. 프로젝트에 서비스 계정이 없으면 새 서비스 계정을 만듭니다. Text-to-Speech를 사용하려면 서비스 계정을 만들어야 합니다.

    서비스 계정 만들기로 이동

    서비스 계정 이름 상자에 새 서비스 계정의 고유한 이름을 입력합니다. 서비스 계정 ID 상자에 자동으로 입력됩니다. 서비스 계정 설명 상자는 선택사항이지만 여러 서비스 계정을 프로젝트와 연결하려면 사용하는 것이 좋습니다. 이 상자에 서비스 계정에 대한 간단한 설명을 입력한 다음 만들고 계속하기를 클릭합니다.

  2. 서비스 계정에 기본 IAM 역할 중 하나를 할당하는 것이 좋습니다. 필요한 경우 단일 서비스 계정에 여러 역할을 할당할 수도 있습니다. 사용 가능한 역할 및 각 역할에 허용된 권한에 대한 자세한 내용은 IAM 역할을 참조하세요. 역할 선택 드롭다운 메뉴를 클릭하고 기본까지 아래로 스크롤합니다. 오른쪽 열에 표시되는 옵션에서 이 서비스 계정의 역할을 선택할 수 있습니다. 계속을 클릭합니다.

  3. 마지막 단계에서는 필요에 따라 다른 항목(개인, Google 그룹 등)이 서비스 계정에 액세스하도록 허용할 수 있습니다. 추가 액세스 권한을 부여할 필요가 없는 경우 정보를 입력하지 않고 완료를 클릭할 수 있습니다.

  4. 이제 서비스 계정이 서비스 계정 페이지에 나열됩니다. 언제든지 서비스 계정의 권한을 변경하고, 새 키를 추가하거나 생성하고, 액세스 권한을 부여할 수 있습니다.

서비스 계정의 JSON 키 만들기

  1. 새로 생성된 서비스 계정이 서비스 계정 페이지에 나타납니다. 계정에 연결할 비공개 키를 만듭니다. Text-to-Speech에 요청을 보낼 때 인증 프로세스 중에 이 비공개 키를 사용해야 합니다. 지금 키를 만들지 않기로 선택한 경우 기본 탐색 메뉴의 IAM 및 관리자 -> 서비스 계정 옵션을 통해 서비스 계정에 액세스하여 언제든지 키를 생성하거나 개별 사용자 정보를 변경할 수 있습니다.

    키를 만들려면 서비스 계정을 클릭하고 를 선택합니다. 키 추가 -> 새 키 만들기를 클릭합니다. JSON 형식의 키를 만드는 것이 좋습니다.

  2. 선택한 형식의 새 키가 자동으로 다운로드됩니다. 이 파일을 안전한 위치에 저장하고 파일 경로를 기록해 둡니다. 각각의 새로운 Text-to-Speech 세션이 시작될 때 인증 프로세스를 진행할 때 GOOGLE_APPLICATION_CREDENTIALS 환경 변수가 이 파일로 지정해야 합니다. 이는 Text-to-Speech 요청을 인증하기 위한 필수 단계입니다. 키의 고유 ID는 서비스 계정 이름 옆에 표시됩니다.

인증 환경 변수 설정

GOOGLE_APPLICATION_CREDENTIALS를 설정하려면 프로젝트와 연결된 서비스 계정이 있고 서비스 계정의 JSON 키에 액세스할 수 있어야 합니다.

GOOGLE_APPLICATION_CREDENTIALS 환경 변수를 설정하여 애플리케이션 코드에 사용자 인증 정보를 제공합니다. 이 변수는 현재 셸 세션에만 적용됩니다. 이후 셸 세션에 이 변수를 적용하려면 셸 시작 파일(예: ~/.bashrc 또는 ~/.profile 파일)에서 변수를 설정합니다.

Linux 또는 macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

예를 들면 다음과 같습니다.

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

예를 들면 다음과 같습니다.

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

명령 프롬프트:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

자세한 내용은 Google Cloud Platform 인증 문서를 참조하세요.

Text-to-Speech API 사용 중지

Text-to-Speech API를 사용 중지하려면 Google Cloud Platform 대시보드로 이동하고 API 상자에서 API 개요로 이동 링크를 클릭합니다. Text-to-Speech API를 클릭한 후 페이지 상단의 API 사용 중지 버튼을 선택합니다.

다음 단계

클라이언트 라이브러리 또는 명령줄을 사용하여 Text-to-Speech API로 텍스트 변환 요청을 보내는 방법을 알아보세요.