시작하기 전에

Speech-to-Text는 Google의 인공지능(AI) 기술을 기반으로 한 API입니다. 오디오 데이터를 Speech-to-Text로 전송한 다음 응답으로 오디오 데이터의 텍스트 스크립트 작성을 수신합니다. Speech-to-Text의 작동 방식에 대한 자세한 내용은 기본사항 페이지를 참조하세요.

서비스에 액세스하는 방법에는 REST API를 사용하거나 Speech-to-Text 콘솔을 사용하는 두 가지가 있습니다. Google에서는 REST API에 요청하고 응답을 수신하는 방법을 보여주는 코드 샘플을 제공합니다. Speech-to-Text 빠른 시작안내 가이드에 따라 이러한 샘플을 사용하는 방법을 알아보세요. 최소한의 코딩으로 Speech-to-Text를 사용하려는 경우 Cloud Speech-to-Text 콘솔을 사용할 수 있습니다.

이 가이드에서는 REST API로 요청을 보내기 위해 필요한 단계를 설명합니다. Speech-to-Text 콘솔을 사용하려면 UI 콘솔 빠른 시작을 참조하세요.

개요

Speech-to-Text에 요청을 보내려면 먼저 Google Cloud Console에서 API를 사용 설정해야 합니다. 이 페이지의 단계에서는 다음 작업을 안내합니다.

  • 프로젝트에서 Speech-to-Text를 사용 설정합니다.
    1. Speech-to-Text에 결제가 사용 설정되어 있는지 확인합니다.
    2. 프로젝트에 서비스 계정이 하나 이상 있어야 합니다.
    3. 서비스 계정 사용자 인증정보 키를 다운로드합니다.
  • 인증 환경 변수를 설정합니다.
  • (선택사항) 오디오 데이터를 저장할 새 Google Cloud Storage 버킷을 만듭니다.

Google Cloud 프로젝트 설정

  1. Cloud Console에 로그인

  2. 프로젝트 선택기 페이지로 이동

    기존 프로젝트를 선택하거나 새 프로젝트를 만들 수 있습니다. 프로젝트 생성에 대한 자세한 내용은 프로젝트 만들기 및 관리를 참조하세요.

  3. 새 프로젝트를 만들면 결제 계정을 이 프로젝트에 연결하라는 메시지가 표시됩니다. 기존 프로젝트를 사용중인 경우 결제가 사용 설정되어 있는지 확인합니다.

    프로젝트에 결제가 사용 설정되어 있는지 확인하는 방법을 알아보세요.

  4. 프로젝트를 선택하고 결제 계정에 연결하면 Speech-to-Text API를 사용 설정할 수 있습니다. 페이지 상단의 제품 및 리소스 검색 표시줄로 이동하여 'speech'를 입력합니다. 결과 목록에서 Cloud Speech-to-Text API를 선택합니다.

  5. API를 프로젝트에 연결하지 않고 Speech-to-Text를 사용해 보려면 API 사용해 보기 옵션을 선택합니다. 프로젝트에서 사용할 Speech-to-Text API를 사용 설정하려면 사용 설정을 클릭합니다.

  6. (선택사항) 데이터 로깅을 사용 설정합니다. 데이터 로깅을 선택하면 Speech-to-Text로 전송하는 모든 오디오 데이터를 Google이 기록하도록 허용할 수 있습니다. 이 데이터는 Speech-to-Text 모델을 개선하는 데 사용됩니다. 데이터 로깅을 선택한 사용자는 더 저렴한 가격으로 이용할 수 있습니다. 자세한 내용은 가격 책정 및 데이터 로깅 이용약관 페이지를 참조하세요.

  7. 이제 하나 이상의 서비스 계정을 Speech-to-Text API에 연결해야 합니다. Speech-to-Text API 기본 페이지 왼쪽의 사용자 인증 정보 메뉴 항목을 클릭합니다. 이 프로젝트에 연결된 서비스 계정이 없는 경우 새 서비스 계정 만들기 섹션의 안내에 따라 계정을 만듭니다.

    이 프로젝트에 이전에 만든 서비스 계정이 있으면 이 페이지에 표시됩니다. Speech-to-Text로 인증하는 데 사용할 서비스 계정과 연결된 다운로드된 JSON 키에 대한 액세스 권한이 있는지 확인합니다. 서비스 계정 키는 생성 당시 한 번만 다운로드할 수 있습니다. 서비스 계정에 기존 키가 있지만 다운로드한 .json 파일을 찾을 수 없는 경우 서비스 계정의 키를 새로 만들고 .json 파일을 다운로드해야 합니다. 기존 서비스 계정에 새 키를 만드는 방법은 JSON 키 만들기 섹션의 안내를 따르세요.

    서비스 계정 및 JSON 키가 이미 있다면 이제 인증 환경 변수를 설정할 수 있습니다.

서비스 계정 만들기

  1. 프로젝트에 서비스 계정이 없으면 새 서비스 계정을 만듭니다. Speech-to-Text를 사용하려면 서비스 계정을 만들어야 합니다.

    서비스 계정 만들기로 이동

    서비스 계정 이름 상자에 새 서비스 계정의 고유한 이름을 입력합니다. 서비스 계정 ID 상자에 자동으로 입력됩니다. 서비스 계정 설명 상자는 선택사항이지만 여러 서비스 계정을 프로젝트와 연결하려면 사용하는 것이 좋습니다. 이 상자에 서비스 계정에 대한 간단한 설명을 입력한 다음 만들고 계속하기를 클릭합니다.

  2. 서비스 계정에 기본 IAM 역할 중 하나를 할당하는 것이 좋습니다. 필요한 경우 단일 서비스 계정에 여러 역할을 할당할 수도 있습니다. 사용 가능한 역할 및 각 역할에 허용된 권한에 대한 자세한 내용은 IAM 역할을 참조하세요. 역할 선택 드롭다운 메뉴를 클릭하고 기본까지 아래로 스크롤합니다. 오른쪽 열에 표시되는 옵션에서 이 서비스 계정의 역할을 선택할 수 있습니다. 계속을 클릭합니다.

  3. 마지막 단계에서는 필요에 따라 다른 항목(개인, Google 그룹 등)이 서비스 계정에 액세스하도록 허용할 수 있습니다. 추가 액세스 권한을 부여할 필요가 없는 경우 정보를 입력하지 않고 완료를 클릭할 수 있습니다.

  4. 이제 서비스 계정이 서비스 계정 페이지에 나열됩니다. 언제든지 서비스 계정의 권한을 변경하고, 새 키를 추가하거나 생성하고, 액세스 권한을 부여할 수 있습니다.

서비스 계정의 JSON 키 만들기

  1. 새로 생성된 서비스 계정이 서비스 계정 페이지에 나타납니다. 계정에 연결할 비공개 키를 만듭니다. Speech-to-Text에 요청을 보낼 때 인증 프로세스 중에 이 비공개 키를 사용해야 합니다. 지금 키를 만들지 않기로 선택한 경우 기본 탐색 메뉴의 IAM 및 관리자 -> 서비스 계정 옵션을 통해 서비스 계정에 액세스하여 언제든지 키를 생성하거나 개별 사용자 정보를 변경할 수 있습니다.

    키를 만들려면 서비스 계정을 클릭하고 탭을 선택합니다. 키 추가 -> 새 키 만들기를 클릭합니다. JSON 형식의 키를 만드는 것이 좋습니다.

  2. 선택한 형식의 새 키가 자동으로 다운로드됩니다. 이 파일을 안전한 위치에 저장하고 파일 경로를 기록해 둡니다. 각각의 새로운 Speech-to-Text 세션이 시작될 때 인증 프로세스를 진행할 때 GOOGLE_APPLICATION_CREDENTIALS 환경 변수가 이 파일로 지정해야 합니다. 이 단계는 Speech-to-Text에 대한 요청을 인증하는 필수 단계입니다. 키의 고유 ID는 서비스 계정 이름 옆에 표시됩니다.

인증 환경 변수 설정

GOOGLE_APPLICATION_CREDENTIALS를 설정하려면 프로젝트와 연결된 서비스 계정이 있고 서비스 계정의 JSON 키에 액세스할 수 있어야 합니다.

GOOGLE_APPLICATION_CREDENTIALS 환경 변수를 설정하여 애플리케이션 코드에 사용자 인증 정보를 제공합니다. 이 변수는 현재 셸 세션에만 적용됩니다. 이후 셸 세션에 이 변수를 적용하려면 셸 시작 파일(예: ~/.bashrc 또는 ~/.profile 파일)에서 변수를 설정합니다.

Linux 또는 macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

예를 들면 다음과 같습니다.

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

예를 들면 다음과 같습니다.

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

명령 프롬프트:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

KEY_PATH를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.

자세한 내용은 Google Cloud Platform 인증 문서를 참조하세요.

선택사항: Cloud Storage 버킷 만들기

60초보다 길거나 파일 크기가 10MB보다 큰 오디오 스크립트를 작성하려면 Cloud Storage 버킷에 오디오 데이터를 저장해야 Speech-to-Text를 사용해 스크립트를 작성할 수 있습니다. 다음 단계에서는 새 버킷을 만드는 과정을 안내합니다.

  • Cloud Console에서 Cloud Storage 브라우저 페이지로 이동합니다.

    브라우저로 이동

  • 버킷 만들기를 클릭합니다.
  • 버킷 만들기 페이지에서 버킷 정보를 입력합니다. 다음 단계로 이동하려면 계속을 클릭합니다.
    • 버킷 이름 지정에 고유한 버킷 이름을 입력합니다. 버킷 네임스페이스는 전역적이며 공개로 표시되므로 버킷 이름에 민감한 정보를 포함해서는 안 됩니다.
    • 데이터 저장 위치 선택에서 다음을 수행합니다.
      • 위치 유형 옵션을 선택합니다.
      • 위치 옵션을 선택합니다.
    • 데이터의 기본 스토리지 클래스 선택에서 스토리지 클래스를 선택합니다.
    • 객체 액세스를 제어하는 방법 선택에서 액세스 제어 옵션을 선택합니다.
    • 고급 설정(선택사항)에서 암호화 방법, 보관 정책 또는 버킷 라벨을 지정합니다.
  • 만들기를 클릭합니다.
  • Speech-to-Text API 사용 중지

    이후에 Speech-to-Text API를 더 이상 사용할 필요가 없으면 다음 단계를 완료하세요.

    1. Google Cloud 대시보드로 이동하여 API 상자의 API 개요로 이동 링크를 클릭합니다.
    2. Cloud Speech-to-Text API를 선택합니다.
    3. Cloud Speech-to-Text API 페이지 상단에 있는 API 사용 중지 버튼을 클릭합니다.

    다음 단계

    클라이언트 라이브러리, gcloud, 명령줄 또는 Speech-to-Text UI를 사용하여 Speech-to-Text API에 스크립트 작성 요청을 보내는 방법을 알아보세요.