Speech-to-Text는 Google의 인공지능(AI) 기술을 기반으로 한 API입니다. 오디오 데이터를 Speech-to-Text로 전송한 다음 응답으로 오디오 데이터의 텍스트 스크립트 작성을 수신합니다.
Speech-to-Text 요청을 구성하는 방법에 대한 자세한 내용은 요청 페이지를 참조하세요.
개요
Speech-to-Text에 요청을 보내려면 먼저 Google Cloud Console에서 API를 사용 설정해야 합니다. 이 페이지의 단계는 다음 작업을 안내합니다.
- 프로젝트에서 Speech-to-Text를 사용 설정합니다.
- Speech-to-Text에 결제가 사용 설정되어 있는지 확인합니다.
- 프로젝트에 서비스 계정이 하나 이상 있어야 합니다.
- 서비스 계정 사용자 인증정보 키를 다운로드합니다.
- 인증 환경 변수를 설정합니다.
- (선택사항) 오디오 데이터를 저장할 새 Google Cloud Storage 버킷을 만듭니다.
시작하기 전에
서비스에 액세스하는 방법에는 REST API를 사용하거나 Speech-to-Text 콘솔을 사용하는 두 가지가 있습니다. Google에서는 REST API에 요청하고 응답을 수신하는 방법을 보여주는 코드 샘플을 제공합니다. Speech-to-Text 빠른 시작 및 안내 가이드에 따라 이러한 샘플을 사용하는 방법을 알아보세요. 최소한의 코딩으로 Speech-to-Text를 사용하려는 경우 Cloud Speech-to-Text 콘솔을 사용할 수 있습니다.
이 가이드에서는 REST API로 요청을 보내기 위해 필요한 단계를 설명합니다. 코딩을 처음 사용하는 경우 이 빠른 시작을 시작하기 전에 Google Cloud Platform의 단계별 콘솔 내 튜토리얼부터 시작하는 것이 좋습니다.
Speech-to-Text용 Google Cloud 프로젝트 설정
-
기존 프로젝트를 선택하거나 새 프로젝트를 만들 수 있습니다. 프로젝트 생성에 대한 자세한 내용은 프로젝트 만들기 및 관리를 참조하세요.
새 프로젝트를 만들면 결제 계정을 이 프로젝트에 연결하라는 메시지가 표시됩니다. 기존 프로젝트를 사용중인 경우 결제가 사용 설정되어 있는지 확인합니다.
프로젝트를 선택하고 결제 계정에 연결하면 Speech-to-Text API를 사용 설정할 수 있습니다. 페이지 상단의 제품 및 리소스 검색 표시줄로 이동하여 'speech'를 입력합니다. 결과 목록에서 Cloud Speech-to-Text API를 선택합니다.
API를 프로젝트에 연결하지 않고 Speech-to-Text를 사용해 보려면 API 사용해 보기 옵션을 선택합니다. 프로젝트에서 사용할 Speech-to-Text API를 사용 설정하려면 사용 설정을 클릭합니다.
(선택사항) 데이터 로깅을 사용 설정합니다. 데이터 로깅을 선택하면 Speech-to-Text로 전송하는 모든 오디오 데이터를 Google이 기록하도록 허용할 수 있습니다. 이 데이터는 Speech-to-Text 모델을 개선하는 데 사용됩니다. 데이터 로깅을 선택한 사용자는 더 저렴한 가격으로 이용할 수 있습니다. 자세한 내용은 가격 책정 및 데이터 로깅 이용약관 페이지를 참조하세요.
이제 하나 이상의 서비스 계정을 Speech-to-Text API에 연결해야 합니다. Speech-to-Text API 기본 페이지 왼쪽에 있는 사용자 인증 정보 메뉴 항목을 클릭합니다. 이 프로젝트에 연결된 서비스 계정이 없는 경우 새 서비스 계정 만들기 섹션의 안내에 따라 계정을 만듭니다.
이 프로젝트에 이전에 만든 서비스 계정이 있으면 이 페이지에 표시됩니다. Speech-to-Text로 인증하는 데 사용할 서비스 계정과 연결된 다운로드된 JSON 키에 대한 액세스 권한이 있는지 확인합니다. 서비스 계정 키는 생성 당시 한 번만 다운로드할 수 있습니다. 서비스 계정에 기존 키가 있지만 다운로드한
.json
파일을 찾을 수 없는 경우 서비스 계정의 키를 새로 만들고.json
파일을 다운로드해야 합니다. 기존 서비스 계정에 새 키를 만드는 방법은 JSON 키 만들기 섹션의 안내를 따르세요.서비스 계정 및 JSON 키가 이미 있다면 이제 인증 환경 변수를 설정할 수 있습니다.
서비스 계정 만들기
프로젝트에 서비스 계정이 없으면 새 서비스 계정을 만듭니다. Speech-to-Text를 사용하려면 서비스 계정을 만들어야 합니다.
서비스 계정 이름 상자에 새 서비스 계정의 고유한 이름을 입력합니다. 서비스 계정 ID 상자에 자동으로 입력됩니다. 서비스 계정 설명 상자는 선택사항이지만 여러 서비스 계정을 프로젝트와 연결하려면 사용하는 것이 좋습니다. 이 상자에 서비스 계정에 대한 간단한 설명을 입력한 다음 만들고 계속하기를 클릭합니다.
서비스 계정에 기본 IAM 역할 중 하나를 할당하는 것이 좋습니다. 필요한 경우 단일 서비스 계정에 여러 역할을 할당할 수도 있습니다. 사용 가능한 역할 및 각 역할에 허용된 권한에 대한 자세한 내용은 IAM 역할을 참조하세요. 역할 선택 드롭다운 메뉴를 클릭하고 기본까지 아래로 스크롤합니다. 오른쪽 열에 표시되는 옵션에서 이 서비스 계정의 역할을 선택할 수 있습니다. 계속을 클릭합니다.
마지막 단계에서는 필요에 따라 다른 항목(개인, Google 그룹 등)이 서비스 계정에 액세스하도록 허용할 수 있습니다. 추가 액세스 권한을 부여할 필요가 없는 경우 정보를 입력하지 않고 완료를 클릭할 수 있습니다.
이제 서비스 계정이 서비스 계정 페이지에 나열됩니다. 언제든지 서비스 계정의 권한을 변경하고, 새 키를 추가하거나 생성하고, 액세스 권한을 부여할 수 있습니다.
서비스 계정의 JSON 키 만들기
새로 생성된 서비스 계정이 서비스 계정 페이지에 나타납니다. 계정에 연결할 비공개 키를 만듭니다. Speech-to-Text에 요청을 보낼 때 인증 프로세스 중에 이 비공개 키를 사용해야 합니다. 지금 키를 만들지 않기로 선택한 경우 기본 탐색 메뉴의 IAM 및 관리자 -> 서비스 계정 옵션을 통해 서비스 계정에 액세스하여 언제든지 키를 생성하거나 개별 사용자 정보를 변경할 수 있습니다.
키를 만들려면 서비스 계정을 클릭하고 키 탭을 선택합니다. 키 추가 -> 새 키 만들기를 클릭합니다. JSON 형식의 키를 만드는 것이 좋습니다.
선택한 형식의 새 키가 자동으로 다운로드됩니다. 이 파일을 안전한 위치에 저장하고 파일 경로를 기록해 둡니다. 각각의 새로운 Speech-to-Text 세션이 시작될 때 인증 프로세스를 진행할 때 GOOGLE_APPLICATION_CREDENTIALS 환경 변수가 이 파일로 지정해야 합니다. 이 단계는 Speech-to-Text에 대한 요청을 인증하는 필수 단계입니다. 키의 고유 ID는 서비스 계정 이름 옆에 표시됩니다.
인증 환경 변수 설정
GOOGLE_APPLICATION_CREDENTIALS를 설정하려면 프로젝트와 연결된 서비스 계정이 있고 서비스 계정의 JSON 키에 액세스할 수 있어야 합니다.
GOOGLE_APPLICATION_CREDENTIALS
환경 변수를 설정하여 애플리케이션 코드에 사용자 인증 정보를 제공합니다. 이 변수는 현재 셸 세션에만 적용됩니다. 이후 셸 세션에 이 변수를 적용하려면 셸 시작 파일(예: ~/.bashrc
또는 ~/.profile
파일)에서 변수를 설정합니다.
Linux 또는 macOS
export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
KEY_PATH
를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.
예를 들면 다음과 같습니다.
export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"
Windows
PowerShell:
$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
KEY_PATH
를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.
예를 들면 다음과 같습니다.
$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"
명령 프롬프트:
set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH
KEY_PATH
를 서비스 계정 키가 포함된 JSON 파일의 경로로 바꿉니다.
자세한 내용은 Google Cloud Platform 인증 문서를 참조하세요.
선택사항: Cloud Storage 버킷 만들기
60초보다 길거나 파일 크기가 10MB보다 큰 오디오 스크립트를 작성하려면 Cloud Storage 버킷에 오디오 데이터를 저장해야 Speech-to-Text를 사용해 스크립트를 작성할 수 있습니다. 다음 단계에서는 새 버킷을 만드는 과정을 안내합니다.
Speech-to-Text API 중지
이후 Speech-to-Text API를 더 이상 사용할 필요가 없다면 다음 단계를 완료하세요.
- Google Cloud 대시보드로 이동하여 API 상자에서 API 개요로 이동 링크를 클릭합니다.
- Cloud Speech-to-Text API를 선택합니다.
- Cloud Speech-to-Text API 페이지 상단에 있는 API 중지 버튼을 클릭합니다.
다음 단계
클라이언트 라이브러리, gcloud, 명령줄 또는 Speech-to-Text UI를 사용하여 Speech-to-Text API에 스크립트 작성 요청을 보내는 방법을 알아보세요.