Speech-to-Text는 Google의 인공지능(AI) 기술을 기반으로 한 API입니다. 오디오 데이터를 Speech-to-Text로 전송한 다음 응답으로 오디오 데이터의 텍스트 스크립트 작성을 수신합니다.
Speech-to-Text 요청을 구성하는 방법에 대한 자세한 내용은 요청 페이지를 참조하세요.
개요
Speech-to-Text에 요청을 보내려면 먼저 Google Cloud Console에서 API를 사용 설정해야 합니다. 이 페이지의 단계는 다음 작업을 안내합니다.
- 프로젝트에서 Speech-to-Text를 사용 설정합니다.
- Speech-to-Text에 결제가 사용 설정되어 있는지 확인합니다.
- (선택사항) 오디오 데이터를 저장할 새 Google Cloud Storage 버킷을 만듭니다.
시작하기 전에
서비스에 액세스하는 방법에는 REST API를 사용하거나 Speech-to-Text 콘솔을 사용하는 두 가지가 있습니다. Google에서는 REST API에 요청하고 응답을 수신하는 방법을 보여주는 코드 샘플을 제공합니다. Speech-to-Text 빠른 시작 및 안내 가이드에 따라 이러한 샘플을 사용하는 방법을 알아보세요. 최소한의 코딩으로 Speech-to-Text를 사용하려는 경우 Cloud Speech-to-Text 콘솔을 사용할 수 있습니다.
이 가이드에서는 REST API로 요청을 보내기 위해 필요한 단계를 설명합니다. 코딩을 처음 사용하는 경우 이 빠른 시작을 시작하기 전에 Google Cloud Platform의 단계별 콘솔 내 튜토리얼부터 시작하는 것이 좋습니다.
Speech-to-Text용 Google Cloud 프로젝트 설정
-
기존 프로젝트를 선택하거나 새 프로젝트를 만들 수 있습니다. 프로젝트 생성에 대한 자세한 내용은 프로젝트 만들기 및 관리를 참조하세요.
새 프로젝트를 만들면 결제 계정을 이 프로젝트에 연결하라는 메시지가 표시됩니다. 기존 프로젝트를 사용중인 경우 결제가 사용 설정되어 있는지 확인합니다.
프로젝트를 선택하고 결제 계정에 연결하면 Speech-to-Text API를 사용 설정할 수 있습니다. 페이지 상단의 제품 및 리소스 검색 표시줄로 이동하여 'speech'를 입력합니다. 결과 목록에서 Cloud Speech-to-Text API를 선택합니다.
API를 프로젝트에 연결하지 않고 Speech-to-Text를 사용해 보려면 API 사용해 보기 옵션을 선택합니다. 프로젝트에서 사용할 Speech-to-Text API를 사용 설정하려면 사용 설정을 클릭합니다.
(선택사항) 데이터 로깅을 사용 설정합니다. 데이터 로깅을 선택하면 Speech-to-Text로 전송하는 모든 오디오 데이터를 Google이 기록하도록 허용할 수 있습니다. 이 데이터는 Speech-to-Text 모델을 개선하는 데 사용됩니다. 데이터 로깅을 선택한 사용자는 더 저렴한 가격으로 이용할 수 있습니다. 자세한 내용은 가격 책정 및 데이터 로깅 이용약관 페이지를 참조하세요.
선택사항: Cloud Storage 버킷 만들기
60초보다 길거나 파일 크기가 10MB보다 큰 오디오 스크립트를 작성하려면 Cloud Storage 버킷에 오디오 데이터를 저장해야 Speech-to-Text를 사용해 스크립트를 작성할 수 있습니다. 다음 단계에서는 새 버킷을 만드는 과정을 안내합니다.
Speech-to-Text API 중지
이후 Speech-to-Text API를 더 이상 사용할 필요가 없다면 다음 단계를 완료하세요.
- Google Cloud 대시보드로 이동하여 API 상자에서 API 개요로 이동 링크를 클릭합니다.
- Cloud Speech-to-Text API를 선택합니다.
- Cloud Speech-to-Text API 페이지 상단에 있는 API 중지 버튼을 클릭합니다.
다음 단계
클라이언트 라이브러리, gcloud, 명령줄 또는 Speech-to-Text UI를 사용하여 Speech-to-Text API에 스크립트 작성 요청을 보내는 방법을 알아보세요.