Google Cloud Console을 사용하여 음성을 텍스트로 변환하기
이 빠른 시작에서는 Cloud Speech-to-Text 콘솔에 대하여 소개합니다. 이 빠른 시작에서는 작성하여 다듬고 애플리케이션에 Speech-to-Text API로 이 구성을 사용하는 방법을 알아봅니다.
콘솔 대신 REST API를 사용하여 요청을 보내고 응답을 받는 방법을 알아보려면 시작하기 전에 페이지를 참조하세요.
시작하기 전에
Speech-to-Text 콘솔을 사용하려면 먼저 Google Cloud Platform Console에서 API를 사용 설정해야 합니다. 아래 단계는 다음 작업을 안내합니다.
- 프로젝트에서 Speech-to-Text를 사용 설정합니다.
- Speech-to-Text에 결제가 사용 설정되어 있는지 확인합니다.
Google Cloud 프로젝트 설정
-
기존 프로젝트를 선택하거나 새 프로젝트를 만들 수 있습니다. 프로젝트 만들기에 대한 자세한 내용은 Google Cloud Platform 문서를 참조하세요.
새 프로젝트를 만들면 결제 계정을 이 프로젝트에 연결하라는 메시지가 표시됩니다. 기존 프로젝트를 사용중인 경우 결제가 사용 설정되어 있는지 확인합니다.
프로젝트를 선택하고 결제 계정에 연결하면 Speech-to-Text API를 사용 설정할 수 있습니다. 페이지 상단의 제품 및 리소스 검색 표시줄로 이동하여 'speech'를 입력합니다.
결과 목록에서 Cloud Speech-to-Text API를 선택합니다.
API를 프로젝트에 연결하지 않고 Speech-to-Text를 사용해 보려면 API 사용해 보기 옵션을 선택합니다. 프로젝트에서 사용할 Speech-to-Text API를 사용 설정하려면 사용 설정을 클릭합니다.
스크립트 작성하기
Google Cloud 콘솔을 사용하여 새 스크립트를 작성합니다.
오디오 구성
Speech-to-Text 개요를 엽니다.
텍스트 변환 만들기를 클릭합니다.
- Console을 처음 사용하는 경우 Cloud Storage에서 구성 및 스크립트를 저장할 위치를 선택하라는 메시지가 표시됩니다.
텍스트 변환 만들기 페이지에서 소스 오디오 파일을 업로드합니다. Cloud Storage에 저장된 파일을 선택하거나 지정된 Cloud Storage 대상에 새 파일을 업로드합니다.
업로드된 오디오 파일의 인코딩 유형을 선택합니다.
샘플링 레이트를 지정합니다.
계속을 클릭합니다. 스크립트 작성 옵션으로 이동합니다.
스크립트 작성 옵션
소스 오디오의 언어 코드를 선택합니다. 녹음에서 사용되는 언어입니다.
파일에 사용할 스크립트 작성 모델을 선택합니다. 기본 옵션이 미리 선택되어 있습니다. 일반적으로는 이를 변경할 필요가 없지만 모델을 오디오 유형과 일치시키면 정확성이 높아질 수 있습니다. 참고로 모델 비용이 다를 수 있습니다.
계속을 클릭합니다. 모델 조정이 표시됩니다.
모델 조정(선택사항)
소스 오디오에 빈도 수가 낮은 단어, 고유 이름, 고유 용어와 같은 것들이 포함되었고 인식이 잘 되지 않으면 모델 조정이 도움이 될 수 있습니다.
모델 조정 사용 설정을 선택합니다.
일회 조정 리소스를 선택합니다.
관련 구문을 추가하고 여기에 부스트 값을 제공합니다.
왼쪽 열에서 제출을 클릭하여 텍스트 변환을 만듭니다.
작성한 스크립트 검토
오디오 파일의 크기에 따라 스크립트 작성까지 몇 분에서 몇 시간이 걸릴 수 있습니다. 스크립트가 작성되었으면 검토할 준비가 된 것입니다. 타임스탬프를 기준으로 테이블을 정렬하면 최근 작성한 스크립트를 쉽게 찾을 수 있습니다.
검토하려는 텍스트 변환의 이름을 클릭합니다.
작성한 스크립트 텍스트를 오디오 파일과 비교
항목을 변경하려면 구성 재사용을 클릭합니다. 이렇게 하면 동일 옵션이 미리 선택된 상태로 텍스트 변환 만들기 흐름이 표시되어, 일부 항목만 변경해서 새 텍스트 변환을 만들고, 결과를 비교할 수 있습니다.
다음 단계
- 짧은 오디오 파일의 스크립트 작성 연습
- 긴 오디오 파일의 음성 인식을 일괄 처리하는 방법 알아보기
- 마이크 입력과 같은 스트리밍 오디오의 텍스트 변환 방법 알아보기
- Speech-to-Text 클라이언트 라이브러리를 사용하여 원하는 언어로 Speech-to-Text 시작
- 샘플 애플리케이션 살펴보기
- 권장사항 문서에서 최상의 성능, 정확도, 기타 팁 참조