음성을 텍스트로 변환

이 페이지에서는 Vertex AI Studio를 사용하여 음성을 텍스트로 변환하는 방법을 보여줍니다.

텍스트를 음성으로 변환하는 방법은 텍스트를 음성으로 변환을 참조하세요.

음성을 텍스트로 변환

음성을 텍스트로 변환하려면 다음을 수행합니다.

  1. Google Cloud 콘솔의 Vertex AI 섹션에서 Vertex AI 스튜디오 페이지로 이동합니다.

    Vertex AI Studio로 이동

  2. 음성 카드에서 열기를 클릭합니다.

  3. 음성 텍스트 변환 탭을 선택합니다.

  4. 음성에서 찾아보기를 클릭하여 텍스트로 변환할 오디오 파일을 선택합니다.

  5. 언어 선택기 상자에서 오디오 파일의 음성 언어를 선택합니다.

  6. 제출을 클릭합니다.

    변환된 텍스트가 텍스트에 나타납니다.

제한사항

  • 오디오 파일은 최대 60초 또는 10MB 중 작은 값에 해당합니다.
  • 파일은 Chirp 모델로 텍스트 변환됩니다.
  • 16비트 선형 PCM WAV 파일만 지원됩니다.

Speech-to-Text UI를 직접 사용하면 이러한 제한사항을 해결할 수 있습니다.

다음 단계

  • 더 많은 모델, 고급 기능, 최대 8시간의 파일 텍스트 변환 기능은 Speech-to-Text를 참조하세요.