기본 모델에서 Conformer 모델로 마이그레이션

스크립트 작성 및 음성 인식의 정확성과 성능을 개선하기 위해 Cloud Speech-to-Text V1 API는 API 기능을 중단시키지 않는 방식으로 남은 기본 음성 모델을 최첨단 Conformer 기반 모델로 업데이트합니다. 기본 모델은 command_and_search, default, phone_call, video 모델 플래그로 V1 API에 노출된 모델을 참조합니다. 개별 음향 및 언어 모델을 기반으로 하며 선택된 Speech-to-Text API 사용 사례를 지원했습니다.

2020년 Google 브레인에 Conformer 아키텍처가 출시된 이후 Google은 솔루션을 테스트하고 Speech-to-Text V1 API 모델을 점진적으로 대체했습니다. 이를 통해 다양한 사용 사례에서 도메인 내 정확성, 견고성, 성능이 향상되었습니다. 이 페이지에서는 마이그레이션의 이점과 필요에 따라 이전 또는 이후에 마이그레이션하도록 선택하는 방법을 확인할 수 있습니다.

변경되는 사항

마이그레이션 기한이 지나면 현재 노출된 모델에서 트래픽 라우팅이 시작됩니다. 리디렉션이 내부적으로 발생하므로 모델 식별자가 계속 유효하며 계속해서 트래픽을 처리합니다.

이 표에서는 마이그레이션이 적용될 때 수행되는 라우팅을 보여줍니다. 리디렉션은 이미 표시된 모델 식별자 간에 수행됩니다. 필수는 아니지만 코드를 변경하고 직접 모델 동작을 테스트할 수 있습니다.

BCP-47 코드 현재 모델 식별자 single_utterance 모델 식별자 트래픽이 전달되는 대상
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

타임라인

이 페이지에 설명된 세 가지 마이그레이션 옵션이 있습니다. 2024년 1월부터 마이그레이션 전에 개별 커뮤니케이션을 통해 기본 모델에서 Conformer 기반 프로젝트로 트래픽을 점진적으로 이전하기 시작했습니다. 2024년 6월까지 모든 트래픽이 Conformer 모델로만 이전될 것으로 예상됩니다. 기본 모델을 계속 요청하는 사용자는 해당하는 Conformer 기반 모델로 자동 라우팅됩니다.

마이그레이션 메커니즘

고객은 다음 안내에 따라 사전에 선택하거나 선택 해제하고 나중에 마이그레이션할 수 있습니다.

기본: 사전 선택 및 마이그레이션

사전에 선택하려면 위의 표에 표시된 대로 Speech-to-Text V1 API에서 사용한 모델 식별자를 업데이트된 ID로 변경합니다. 프로젝트를 사전에 마이그레이션하면 충분한 시간을 갖고 모델을 테스트하고 일찍 개선된 정확성과 견고성을 활용할 수 있습니다.

자동 마이그레이션

자동으로 마이그레이션하기 위해 별도의 조치를 취할 필요는 없습니다. 기존 Speech-to-Text V1 API 모델 식별자가 유효하며 Google에서 내부적으로 트래픽을 이동합니다. 프로젝트가 마이그레이션되면 Google팀에서 연락을 드립니다.

프로젝트의 마이그레이션 상태를 확인하려면 다음 안내를 따르세요.

  1. Google Cloud 음성 콘솔로 이동합니다.

  2. 왼쪽의 탐색 메뉴에서 '미리보기 기능' 섹션으로 이동합니다.

  3. 표에서 모델의 상태를 확인합니다.

선택 해제 및 나중에 마이그레이션

업데이트된 모델에 문제가 있고 마이그레이션을 일시적으로 선택 해제하려면 Google Cloud 지원 케이스를 생성하세요. 지원 케이스를 만들 때 Speech-to-Text Conformer 마이그레이션 선택 해제'라는 제목을 사용하고 프로젝트 ID와 선택 해제 이유를 입력합니다.