Von klassischen zu Conformer-Modellen migrieren

Um die Transkriptions- und Spracherkennungsgenauigkeit und die Leistung zu verbessern, aktualisiert die Cloud Speech-to-Text V1 API die verbleibenden klassischen Sprachmodelle auf hochmoderne Conformer-basierte Modelle so, dass sie die API-Funktionalität nicht beeinträchtigen. Klassische Modelle beziehen sich auf Modelle, die in der V1 API unter den Modell-Flags command_and_search, default, phone_call und video verfügbar gemacht werden. Sie basieren auf diskreten akustischen und Sprachmodellen und unterstützen ausgewählte Speech-to-Text API-Anwendungsfälle.

Seit der Einführung der Conformer-Architektur im Jahr 2020 bei Google Brain haben wir unsere Lösung getestet und unsere Speech-to-Text V1 API-Modelle nach und nach ersetzt. Hierdurch werden die Genauigkeit, Robustheit und Leistung der Domain für verschiedene Anwendungsfälle erhöht. Auf dieser Seite finden Sie Anleitungen dazu, wie Sie von der Migration profitieren und wie Sie je nach Ihren Anforderungen die Migration früher oder später aktivieren.

Was ändert sich?

Nach Ablauf der Migrationsfrist beginnen wir mit der Weiterleitung des Traffics von den aktuell freigegebenen Modellen. Diese Modellkennzeichnungen bleiben gültig und leiten weiterhin Traffic weiter, da die Weiterleitung intern erfolgt.

In dieser Tabelle wird das Routing aufgeführt, das ausgeführt werden soll, wenn die Migration wirksam wird. Die Weiterleitung erfolgt zwischen den bereits sichtbaren Modell-IDs. Sie können zwar Codeänderungen vornehmen und das Modellverhalten in Ihrem eigenen Zeitraum testen.

BCP-47-Code Aktuelle Modell-ID single_utterance Modell-ID-Traffic, an den weitergeleitet wird
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

Zeitplan

Ihnen stehen drei Migrationsoptionen zur Verfügung, die auf dieser Seite beschrieben werden. Im Januar 2024 wird der Traffic schrittweise von den klassischen Modellen auf das Projekt mit konformen Konfigurationen übertragen. Dabei erfolgt die individuelle Kommunikation vor der Migration. Bis Juni 2024 erwarten wir, dass der gesamte Traffic nur noch auf die Conformer-Modelle übertragen wird. Alle Nutzer, die noch die klassischen Modelle anfordern, werden automatisch auf die entsprechenden Conformer-basierten Modelle umgeleitet.

Migrationsmechanismus

Kunden können diese Funktion früher aktivieren oder später deaktivieren und migrieren, indem sie die folgenden Schritte ausführen:

Bevorzugt: Zuvor aktivieren und migrieren

Wenn Sie die Aktivierung proaktiv vornehmen möchten, ändern Sie die Modell-ID, die Sie in der Speech-to-Text V1 API mit der aktualisierten verwendet haben, wie in der vorherigen Tabelle angegeben. Durch die proaktive Migration Ihres Projekts haben Sie Zeit, die Modelle zu testen und die verbesserte Genauigkeit und Robustheit zu einem früheren Zeitpunkt zu nutzen.

Automatisch migrieren

Für eine automatische Migration sind keine Maßnahmen Ihrerseits erforderlich. Die Modell-IDs der Speech-to-Text V1 API sind gültig und wir verschieben den Traffic intern. Wenn Ihr Projekt migriert ist, erhalten Sie eine Nachricht von unserem Team.

So prüfen Sie den Migrationsstatus Ihres Projekts:

  1. Weiter zur Google Cloud Speech- Console

  2. Gehen Sie links in der Navigationsleiste zum Abschnitt „Vorschaufunktionen”.

  3. Prüfen Sie den Status Ihrer Modelle in der Tabelle.

Deaktivieren und später migrieren

Wenn Sie Probleme mit den aktualisierten Modellen haben und die Migration vorübergehend deaktivieren möchten, erstellen Sie eine Google Cloud-Supportanfrage. Verwenden Sie beim Erstellen des Supportfalls den Titel "Speech-to-Text-Konformitätsmigration deaktivieren" und geben Sie Ihre Projekt-IDs und den Grund für die Deaktivierung an.