Endpunkte bereitstellen und verwalten

Verwenden Sie ein trainiertes benutzerdefiniertes Speech-to-Text-Modell in Ihrer Produktionsanwendung oder in Benchmarking-Workflows. Sie müssen das Modell über einen dedizierten Endpunkt bereitstellen und freigeben, der teilweise für die Bereitstellung des Modells in der ausgewählten Region erstellt wurde. Sie erhalten automatisch programmatischen Zugriff über ein Erkennungsobjekt. Es wird direkt über die V2 API oder in der Google Cloud Console verwendet. Sie können das Modell in einer anderen Region bereitstellen als der, in der es trainiert wurde. Allerdings wird eine Kopie des Modells in der vom Endpunkt angegebenen Region erstellt.

Wenn Sie ein benutzerdefiniertes Sprachmodell verwenden möchten, müssen Sie es über einen dedizierten Endpunkt bereitstellen und verfügbar machen. Durch Erstellen eines Endpunkts stellen Sie das Modell in der Region Ihrer Wahl bereit. Sie erhalten automatisch programmatischen Zugriff über ein Erkennungsobjekt, das Sie direkt über die V2 API für Inferenz oder in der Google Cloud Console verwenden können.

Hinweise

Sie müssen sich für ein Google Cloud-Konto registriert, ein Projekt erstellt und ein benutzerdefiniertes Sprachmodell trainiert haben.

  1. Rufen Sie in der Google Cloud Console Speech auf und navigieren Sie dann zu Speech-to-Text.
  2. Navigieren Sie über die Navigationsleiste auf der linken Seite zum Bereich Benutzerdefinierte Modelle.

Endpunkt erstellen

  1. Rufen Sie im Abschnitt Benutzerdefinierte Modelle den Tab Endpunkte auf.
  2. Klicken Sie auf Neuer Endpunkt.
  3. Legen Sie einen Namen für den Endpunkt fest. Dieser Name dient als eindeutige Kennung für Ihre Endpunktressource und wird zum Aufrufen Ihres benutzerdefinierten Sprachmodells für die Inferenz verwendet.
  4. Definieren Sie die Region, in der Ihr benutzerdefiniertes Sprachmodell bereitgestellt werden soll. Wenn das Modell in einer anderen Region trainiert wurde als der, die in der Endpunktkonfiguration festgelegt wurde, wird automatisch eine neue Modellkopie erstellt.
  5. Wählen Sie aus der Liste das trainierte benutzerdefinierte Sprachmodell aus, das Sie über den Endpunkt bereitstellen möchten.
  6. Klicken Sie auf Erstellen. Nach wenigen Augenblicken wird Ihr benutzerdefiniertes Sprachmodell in Ihrem Endpunkt bereitgestellt und kann für Inferenz und Benchmarking verwendet werden.
Screenshot des Workflows zum Erstellen eines benutzerdefinierten Speech-to-Text-Modellendpunkts mit den Feldern, die für den Endpunkt des benutzerdefinierten Modells erforderlich sind

Endpunkte auflisten

Sie können die zugehörigen Endpunkte in der Console verwalten. Wählen Sie dazu im Abschnitt „Benutzerdefinierte Modelle“ den Tab „Endpunkte“ aus. Sie können auch die in der Console erstellten Endpunkte sowie deren aktuellen Status und das zugehörige benutzerdefinierte Speech-to-Text-Modell auflisten.

Screenshot des Workflows für die Liste der Endpunkte für benutzerdefinierte Speech-to-Text-Modelle, der eine Tabelle mit allen bereits erstellten Endpunkten benutzerdefinierter Modelle zeigt

Endpunkt löschen

Stellen Sie zuerst sicher, dass kein Traffic über den Endpunkt geleitet wird. Andernfalls werden keine Anfragen mehr über den Endpunkt verarbeitet.

  1. Rufen Sie im Abschnitt Benutzerdefinierte Modelle den Tab Endpunkte auf.
  2. Klicken Sie auf dem Tab Endpunkte, um die Optionen zu maximieren, und dann auf Löschen. Der Endpunkt wird in wenigen Momenten gelöscht und stellt keinen Traffic mehr bereit.

Modell vergleichen

Um das benutzerdefinierte Speech-to-Text-Modell und Ihr Benchmarking-Dataset zur Bewertung der Accuracy Ihres Modells zu nutzen, folgen Sie dem Leitfaden zum Messen und Verbessern der Accuracy.