CREATE MODEL-Anweisung für Remote-Modelle über Cloud AI-Dienste

In diesem Dokument wird die CREATE MODEL-Anweisung zum Erstellen von Remote-Modellen in BigQuery über Cloud AI-Dienste beschrieben. Ein Beispiel ist die Cloud Natural Language API.

CREATE MODEL-Syntax

{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL}
`project_id.dataset.model_name`
REMOTE WITH CONNECTION `project_id.region.connection_id`
OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type
[, DOCUMENT_PROCESSOR = document_processor]
[, SPEECH_RECOGNIZER = speech_recognizer]
);

CREATE MODEL

Erstellt und trainiert ein neues Modell im angegebenen Dataset. Wenn der Modellname vorhanden ist, gibt CREATE MODEL einen Fehler zurück.

CREATE MODEL IF NOT EXISTS

Erstellt und trainiert ein neues Modell nur, wenn das Modell nicht im angegebenen Dataset vorhanden ist.

CREATE OR REPLACE MODEL

Erstellt und trainiert ein Modell und ersetzt ein vorhandenes Modell mit demselben Namen im angegebenen Dataset.

model_name

Der Name des Modells, das Sie erstellen oder ersetzen. Der Modellname muss im Dataset eindeutig sein: Kein anderes Modell und keine andere Tabelle darf denselben Namen haben. Der Modellname muss denselben Benennungsregeln wie eine BigQuery-Tabelle folgen. Ein Modellname kann:

  • bis zu 1.024 Zeichen enthalten.
  • Buchstaben (groß- oder kleingeschrieben), Ziffern und Unterstriche enthalten.

model_name unterscheidet nicht zwischen Groß- und Kleinschreibung.

Wenn Sie kein Standardprojekt konfiguriert haben, müssen Sie die Projekt-ID dem Modellnamen im folgenden Format voranstellen, einschließlich der Graviszeichen:

`[PROJECT_ID].[DATASET].[MODEL]`

Beispielsweise `myproject.mydataset.mymodel`.

REMOTE WITH CONNECTION

Syntax

`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`

BigQuery verwendet eine Cloud-Ressourcenverbindung für die Interaktion mit dem Cloud AI-Dienst.

Die Verbindungselemente sind:

  • PROJECT_ID: die Projekt-ID, das die Verbindung enthält.
  • LOCATION: der Standort, der von der Verbindung verwendet wird. Die Verbindung muss sich am selben Standort wie das Dataset befinden, das das Modell enthält.
  • CONNECTION_ID: die Verbindungs-ID, z. B. myconnection.

    Rufen Sie die Verbindungsdetails in der Google Cloud Console auf, um Ihre Verbindungs-ID zu ermitteln. Die Verbindungs-ID ist der Wert im letzten Abschnitt der vollständig qualifizierten Verbindungs-ID, der unter Verbindungs-ID angezeigt wird, z. B. projects/myproject/locations/connection_location/connections/myconnection.

Sie müssen dem Dienstkonto der Verbindung in dem Projekt, in dem Sie das Modell erstellen, die Rolle Vertex AI-Nutzer zuweisen.

Beispiel

`myproject.us.my_connection`

REMOTE_SERVICE_TYPE

Syntax

REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }

Beschreibung

Gibt den Dienst an, der zum Erstellen des Modells verwendet werden soll:

Nachdem Sie ein Remote-Modell basierend auf einem Cloud AI-Dienst erstellt haben, können Sie das Modell mit einer der folgenden BigQuery ML-Funktionen zum Analysieren Ihrer BigQuery-Daten verwenden:

Beispiel

REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'

DOCUMENT_PROCESSOR

Diese Option gibt den Dokumentverarbeiter an, der verwendet werden soll, wenn der Wert von REMOTE_SERVICE_TYPE CLOUD_AI_DOCUMENT_V1 ist. Sie müssen diese Option verwenden, wenn Sie ein Remote-Modell über die Document AI API erstellen. Sie können diese Option nicht mit einem anderen Remote-Modelltyp verwenden.

Document AI bietet vordefinierte Prozessoren, um Informationen aus verschiedenen Dokumenttypen zu extrahieren, darunter:

  • Invoices
  • Steuerformulare
  • Finanzberichte

Nicht alle Prozessortypen werden unterstützt. Unterstützte Prozessoren extrahieren Informationen aus Dokumenten und haben Beschreibungen in der Prozessorgalerie, die mit Extract beginnen. Beispiel: Rechnung, Lohnabrechnung und Kontoauszugsparser. Die CREATE MODEL-Anweisung schlägt fehl, wenn Sie einen nicht unterstützten Prozessor angeben.

Der Wert DOCUMENT_PROCESSOR muss ein String im folgenden Format sein:

projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION

Ersetzen Sie Folgendes:

  • PROJECT_NUMBER: die Projektnummer des Projekts, das den Dokumentverarbeiter enthält. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Projekte folgt, z. B. https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • LOCATION: der vom Dokumentverarbeiter verwendete Speicherort. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Standort folgt, z. B. https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_ID: die Prozessor-ID des Dokuments. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Prozessoren folgt, z. B. https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_VERSION: die Prozessorversion des Dokuments. Sie finden diesen Wert nach Details zum Prozessor ansehen , wählen Sie Versionen verwalten Tab und kopieren Sie den Versions-ID Wert der Version, die Sie verwenden möchten.

SPEECH_RECOGNIZER

Mit dieser Option wird die Spracherkennung identifiziert, die optional verwendet werden kann, wenn der Wert REMOTE_SERVICE_TYPE CLOUD_AI_SPEECH_TO_TEXT_V2 ist. Wenn Sie diese Option nicht angeben, müssen Sie einen Wert für das Argument recognition_config der Funktion ML.TRANSCRIBE angeben, wenn Sie auf das Remote-Modell verweisen. eine Sie können diese Option nicht mit einem anderen Remote-Modelltyp verwenden.

Der Wert SPEECH_RECOGNIZER muss ein String im folgenden Format sein:

projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID

Ersetzen Sie Folgendes:

  • PROJECT_NUMBER: die Projektnummer des Projekts, das die Spracherkennung enthält. Sie finden diesen Wert auf der Karte Projektinformationen auf der Seite Dashboard der Google Cloud Console.
  • LOCATION: der Standort, der von der Spracherkennung verwendet wird. Sie finden diesen Wert im Feld Standort auf der Seite Listenerkennungen der Google Cloud Console.
  • RECOGNIZER_ID: die Spracherkennungs-ID. Sie finden diesen Wert im Feld ID auf der Seite Listenerkennungen der Google Cloud Console.

Beispiel

Im folgenden Beispiel wird ein BigQuery ML-Remote-Modell erstellt, das die Cloud Vision API verwendet:

CREATE MODEL `project_id.mydataset.mymodel`
REMOTE WITH CONNECTION `myproject.us.test_connection`
 OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')

Nächste Schritte

Weitere Informationen zur Verwendung von Cloud AI-Diensten mit BigQuery ML finden Sie unter AI-Anwendung – Übersicht.