CREATE MODEL-Anweisung für Remote-Modelle über Cloud AI-Dienste
In diesem Dokument wird die CREATE MODEL
-Anweisung zum Erstellen von Remote-Modellen in BigQuery über Cloud AI-Dienste beschrieben. Ein Beispiel ist die Cloud Natural Language API.
CREATE MODEL
-Syntax
{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL} `project_id.dataset.model_name` REMOTE WITH CONNECTION `project_id.region.connection_id` OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type [, DOCUMENT_PROCESSOR = document_processor] [, SPEECH_RECOGNIZER = speech_recognizer] );
CREATE MODEL
Erstellt und trainiert ein neues Modell im angegebenen Dataset. Wenn der Modellname vorhanden ist, gibt CREATE MODEL
einen Fehler zurück.
CREATE MODEL IF NOT EXISTS
Erstellt und trainiert ein neues Modell nur, wenn das Modell nicht im angegebenen Dataset vorhanden ist.
CREATE OR REPLACE MODEL
Erstellt und trainiert ein Modell und ersetzt ein vorhandenes Modell mit demselben Namen im angegebenen Dataset.
model_name
Der Name des Modells, das Sie erstellen oder ersetzen. Der Modellname muss im Dataset eindeutig sein: Kein anderes Modell und keine andere Tabelle darf denselben Namen haben. Der Modellname muss denselben Benennungsregeln wie eine BigQuery-Tabelle folgen. Ein Modellname kann:
- bis zu 1.024 Zeichen enthalten.
- Buchstaben (groß- oder kleingeschrieben), Ziffern und Unterstriche enthalten.
model_name
unterscheidet nicht zwischen Groß- und Kleinschreibung.
Wenn Sie kein Standardprojekt konfiguriert haben, müssen Sie die Projekt-ID dem Modellnamen im folgenden Format voranstellen, einschließlich der Graviszeichen:
`[PROJECT_ID].[DATASET].[MODEL]`
Beispielsweise `myproject.mydataset.mymodel`.
REMOTE WITH CONNECTION
Syntax
`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`
BigQuery verwendet eine Cloud-Ressourcenverbindung für die Interaktion mit dem Cloud AI-Dienst.
Die Verbindungselemente sind:
PROJECT_ID
: die Projekt-ID, das die Verbindung enthält.LOCATION
: der Standort, der von der Verbindung verwendet wird. Die Verbindung muss sich am selben Standort wie das Dataset befinden, das das Modell enthält.CONNECTION_ID
: die Verbindungs-ID, z. B.myconnection
.Rufen Sie die Verbindungsdetails in der Google Cloud Console auf, um Ihre Verbindungs-ID zu ermitteln. Die Verbindungs-ID ist der Wert im letzten Abschnitt der vollständig qualifizierten Verbindungs-ID, der unter Verbindungs-ID angezeigt wird, z. B.
projects/myproject/locations/connection_location/connections/myconnection
.
Sie müssen dem Dienstkonto der Verbindung in dem Projekt, in dem Sie das Modell erstellen, die Rolle Vertex AI-Nutzer zuweisen.
Beispiel
`myproject.us.my_connection`
REMOTE_SERVICE_TYPE
Syntax
REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }
Beschreibung
Gibt den Dienst an, der zum Erstellen des Modells verwendet werden soll:
- Cloud Natural Language API
- Cloud Translation API
- Cloud Vision API
- Document AI API (Vorschau)
- Speech-to-Text API (Vorschau)
Nachdem Sie ein Remote-Modell basierend auf einem Cloud AI-Dienst erstellt haben, können Sie das Modell mit einer der folgenden BigQuery ML-Funktionen zum Analysieren Ihrer BigQuery-Daten verwenden:
- Verwenden Sie für Cloud Natural Language API-Modelle
ML.UNDERSTAND_TEXT
. - Verwenden Sie für Cloud Translation API-Modelle
ML.TRANSLATE
. - Verwenden Sie für Cloud Vision API-Modelle
ML.ANNOTATE_IMAGE
. - Verwenden Sie für Document AI API-Modelle
ML.PROCESS_DOCUMENT
(Vorschau). - Verwenden Sie für Speech-to-Text API-Modelle
ML.TRANSCRIBE
(Vorschau).
Beispiel
REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'
DOCUMENT_PROCESSOR
Diese Option gibt den Dokumentverarbeiter an, der verwendet werden soll, wenn der Wert von REMOTE_SERVICE_TYPE
CLOUD_AI_DOCUMENT_V1
ist. Sie müssen diese Option verwenden, wenn Sie ein Remote-Modell über die Document AI API erstellen. Sie können diese Option nicht mit einem anderen Remote-Modelltyp verwenden.
Document AI bietet vordefinierte Prozessoren, um Informationen aus verschiedenen Dokumenttypen zu extrahieren, darunter:
- Invoices
- Steuerformulare
- Finanzberichte
Nicht alle Prozessortypen werden unterstützt. Unterstützte Prozessoren extrahieren Informationen aus Dokumenten und haben Beschreibungen in der Prozessorgalerie, die mit Extract
beginnen. Beispiel: Rechnung, Lohnabrechnung und Kontoauszugsparser. Die CREATE MODEL
-Anweisung schlägt fehl, wenn Sie einen nicht unterstützten Prozessor angeben.
Der Wert DOCUMENT_PROCESSOR
muss ein String im folgenden Format sein:
projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
Ersetzen Sie Folgendes:
PROJECT_NUMBER
: die Projektnummer des Projekts, das den Dokumentverarbeiter enthält. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Projekte folgt, z. B.https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.LOCATION
: der vom Dokumentverarbeiter verwendete Speicherort. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Standort folgt, z. B.https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_ID
: die Prozessor-ID des Dokuments. Um diesen Wert zu ermitteln, sehen Sie sich die Prozessordetails an, schauen Sie sich den Vorhersageendpunkt an und nehmen Sie den Wert, der auf das Element Prozessoren folgt, z. B.https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_VERSION
: die Prozessorversion des Dokuments. Sie finden diesen Wert nach Details zum Prozessor ansehen , wählen Sie Versionen verwalten Tab und kopieren Sie den Versions-ID Wert der Version, die Sie verwenden möchten.
SPEECH_RECOGNIZER
Mit dieser Option wird die Spracherkennung identifiziert, die optional verwendet werden kann, wenn der Wert REMOTE_SERVICE_TYPE
CLOUD_AI_SPEECH_TO_TEXT_V2
ist. Wenn Sie diese Option nicht angeben, müssen Sie einen Wert für das Argument recognition_config
der Funktion ML.TRANSCRIBE
angeben, wenn Sie auf das Remote-Modell verweisen. eine Sie können diese Option nicht mit einem anderen Remote-Modelltyp verwenden.
Der Wert SPEECH_RECOGNIZER
muss ein String im folgenden Format sein:
projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID
Ersetzen Sie Folgendes:
PROJECT_NUMBER
: die Projektnummer des Projekts, das die Spracherkennung enthält. Sie finden diesen Wert auf der Karte Projektinformationen auf der Seite Dashboard der Google Cloud Console.LOCATION
: der Standort, der von der Spracherkennung verwendet wird. Sie finden diesen Wert im Feld Standort auf der Seite Listenerkennungen der Google Cloud Console.RECOGNIZER_ID
: die Spracherkennungs-ID. Sie finden diesen Wert im Feld ID auf der Seite Listenerkennungen der Google Cloud Console.
Beispiel
Im folgenden Beispiel wird ein BigQuery ML-Remote-Modell erstellt, das die Cloud Vision API verwendet:
CREATE MODEL `project_id.mydataset.mymodel` REMOTE WITH CONNECTION `myproject.us.test_connection` OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')
Nächste Schritte
Weitere Informationen zur Verwendung von Cloud AI-Diensten mit BigQuery ML finden Sie unter AI-Anwendung – Übersicht.