Instruction CREATE MODEL pour les modèles distants utilisés via les services Cloud AI

Ce document décrit l'instruction CREATE MODEL permettant de créer des modèles distants dans BigQuery via des services Cloud AI. Par exemple, l'API Cloud Natural Language.

Syntaxe de CREATE MODEL

{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL}
`project_id.dataset.model_name`
REMOTE WITH CONNECTION `project_id.region.connection_id`
OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type
[, DOCUMENT_PROCESSOR = document_processor]
[, SPEECH_RECOGNIZER = speech_recognizer]
);

CREATE MODEL

Crée et entraîne un modèle dans l'ensemble de données spécifié. Si le nom du modèle existe, CREATE MODEL renvoie une erreur.

CREATE MODEL IF NOT EXISTS

Crée et entraîne un modèle uniquement si celui-ci n'existe pas dans l'ensemble de données spécifié.

CREATE OR REPLACE MODEL

Crée et entraîne un modèle. Permet également de remplacer un modèle existant du même nom dans l'ensemble de données spécifié.

model_name

Nom du modèle que vous créez ou remplacez. Le nom du modèle doit être unique dans l'ensemble de données. Aucun autre modèle, ni table ne peut porter le même nom. Le nom du modèle doit respecter les mêmes règles de dénomination que celles des tables BigQuery. Un nom de modèle peut :

  • contenir jusqu'à 1 024 caractères ;
  • contenir des lettres (majuscules ou minuscules), des chiffres et des traits de soulignement.

model_name n'est pas sensible à la casse.

Si aucun projet par défaut n'est configuré, vous devez préfixer le nom du modèle par l'ID du projet en respectant le format suivant (y compris les accents graves) :

`[PROJECT_ID].[DATASET].[MODEL]`

par exemple, `myproject.mydataset.mymodel`.

REMOTE WITH CONNECTION

Syntaxe

`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`

BigQuery utilise une connexion aux ressources Cloud pour interagir avec le service Cloud AI.

Les éléments de connexion sont les suivants :

  • PROJECT_ID : ID du projet contenant la connexion.
  • LOCATION : emplacement utilisé par la connexion. La connexion doit se trouver au même emplacement que l'ensemble de données contenant le modèle.
  • CONNECTION_ID : ID de connexion, par exemple myconnection

    Pour trouver votre ID de connexion, affichez les détails de la connexion dans la console Google Cloud. L'ID de connexion correspond à la valeur de la dernière section de l'ID de connexion complet affiché dans la section ID de connexion (par exemple, projects/myproject/locations/connection_location/connections/myconnection).

Vous devez attribuer le rôle d'utilisateur Vertex AI au compte de service de la connexion dans le projet dans lequel vous créez le modèle.

Exemple

`myproject.us.my_connection`

REMOTE_SERVICE_TYPE

Syntaxe

REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }

Description

Spécifie le service à utiliser pour créer le modèle :

Après avoir créé un modèle distant basé sur un service Cloud AI, vous pouvez l'utiliser avec l'une des fonctions BigQuery ML suivantes pour analyser vos données BigQuery :

Exemple

REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'

DOCUMENT_PROCESSOR

Cette option identifie le processeur de documents à utiliser lorsque la valeur de REMOTE_SERVICE_TYPE est CLOUD_AI_DOCUMENT_V1. Vous devez utiliser cette option lorsque vous créez un modèle distant sur l'API Document AI. Vous ne pouvez pas utiliser cette option avec un autre type de modèle distant.

Document AI fournit des processeurs prédéfinis pour extraire des insights de différents types de documents, dont les suivants :

  • Factures
  • Formulaires fiscaux
  • États financiers

Tous les types de processeurs ne sont pas compatibles. Les processeurs compatibles extraient les insights des documents et ont des descriptions commençant par Extract dans la galerie de processeurs. Par exemple, les analyseurs de factures, de bulletins de salaire et de relevés bancaires. L'instruction CREATE MODEL échoue si vous spécifiez un processeur non compatible.

La valeur de DOCUMENT_PROCESSOR doit être une chaîne au format suivant :

projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION

Remplacez les éléments suivants :

  • PROJECT_NUMBER : numéro du projet contenant le processeur de documents. Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément Projets (par exemple, https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process).
  • LOCATION : emplacement utilisé par le processeur de documents. Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément emplacements (par exemple https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process).
  • PROCESSOR_ID : ID du processeur de documents Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément processeurs (par exemple, https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process).
  • PROCESSOR_VERSION : version du processeur de documents. Vous pouvez trouver cette valeur en affichant les détails du processeur, en sélectionnant l'onglet Gérer les versions et en copiant la valeur d'ID de version de la version que vous souhaitez utiliser.

SPEECH_RECOGNIZER

Cette option identifie le processeur de reconnaissance vocale à utiliser (le cas échéant) lorsque la valeur REMOTE_SERVICE_TYPE est définie sur CLOUD_AI_SPEECH_TO_TEXT_V2. Si vous ne spécifiez pas cette option, vous devez spécifier une valeur pour l'argument recognition_config de la fonction ML.TRANSCRIBE si vous référencez le modèle distant. Vous ne pouvez pas utiliser cette option avec un autre type de modèle distant.

La valeur de SPEECH_RECOGNIZER doit être une chaîne au format suivant :

projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID

Remplacez les éléments suivants :

  • PROJECT_NUMBER : numéro du projet contenant l'outil de reconnaissance vocale. Vous pouvez trouver cette valeur sur la fiche Informations sur le projet de la page Tableau de bord de la console Google Cloud.
  • LOCATION : emplacement utilisé par le système de reconnaissance vocale. Vous pouvez trouver cette valeur dans le champ Emplacement de la page Répertorier les outils de reconnaissance de la console Google Cloud.
  • RECOGNIZER_ID : ID de l'outil de reconnaissance vocale. Vous pouvez trouver cette valeur dans le champ ID de la page Répertorier les outils de reconnaissance de la console Google Cloud.

Exemple

L'exemple suivant crée un modèle distant BigQuery ML qui utilise l'API Cloud Vision :

CREATE MODEL `project_id.mydataset.mymodel`
REMOTE WITH CONNECTION `myproject.us.test_connection`
 OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')

Étapes suivantes

Pour en savoir plus sur l'utilisation des services Cloud AI avec BigQuery ML, consultez la présentation des applications d'IA.