Instruction CREATE MODEL pour les modèles distants utilisés via les services Cloud AI
Ce document décrit l'instruction CREATE MODEL
permettant de créer des modèles distants dans BigQuery via des services Cloud AI. Par exemple, l'API Cloud Natural Language.
Syntaxe de CREATE MODEL
{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL} `project_id.dataset.model_name` REMOTE WITH CONNECTION `project_id.region.connection_id` OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type [, DOCUMENT_PROCESSOR = document_processor] [, SPEECH_RECOGNIZER = speech_recognizer] );
CREATE MODEL
Crée et entraîne un modèle dans l'ensemble de données spécifié. Si le nom du modèle existe, CREATE MODEL
renvoie une erreur.
CREATE MODEL IF NOT EXISTS
Crée et entraîne un modèle uniquement si celui-ci n'existe pas dans l'ensemble de données spécifié.
CREATE OR REPLACE MODEL
Crée et entraîne un modèle. Permet également de remplacer un modèle existant du même nom dans l'ensemble de données spécifié.
model_name
Nom du modèle que vous créez ou remplacez. Le nom du modèle doit être unique dans l'ensemble de données. Aucun autre modèle, ni table ne peut porter le même nom. Le nom du modèle doit respecter les mêmes règles de dénomination que celles des tables BigQuery. Un nom de modèle peut :
- contenir jusqu'à 1 024 caractères ;
- contenir des lettres (majuscules ou minuscules), des chiffres et des traits de soulignement.
model_name
n'est pas sensible à la casse.
Si aucun projet par défaut n'est configuré, vous devez préfixer le nom du modèle par l'ID du projet en respectant le format suivant (y compris les accents graves) :
`[PROJECT_ID].[DATASET].[MODEL]`
par exemple, `myproject.mydataset.mymodel`.
REMOTE WITH CONNECTION
Syntaxe
`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`
BigQuery utilise une connexion aux ressources Cloud pour interagir avec le service Cloud AI.
Les éléments de connexion sont les suivants :
PROJECT_ID
: ID du projet contenant la connexion.LOCATION
: emplacement utilisé par la connexion. La connexion doit se trouver au même emplacement que l'ensemble de données contenant le modèle.CONNECTION_ID
: ID de connexion, par exemplemyconnection
Pour trouver votre ID de connexion, affichez les détails de la connexion dans la console Google Cloud. L'ID de connexion correspond à la valeur de la dernière section de l'ID de connexion complet affiché dans la section ID de connexion (par exemple,
projects/myproject/locations/connection_location/connections/myconnection
).
Vous devez attribuer le rôle d'utilisateur Vertex AI au compte de service de la connexion dans le projet dans lequel vous créez le modèle.
Exemple
`myproject.us.my_connection`
REMOTE_SERVICE_TYPE
Syntaxe
REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }
Description
Spécifie le service à utiliser pour créer le modèle :
- API Cloud Natural Language
- API Cloud Translation
- API Cloud Vision
- API Document AI (bêta)
- API Speech-to-Text (bêta)
Après avoir créé un modèle distant basé sur un service Cloud AI, vous pouvez l'utiliser avec l'une des fonctions BigQuery ML suivantes pour analyser vos données BigQuery :
- Pour les modèles d'API Cloud Natural Language, utilisez
ML.UNDERSTAND_TEXT
. - Pour les modèles d'API Cloud Translation, utilisez
ML.TRANSLATE
. - Pour les modèles d'API Cloud Vision, utilisez
ML.ANNOTATE_IMAGE
. - Pour les modèles d'API Document AI, utilisez
ML.PROCESS_DOCUMENT
(bêta). - Pour les modèles d'API Speech-to-Text, utilisez
ML.TRANSCRIBE
(bêta).
Exemple
REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'
DOCUMENT_PROCESSOR
Cette option identifie le processeur de documents à utiliser lorsque la valeur de REMOTE_SERVICE_TYPE
est CLOUD_AI_DOCUMENT_V1
. Vous devez utiliser cette option lorsque vous créez un modèle distant sur l'API Document AI. Vous ne pouvez pas utiliser cette option avec un autre type de modèle distant.
Document AI fournit des processeurs prédéfinis pour extraire des insights de différents types de documents, dont les suivants :
- Factures
- Formulaires fiscaux
- États financiers
Tous les types de processeurs ne sont pas compatibles. Les processeurs compatibles extraient les insights des documents et ont des descriptions commençant par Extract
dans la galerie de processeurs. Par exemple, les analyseurs de factures, de bulletins de salaire et de relevés bancaires. L'instruction CREATE MODEL
échoue si vous spécifiez un processeur non compatible.
La valeur de DOCUMENT_PROCESSOR
doit être une chaîne au format suivant :
projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
Remplacez les éléments suivants :
PROJECT_NUMBER
: numéro du projet contenant le processeur de documents. Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément Projets (par exemple,https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
).LOCATION
: emplacement utilisé par le processeur de documents. Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément emplacements (par exemplehttps://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
).PROCESSOR_ID
: ID du processeur de documents Pour trouver cette valeur, procédez comme suit :Affichez les détails du processeur, regardez le Point de terminaison de prédiction, et prenez la valeur qui suit l'élément processeurs (par exemple,https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
).PROCESSOR_VERSION
: version du processeur de documents. Vous pouvez trouver cette valeur en affichant les détails du processeur, en sélectionnant l'onglet Gérer les versions et en copiant la valeur d'ID de version de la version que vous souhaitez utiliser.
SPEECH_RECOGNIZER
Cette option identifie le processeur de reconnaissance vocale à utiliser (le cas échéant) lorsque la valeur REMOTE_SERVICE_TYPE
est définie sur CLOUD_AI_SPEECH_TO_TEXT_V2
. Si vous ne spécifiez pas cette option, vous devez spécifier une valeur pour l'argument recognition_config
de la fonction ML.TRANSCRIBE
si vous référencez le modèle distant. Vous ne pouvez pas utiliser cette option avec un autre type de modèle distant.
La valeur de SPEECH_RECOGNIZER
doit être une chaîne au format suivant :
projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID
Remplacez les éléments suivants :
PROJECT_NUMBER
: numéro du projet contenant l'outil de reconnaissance vocale. Vous pouvez trouver cette valeur sur la fiche Informations sur le projet de la page Tableau de bord de la console Google Cloud.LOCATION
: emplacement utilisé par le système de reconnaissance vocale. Vous pouvez trouver cette valeur dans le champ Emplacement de la page Répertorier les outils de reconnaissance de la console Google Cloud.RECOGNIZER_ID
: ID de l'outil de reconnaissance vocale. Vous pouvez trouver cette valeur dans le champ ID de la page Répertorier les outils de reconnaissance de la console Google Cloud.
Exemple
L'exemple suivant crée un modèle distant BigQuery ML qui utilise l'API Cloud Vision :
CREATE MODEL `project_id.mydataset.mymodel` REMOTE WITH CONNECTION `myproject.us.test_connection` OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')
Étapes suivantes
Pour en savoir plus sur l'utilisation des services Cloud AI avec BigQuery ML, consultez la présentation des applications d'IA.