L'istruzione CREATE MODEL per i modelli remoti nei servizi AI Cloud
Questo documento descrive l'istruzione CREATE MODEL
per la creazione di modelli remoti in BigQuery
tramite i servizi AI Cloud. ad esempio
l'API Cloud Natural Language.
Sintassi CREATE MODEL
{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL} `project_id.dataset.model_name` REMOTE WITH CONNECTION `project_id.region.connection_id` OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type [, DOCUMENT_PROCESSOR = document_processor] [, SPEECH_RECOGNIZER = speech_recognizer] );
CREATE MODEL
Crea e addestra un nuovo modello nel set di dati specificato. Se il nome del modello esiste, CREATE MODEL
restituisce un errore.
CREATE MODEL IF NOT EXISTS
Crea e addestra un nuovo modello solo se non esiste nel set di dati specificato.
CREATE OR REPLACE MODEL
Crea e addestra un modello e sostituisce un modello esistente con lo stesso nome nel set di dati specificato.
model_name
Il nome del modello che stai creando o sostituendo. Il nome del modello deve essere univoco nel set di dati: nessun altro modello o tabella può avere lo stesso nome. Il nome del modello deve seguire le stesse regole di denominazione di una tabella BigQuery. Il nome di un modello può:
- Contiene fino a 1024 caratteri
- Contenere lettere (maiuscole o minuscole), numeri e trattini bassi.
model_name
non è sensibile alle maiuscole.
Se non hai configurato un progetto predefinito, devi anteporre l'ID progetto al nome del modello nel seguente formato, inclusi gli apici inversi:
"[ID_PROGETTO].[SET DI DATI].[MODEL]"
Ad esempio, "myproject.mydataset.mymodel".
REMOTE WITH CONNECTION
Sintassi
`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`
BigQuery utilizza una connessione risorse Cloud per interagire con il servizio IA Cloud.
Gli elementi di connessione sono i seguenti:
PROJECT_ID
: l'ID del progetto che contiene la connessione.LOCATION
: la località utilizzata dalla connessione. La connessione deve trovarsi nella stessa località del set di dati che contiene il modello.CONNECTION_ID
: l'ID connessione, ad esempiomyconnection
.Per trovare l'ID connessione, visualizza i dettagli della connessione nella console Google Cloud. L'ID connessione è il valore nell'ultima sezione dell'ID connessione completo mostrato in ID connessione, ad esempio
projects/myproject/locations/connection_location/connections/myconnection
.
Devi concedere il ruolo Utente Vertex AI all'account di servizio della connessione nel progetto in cui crei il modello.
Esempio
`myproject.us.my_connection`
REMOTE_SERVICE_TYPE
Sintassi
REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }
Description
Specifica il servizio da utilizzare per creare il modello:
- API Cloud Natural Language
- API Cloud Translation
- API Cloud Vision
- API Document AI (anteprima)
- API Speech-to-Text (anteprima)
Dopo aver creato un modello remoto basato su un servizio IA di Cloud, puoi utilizzarlo con una delle seguenti funzioni di BigQuery ML per analizzare i tuoi dati BigQuery:
- Per i modelli dell'API Cloud Natural Language, utilizza
ML.UNDERSTAND_TEXT
- Per i modelli dell'API Cloud Translation, utilizza
ML.TRANSLATE
- Per i modelli dell'API Cloud Vision, utilizza
ML.ANNOTATE_IMAGE
- Per i modelli dell'API Document AI, utilizza
ML.PROCESS_DOCUMENT
(anteprima) - Per i modelli di API Speech-to-Text, utilizza
ML.TRANSCRIBE
(anteprima)
Esempio
REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'
DOCUMENT_PROCESSOR
Questa opzione identifica l'elaboratore dei documenti da utilizzare quando il valore REMOTE_SERVICE_TYPE
è CLOUD_AI_DOCUMENT_V1
. Devi utilizzare questa opzione quando crei un modello remoto sull'API Document AI. Non puoi
utilizzare questa opzione con nessun altro tipo di modello remoto.
Document AI fornisce processori predefiniti per estrarre insight da vari tipi di documenti, come ad esempio:
- Fatture
- Moduli fiscali
- Rendiconti finanziari
Non tutti i tipi di processori sono supportati. I processori supportati estraggono insight dai documenti e hanno descrizioni nella galleria dei processori che iniziano con Extract
. ad esempio fattura, distinta di paga e
analizzatori dell'estratto conto bancario. L'istruzione CREATE MODEL
non riesce se specifichi un processore non supportato.
Il valore DOCUMENT_PROCESSOR
deve essere una stringa nel seguente formato:
projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION
Sostituisci quanto segue:
PROJECT_NUMBER
: il numero del progetto che contiene l'elaboratore dei documenti. Per trovare questo valore, esamina i dettagli del processore, esamina l'endpoint di previsione e assumi il valore che segue l'elemento progetti, ad esempiohttps://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.LOCATION
: la posizione utilizzata dall'elaboratore di documenti. Per trovare questo valore, esamina i dettagli del processore, esamina l'endpoint di previsione e utilizza il valore che segue l'elemento locations, ad esempiohttps://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_ID
: l'ID elaboratore dei documenti. Per trovare questo valore, esamina i dettagli del processore, consulta Endpoint di previsione e assumi il valore che segue l'elemento processors, ad esempiohttps://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process
.PROCESSOR_VERSION
: la versione del processore di documenti. Puoi trovare questo valore esaminando i dettagli del processore, selezionando la scheda Gestisci versioni e copiando il valore ID versione della versione che vuoi utilizzare.
SPEECH_RECOGNIZER
Questa opzione identifica il riconoscimento vocale da utilizzare facoltativamente quando il valore REMOTE_SERVICE_TYPE
è CLOUD_AI_SPEECH_TO_TEXT_V2
. Se non specifichi questa opzione, devi specificare un valore per l'argomento recognition_config
della funzione ML.TRANSCRIBE
se fai riferimento al modello remoto. Non puoi usare questa opzione con
altri tipi di modello remoto.
Il valore SPEECH_RECOGNIZER
deve essere una stringa nel seguente formato:
projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID
Sostituisci quanto segue:
PROJECT_NUMBER
: il numero del progetto che contiene il riconoscimento vocale. Puoi trovare questo valore nella scheda Informazioni sul progetto della pagina Dashboard della console Google Cloud.LOCATION
: la posizione utilizzata dal riconoscimento vocale. Puoi trovare questo valore nel campo Posizione nella pagina Elenca riconoscimenti della console Google Cloud.RECOGNIZER_ID
: l'ID riconoscimento vocale. Puoi trovare questo valore nel campo ID nella pagina Elenca riconoscimenti della console Google Cloud.
Esempio
L'esempio seguente crea un modello remoto BigQuery ML che utilizza l'API Cloud Vision:
CREATE MODEL `project_id.mydataset.mymodel` REMOTE WITH CONNECTION `myproject.us.test_connection` OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')
Passaggi successivi
Per ulteriori informazioni sull'utilizzo dei servizi IA di Cloud con BigQuery ML, consulta Panoramica delle applicazioni IA.