L'istruzione CREATE MODEL per i modelli remoti nei servizi AI Cloud

Questo documento descrive l'istruzione CREATE MODEL per la creazione di modelli remoti in BigQuery tramite i servizi AI Cloud. ad esempio l'API Cloud Natural Language.

Sintassi CREATE MODEL

{CREATE MODEL | CREATE MODEL IF NOT EXISTS | CREATE OR REPLACE MODEL}
`project_id.dataset.model_name`
REMOTE WITH CONNECTION `project_id.region.connection_id`
OPTIONS(REMOTE_SERVICE_TYPE = remote_service_type
[, DOCUMENT_PROCESSOR = document_processor]
[, SPEECH_RECOGNIZER = speech_recognizer]
);

CREATE MODEL

Crea e addestra un nuovo modello nel set di dati specificato. Se il nome del modello esiste, CREATE MODEL restituisce un errore.

CREATE MODEL IF NOT EXISTS

Crea e addestra un nuovo modello solo se non esiste nel set di dati specificato.

CREATE OR REPLACE MODEL

Crea e addestra un modello e sostituisce un modello esistente con lo stesso nome nel set di dati specificato.

model_name

Il nome del modello che stai creando o sostituendo. Il nome del modello deve essere univoco nel set di dati: nessun altro modello o tabella può avere lo stesso nome. Il nome del modello deve seguire le stesse regole di denominazione di una tabella BigQuery. Il nome di un modello può:

  • Contiene fino a 1024 caratteri
  • Contenere lettere (maiuscole o minuscole), numeri e trattini bassi.

model_name non è sensibile alle maiuscole.

Se non hai configurato un progetto predefinito, devi anteporre l'ID progetto al nome del modello nel seguente formato, inclusi gli apici inversi:

"[ID_PROGETTO].[SET DI DATI].[MODEL]"

Ad esempio, "myproject.mydataset.mymodel".

REMOTE WITH CONNECTION

Sintassi

`[PROJECT_ID].[LOCATION].[CONNECTION_ID]`

BigQuery utilizza una connessione risorse Cloud per interagire con il servizio IA Cloud.

Gli elementi di connessione sono i seguenti:

  • PROJECT_ID: l'ID del progetto che contiene la connessione.
  • LOCATION: la località utilizzata dalla connessione. La connessione deve trovarsi nella stessa località del set di dati che contiene il modello.
  • CONNECTION_ID: l'ID connessione, ad esempio myconnection.

    Per trovare l'ID connessione, visualizza i dettagli della connessione nella console Google Cloud. L'ID connessione è il valore nell'ultima sezione dell'ID connessione completo mostrato in ID connessione, ad esempio projects/myproject/locations/connection_location/connections/myconnection.

Devi concedere il ruolo Utente Vertex AI all'account di servizio della connessione nel progetto in cui crei il modello.

Esempio

`myproject.us.my_connection`

REMOTE_SERVICE_TYPE

Sintassi

REMOTE_SERVICE_TYPE = { 'CLOUD_AI_NATURAL_LANGUAGE_V1' | 'CLOUD_AI_TRANSLATE_V3' | 'CLOUD_AI_VISION_V1' | 'CLOUD_AI_DOCUMENT_V1' | 'CLOUD_AI_SPEECH_TO_TEXT_V2' }

Description

Specifica il servizio da utilizzare per creare il modello:

Dopo aver creato un modello remoto basato su un servizio IA di Cloud, puoi utilizzarlo con una delle seguenti funzioni di BigQuery ML per analizzare i tuoi dati BigQuery:

Esempio

REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1'

DOCUMENT_PROCESSOR

Questa opzione identifica l'elaboratore dei documenti da utilizzare quando il valore REMOTE_SERVICE_TYPE è CLOUD_AI_DOCUMENT_V1. Devi utilizzare questa opzione quando crei un modello remoto sull'API Document AI. Non puoi utilizzare questa opzione con nessun altro tipo di modello remoto.

Document AI fornisce processori predefiniti per estrarre insight da vari tipi di documenti, come ad esempio:

  • Fatture
  • Moduli fiscali
  • Rendiconti finanziari

Non tutti i tipi di processori sono supportati. I processori supportati estraggono insight dai documenti e hanno descrizioni nella galleria dei processori che iniziano con Extract. ad esempio fattura, distinta di paga e analizzatori dell'estratto conto bancario. L'istruzione CREATE MODEL non riesce se specifichi un processore non supportato.

Il valore DOCUMENT_PROCESSOR deve essere una stringa nel seguente formato:

projects/PROJECT_NUMBER/locations/LOCATION/processors/PROCESSOR_ID/processorVersions/PROCESSOR_VERSION

Sostituisci quanto segue:

  • PROJECT_NUMBER: il numero del progetto che contiene l'elaboratore dei documenti. Per trovare questo valore, esamina i dettagli del processore, esamina l'endpoint di previsione e assumi il valore che segue l'elemento progetti, ad esempio https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • LOCATION: la posizione utilizzata dall'elaboratore di documenti. Per trovare questo valore, esamina i dettagli del processore, esamina l'endpoint di previsione e utilizza il valore che segue l'elemento locations, ad esempio https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_ID: l'ID elaboratore dei documenti. Per trovare questo valore, esamina i dettagli del processore, consulta Endpoint di previsione e assumi il valore che segue l'elemento processors, ad esempio https://us-documentai.googleapis.com/v1/projects/project_number/locations/processor_location/processors/processor_id:process.
  • PROCESSOR_VERSION: la versione del processore di documenti. Puoi trovare questo valore esaminando i dettagli del processore, selezionando la scheda Gestisci versioni e copiando il valore ID versione della versione che vuoi utilizzare.

SPEECH_RECOGNIZER

Questa opzione identifica il riconoscimento vocale da utilizzare facoltativamente quando il valore REMOTE_SERVICE_TYPE è CLOUD_AI_SPEECH_TO_TEXT_V2. Se non specifichi questa opzione, devi specificare un valore per l'argomento recognition_config della funzione ML.TRANSCRIBE se fai riferimento al modello remoto. Non puoi usare questa opzione con altri tipi di modello remoto.

Il valore SPEECH_RECOGNIZER deve essere una stringa nel seguente formato:

projects/PROJECT_NUMBER/locations/LOCATION/recognizers/RECOGNIZER_ID

Sostituisci quanto segue:

  • PROJECT_NUMBER: il numero del progetto che contiene il riconoscimento vocale. Puoi trovare questo valore nella scheda Informazioni sul progetto della pagina Dashboard della console Google Cloud.
  • LOCATION: la posizione utilizzata dal riconoscimento vocale. Puoi trovare questo valore nel campo Posizione nella pagina Elenca riconoscimenti della console Google Cloud.
  • RECOGNIZER_ID: l'ID riconoscimento vocale. Puoi trovare questo valore nel campo ID nella pagina Elenca riconoscimenti della console Google Cloud.

Esempio

L'esempio seguente crea un modello remoto BigQuery ML che utilizza l'API Cloud Vision:

CREATE MODEL `project_id.mydataset.mymodel`
REMOTE WITH CONNECTION `myproject.us.test_connection`
 OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')

Passaggi successivi

Per ulteriori informazioni sull'utilizzo dei servizi IA di Cloud con BigQuery ML, consulta Panoramica delle applicazioni IA.