Questa pagina è stata tradotta dall'API Cloud Translation.

Analizza i dati multimodali in Python con BigQuery DataFrames

Questo tutorial mostra come analizzare dati multimodali in un notebook Python utilizzando classi e metodi BigQuery DataFrames.

Questo tutorial utilizza il catalogo prodotti del set di dati pubblico del negozio di animali Cymbal.

Per caricare un notebook già compilato con le attività trattate in questo tutorial, consulta BigFrames Multimodal DataFrame.

Obiettivi

Crea DataFrame multimodali.
Combina dati strutturati e non strutturati in un DataFrame.
Trasformare le immagini.
Genera testo ed embedding basati sui dati delle immagini.
Dividi i PDF in blocchi per ulteriori analisi.

Costi

In questo documento vengono utilizzati i seguenti componenti fatturabili di Google Cloud:

BigQuery: you incur costs for the data that you process in BigQuery.
BigQuery Python UDFs: you incur costs for using BigQuery DataFrames image transformation and chunk PDF methods.
Cloud Storage: you incur costs for the objects stored in Cloud Storage.
Vertex AI: you incur costs for calls to Vertex AI models.

Per generare una stima dei costi in base all'utilizzo previsto, utilizza il calcolatore prezzi.

I nuovi utenti di Google Cloud potrebbero avere diritto a una prova senza costi.

Per ulteriori informazioni, consulta le seguenti pagine dei prezzi:

Prima di iniziare

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, BigQuery Connection, Cloud Storage, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the APIs

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per completare questo tutorial, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Crea una connessione: Amministratore connessione BigQuery (roles/bigquery.connectionAdmin)
Concedi le autorizzazioni al account di servizio della connessione: Project IAM Admin (roles/resourcemanager.projectIamAdmin)
Crea un bucket Cloud Storage: Storage Admin (roles/storage.admin)
Esegui job BigQuery: Utente BigQuery (roles/bigquery.user)
Crea e chiama UDF Python: Editor dati BigQuery (roles/bigquery.dataEditor)
Crea URL che ti consentono di leggere e modificare gli oggetti Cloud Storage: BigQuery ObjectRef Admin (roles/bigquery.objectRefAdmin)
Utilizzare i notebook:
- BigQuery Read Session User (roles/bigquery.readSessionUser)
- Utente runtime blocco note (roles/aiplatform.notebookRuntimeUser)
- Utente runtime blocco note (roles/aiplatform.notebookRuntimeUser)
- Code Creator (roles/dataform.codeCreator)

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Configura

In questa sezione, creerai il bucket Cloud Storage, la connessione e il notebook utilizzati in questo tutorial.

Crea un bucket

Crea un bucket Cloud Storage per archiviare gli oggetti trasformati:

Nella console Google Cloud , vai alla pagina Bucket.

Vai a Bucket
Fai clic su Crea.
Nella pagina Crea un bucket, inserisci un nome univoco a livello globale che soddisfi i requisiti per il nome del bucket nella sezione Inizia.
Fai clic su Crea.

Crea una connessione

Crea una connessione risorsa Cloud e ottieni il account di servizio della connessione. BigQuery utilizza la connessione per accedere agli oggetti in Cloud Storage.

Vai alla pagina BigQuery.

Vai a BigQuery
Nel riquadro Explorer, fai clic su Aggiungi dati.

Si apre la finestra di dialogo Aggiungi dati.
Nel riquadro Filtra per, nella sezione Tipo di origine dati, seleziona Applicazioni aziendali.

In alternativa, nel campo Cerca origini dati, puoi inserire Vertex AI.
Nella sezione Origini dati in evidenza, fai clic su Vertex AI.
Fai clic sulla scheda della soluzione Vertex AI Models: BigQuery Federation.
Nell'elenco Tipo di connessione, seleziona Modelli remoti di Vertex AI, funzioni remote, BigLake e Spanner (risorsa Cloud).
Nel campo ID connessione, digita bigframes-default-connection.
Fai clic su Crea connessione.
Fai clic su Vai alla connessione.
Nel riquadro Informazioni sulla connessione, copia l'ID del account di servizio da utilizzare in un passaggio successivo.

Concedi le autorizzazioni al account di servizio della connessione

Concedi al account di servizio della connessione i ruoli necessari per accedere a Cloud Storage e Vertex AI. Devi concedere questi ruoli nello stesso progetto che hai creato o selezionato nella sezione Prima di iniziare.

Per concedere il ruolo, segui questi passaggi:

Vai alla pagina IAM e amministrazione.

Vai a IAM e amministrazione
Fai clic su Concedi l'accesso.
Nel campo Nuove entità, inserisci l'ID account di servizio che hai copiato in precedenza.
Nel campo Seleziona un ruolo, scegli Cloud Storage e poi seleziona Utente oggetti Storage.
Fai clic su Aggiungi un altro ruolo.
Nel campo Seleziona un ruolo, seleziona Vertex AI, quindi seleziona Utente Vertex AI.
Fai clic su Salva.

Crea un notebook

Crea un notebook in cui puoi eseguire il codice Python:

Vai alla pagina BigQuery.

Vai a BigQuery
Nella barra delle schede del riquadro dell'editor, fai clic sulla freccia menu a discesa accanto a Query SQL e poi fai clic su Blocco note.
Nel riquadro Inizia con un modello, fai clic su Chiudi.
Fai clic su Connetti > Connetti a un runtime.
Se hai un runtime esistente, accetta le impostazioni predefinite e fai clic su Connetti. Se non hai un runtime esistente, seleziona Crea nuovo runtime, quindi fai clic su Connetti.

La configurazione del runtime potrebbe richiedere diversi minuti.

Crea un DataFrame multimodale

Crea un DataFrame multimodale che integra dati strutturati e non strutturati utilizzando il metodo from_glob_path della classe Session:

Nel notebook, crea una cella di codice e copia il seguente codice:

import bigframes

# Flags to control preview image/video preview size
bigframes.options.display.blob_display_width = 300

import bigframes.pandas as bpd

# Create blob columns from wildcard path.
df_image = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/images/*", name="image"
)
# Other ways are: from string uri column
# df = bpd.DataFrame({"uri": ["gs://<my_bucket>/<my_file_0>", "gs://<my_bucket>/<my_file_1>"]})
# df["blob_col"] = df["uri"].str.to_blob()

# From an existing object table
# df = bpd.read_gbq_object_table("<my_object_table>", name="blob_col")

# Take only the 5 images to deal with. Preview the content of the Mutimodal DataFrame
df_image = df_image.head(5)
df_image

Fai clic su Esegui.

L'ultima chiamata a df_image restituisce le immagini che sono state aggiunte al DataFrame. In alternativa, puoi chiamare il metodo .display.

Combinare dati strutturati e non strutturati nel DataFrame

Combina i dati di testo e immagine nel DataFrame multimodale:

Nel notebook, crea una cella di codice e copia il seguente codice:

# Combine unstructured data with structured data
df_image["author"] = ["alice", "bob", "bob", "alice", "bob"]  # type: ignore
df_image["content_type"] = df_image["image"].blob.content_type()
df_image["size"] = df_image["image"].blob.size()
df_image["updated"] = df_image["image"].blob.updated()
df_image

Fai clic su Esegui .

Il codice restituisce i dati del DataFrame.

Nel notebook, crea una cella di codice e copia il seguente codice:

# Filter images and display, you can also display audio and video types. Use width/height parameters to constrain window sizes.
df_image[df_image["author"] == "alice"]["image"].blob.display()

Fai clic su Esegui .

Il codice restituisce le immagini del DataFrame in cui il valore della colonna author è alice.

Eseguire trasformazioni delle immagini

Trasforma i dati delle immagini utilizzando i seguenti metodi della classe Series.BlobAccessor:

Le immagini trasformate vengono scritte in Cloud Storage.

Trasformare le immagini:

Nel notebook, crea una cella di codice e copia il seguente codice:

df_image["blurred"] = df_image["image"].blob.image_blur(
    (20, 20), dst=f"{dst_bucket}/image_blur_transformed/", engine="opencv"
)
df_image["resized"] = df_image["image"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_resize_transformed/", engine="opencv"
)
df_image["normalized"] = df_image["image"].blob.image_normalize(
    alpha=50.0,
    beta=150.0,
    norm_type="minmax",
    dst=f"{dst_bucket}/image_normalize_transformed/",
    engine="opencv",
)

# You can also chain functions together
df_image["blur_resized"] = df_image["blurred"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_blur_resize_transformed/", engine="opencv"
)
df_image

Aggiorna tutti i riferimenti a {dst_bucket} in modo che facciano riferimento al bucket che hai creato, nel formato gs://mybucket.
Fai clic su Esegui .

Il codice restituisce le immagini originali e tutte le relative trasformazioni.

Genera testo

Genera testo da dati multimodali utilizzando il metodo predict della classe GeminiTextGenerator:

Nel notebook, crea una cella di codice e copia il seguente codice:

from bigframes.ml import llm

gemini = llm.GeminiTextGenerator(model_name="gemini-2.0-flash-001")

# Deal with first 2 images as example
df_image = df_image.head(2)

# Ask the same question on the images
df_image = df_image.head(2)
answer = gemini.predict(df_image, prompt=["what item is it?", df_image["image"]])
answer[["ml_generate_text_llm_result", "image"]]

Fai clic su Esegui .

Il codice restituisce le prime due immagini in df_image, insieme al testo generato in risposta alla domanda what item is it? per entrambe le immagini.

Nel notebook, crea una cella di codice e copia il seguente codice:

# Ask different questions
df_image["question"] = [  # type: ignore
    "what item is it?",
    "what color is the picture?",
]
answer_alt = gemini.predict(
    df_image, prompt=[df_image["question"], df_image["image"]]
)
answer_alt[["ml_generate_text_llm_result", "image"]]

Fai clic su Esegui .

Il codice restituisce le prime due immagini in df_image, con testo generato in risposta alla domanda what item is it? per la prima immagine e testo generato in risposta alla domanda what color is the picture? per la seconda immagine.

Genera embedding

Genera embedding per dati multimodali utilizzando il metodo predict della classe MultimodalEmbeddingGenerator:

Nel notebook, crea una cella di codice e copia il seguente codice:

# Generate embeddings on images
embed_model = llm.MultimodalEmbeddingGenerator()
embeddings = embed_model.predict(df_image["image"])
embeddings

Fai clic su Esegui .

Il codice restituisce gli embedding generati da una chiamata a un modello di embedding.

Dividere i PDF in blocchi

Dividi gli oggetti PDF in blocchi utilizzando il metodo pdf_chunk della classe Series.BlobAccessor:

Nel notebook, crea una cella di codice e copia il seguente codice:

# PDF chunking
df_pdf = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/documents/*", name="pdf"
)
df_pdf["chunked"] = df_pdf["pdf"].blob.pdf_chunk(engine="pypdf")
chunked = df_pdf["chunked"].explode()
chunked

Fai clic su Esegui .

Il codice restituisce i dati PDF suddivisi in blocchi.

Esegui la pulizia

Attenzione: l'eliminazione di un progetto ha i seguenti effetti:

L'intero contenuto del progetto viene eliminato. Se hai utilizzato un progetto esistente per le attività descritte in questo documento, quando lo elimini, elimini anche tutto il lavoro che hai svolto nel progetto.
Gli ID progetto personalizzati non sono più disponibili. Quando hai creato questo progetto, potresti aver creato un ID progetto personalizzato che vuoi utilizzare in futuro. Per conservare gli URL che utilizzano l'ID progetto, ad esempio un URL appspot.com, elimina le risorse selezionate all'interno del progetto anziché eliminare l'intero progetto.

Se intendi esplorare più architetture, tutorial o guide rapide, puoi riutilizzare i progetti ed evitare così di superare i limiti di quota.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.