Diese Seite wurde von der Cloud Translation API übersetzt.

Multimodale Daten in Python mit BigQuery DataFrames analysieren

In dieser Anleitung erfahren Sie, wie Sie multimodale Daten in einem Python-Notebook mit BigQuery DataFrames-Klassen und -Methoden analysieren.

In dieser Anleitung wird der Produktkatalog aus dem öffentlichen Dataset des Cymbal-Zoohandels verwendet.

Informationen zum Hochladen eines Notebooks, das bereits mit den in diesem Tutorial behandelten Aufgaben gefüllt ist, finden Sie unter BigFrames Multimodal DataFrame.

Ziele

Multimodale DataFrames erstellen
Strukturierte und unstrukturierte Daten in einem DataFrame kombinieren
Bilder transformieren
Text und Einbettungen basierend auf Bilddaten generieren
PDFs für die weitere Analyse in Chunks aufteilen

Kosten

In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Google Cloud:

BigQuery: you incur costs for the data that you process in BigQuery.
BigQuery Python UDFs: you incur costs for using BigQuery DataFrames image transformation and chunk PDF methods.
Cloud Storage: you incur costs for the objects stored in Cloud Storage.
Vertex AI: you incur costs for calls to Vertex AI models.

Mit dem Preisrechner können Sie eine Kostenschätzung für Ihre voraussichtliche Nutzung vornehmen.

Neuen Nutzern von Google Cloud steht möglicherweise eine kostenlose Testversion zur Verfügung.

Weitere Informationen finden Sie auf den folgenden Preisseiten:

Hinweise

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.
Note: If you don't plan to keep the resources that you create in this procedure, create a project instead of selecting an existing project. After you finish these steps, you can delete the project, removing all resources associated with the project.

Go to project selector
Verify that billing is enabled for your Google Cloud project.
Enable the BigQuery, BigQuery Connection, Cloud Storage, and Vertex AI APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the APIs

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Ausführen dieser Anleitung benötigen:

Verbindung erstellen: BigQuery-Verbindungsadministrator (roles/bigquery.connectionAdmin)
Dem Dienstkonto der Verbindung Berechtigungen gewähren: Projekt-IAM-Administrator (roles/resourcemanager.projectIamAdmin)
Cloud Storage-Bucket erstellen: Storage-Administrator (roles/storage.admin)
BigQuery-Jobs ausführen: BigQuery-Nutzer (roles/bigquery.user)
Python-UDFs erstellen und aufrufen: BigQuery-Dateneditor (roles/bigquery.dataEditor)
URLs erstellen, mit denen Sie Cloud Storage-Objekte lesen und ändern können: BigQuery ObjectRef Admin (roles/bigquery.objectRefAdmin)
Notebooks verwenden:
- BigQuery Read Session-Nutzer ()roles/bigquery.readSessionUser
- Notebook Runtime-Nutzer (roles/aiplatform.notebookRuntimeUser)
- Notebook Runtime-Nutzer (roles/aiplatform.notebookRuntimeUser)
- Code Creator (roles/dataform.codeCreator)

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Einrichten

In diesem Abschnitt erstellen Sie den Cloud Storage-Bucket, die Verbindung und das Notebook, die in dieser Anleitung verwendet werden.

Bucket erstellen

Erstellen Sie einen Cloud Storage-Bucket zum Speichern transformierter Objekte:

Rufen Sie in der Google Cloud Console die Seite Buckets auf.

Buckets aufrufen
Klicken Sie auf Erstellen.
Geben Sie auf der Seite Bucket erstellen im Bereich Einstieg einen global eindeutigen Namen ein, der den Anforderungen für Bucket-Namen entspricht.
Klicken Sie auf Erstellen.

Verbindung herstellen

Erstellen Sie eine Cloud-Ressourcenverbindung und rufen Sie das Dienstkonto der Verbindung ab. BigQuery verwendet die Verbindung für den Zugriff auf Objekte in Cloud Storage.

Rufen Sie die Seite BigQuery auf.

BigQuery aufrufen
Klicken Sie im Bereich Explorer auf Daten hinzufügen.

Das Dialogfeld Daten hinzufügen wird geöffnet.
Wählen Sie im Bereich Filtern nach im Abschnitt Datenquellentyp die Option Geschäftsanwendungen aus.

Alternativ können Sie im Feld Nach Datenquellen suchen Vertex AI eingeben.
Klicken Sie im Abschnitt Empfohlene Datenquellen auf Vertex AI.
Klicken Sie auf die Lösungsübersichtskarte Vertex AI-Modelle: BigQuery Federation.
Wählen Sie in der Liste Verbindungstyp die Option Vertex AI-Remote-Modelle, Remote-Funktionen, BigLake und Cloud Spanner (Cloud-Ressource) aus.
Geben Sie im Feld Verbindungs-ID bigframes-default-connection ein.
Klicken Sie auf Verbindung erstellen.
Klicken Sie auf Zur Verbindung.
Kopieren Sie im Bereich Verbindungsinformationen die Dienstkonto-ID zur Verwendung in einem späteren Schritt.

Dem Dienstkonto der Verbindung Berechtigungen gewähren

Weisen Sie dem Dienstkonto der Verbindung die Rollen zu, die für den Zugriff auf Cloud Storage und Vertex AI erforderlich sind. Sie müssen diese Rollen in demselben Projekt gewähren, das Sie im Abschnitt Vorbereitung erstellt oder ausgewählt haben.

So weisen Sie die Rolle zu:

Zur Seite IAM & Verwaltung.

IAM & Verwaltung aufrufen
Klicken Sie auf Zugriff erlauben.
Geben Sie im Feld Neue Hauptkonten die Dienstkonto-ID ein, die Sie zuvor kopiert haben.
Wählen Sie im Feld Rolle auswählen die Option Cloud Storage und dann Storage-Objekt-Nutzer aus.
Klicken Sie auf Weitere Rolle hinzufügen.
Wählen Sie im Feld Rolle auswählen die Option Vertex AI und dann Vertex AI-Nutzer aus.
Klicken Sie auf Speichern.

Notebook erstellen

Erstellen Sie ein Notebook, in dem Sie Python-Code ausführen können:

Rufen Sie die Seite BigQuery auf.

BigQuery aufrufen
Klicken Sie in der Tableiste des Editorbereichs auf den Drop-down-Pfeil neben SQL-Abfrage und dann auf Notebook.
Klicken Sie im Bereich Mit einer Vorlage beginnen auf Schließen.
Klicken Sie auf VerbindenMit einer Laufzeit verbinden.
Wenn Sie bereits eine Laufzeit haben, übernehmen Sie die Standardeinstellungen und klicken Sie auf Verbinden. Wenn Sie noch keine Laufzeit haben, wählen Sie Neue Laufzeit erstellen aus und klicken Sie dann auf Verbinden.

Es kann einige Minuten dauern, bis die Laufzeit eingerichtet ist.

Multimodales DataFrame erstellen

Erstellen Sie mit der from_glob_path-Methode der Session-Klasse einen multimodalen DataFrame, in dem strukturierte und unstrukturierte Daten zusammengeführt werden:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

import bigframes

# Flags to control preview image/video preview size
bigframes.options.display.blob_display_width = 300

import bigframes.pandas as bpd

# Create blob columns from wildcard path.
df_image = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/images/*", name="image"
)
# Other ways are: from string uri column
# df = bpd.DataFrame({"uri": ["gs://<my_bucket>/<my_file_0>", "gs://<my_bucket>/<my_file_1>"]})
# df["blob_col"] = df["uri"].str.to_blob()

# From an existing object table
# df = bpd.read_gbq_object_table("<my_object_table>", name="blob_col")

# Take only the 5 images to deal with. Preview the content of the Mutimodal DataFrame
df_image = df_image.head(5)
df_image

Klicken Sie auf Ausführen.

Der letzte Aufruf von df_image gibt die Bilder zurück, die dem DataFrame hinzugefügt wurden. Alternativ können Sie die Methode .display aufrufen.

Strukturierte und unstrukturierte Daten im DataFrame kombinieren

Text- und Bilddaten im multimodalen DataFrame kombinieren:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

# Combine unstructured data with structured data
df_image["author"] = ["alice", "bob", "bob", "alice", "bob"]  # type: ignore
df_image["content_type"] = df_image["image"].blob.content_type()
df_image["size"] = df_image["image"].blob.size()
df_image["updated"] = df_image["image"].blob.updated()
df_image

Klicken Sie auf Ausführen .

Der Code gibt die DataFrame-Daten zurück.

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

# Filter images and display, you can also display audio and video types. Use width/height parameters to constrain window sizes.
df_image[df_image["author"] == "alice"]["image"].blob.display()

Klicken Sie auf Ausführen .

Der Code gibt Bilder aus dem DataFrame zurück, bei denen der Wert der Spalte author gleich alice ist.

Bildtransformationen durchführen

Bilddaten mit den folgenden Methoden der Series.BlobAccessor-Klasse transformieren:

Die transformierten Bilder werden in Cloud Storage geschrieben.

Bilder transformieren:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

df_image["blurred"] = df_image["image"].blob.image_blur(
    (20, 20), dst=f"{dst_bucket}/image_blur_transformed/", engine="opencv"
)
df_image["resized"] = df_image["image"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_resize_transformed/", engine="opencv"
)
df_image["normalized"] = df_image["image"].blob.image_normalize(
    alpha=50.0,
    beta=150.0,
    norm_type="minmax",
    dst=f"{dst_bucket}/image_normalize_transformed/",
    engine="opencv",
)

# You can also chain functions together
df_image["blur_resized"] = df_image["blurred"].blob.image_resize(
    (300, 200), dst=f"{dst_bucket}/image_blur_resize_transformed/", engine="opencv"
)
df_image

Aktualisieren Sie alle Verweise auf {dst_bucket} so, dass sie auf den von Ihnen erstellten Bucket im Format gs://mybucket verweisen.
Klicken Sie auf Ausführen .

Der Code gibt die Originalbilder sowie alle ihre Transformationen zurück.

Text generieren

Text aus multimodalen Daten mit der predict-Methode der GeminiTextGenerator-Klasse generieren:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

from bigframes.ml import llm

gemini = llm.GeminiTextGenerator(model_name="gemini-2.0-flash-001")

# Deal with first 2 images as example
df_image = df_image.head(2)

# Ask the same question on the images
df_image = df_image.head(2)
answer = gemini.predict(df_image, prompt=["what item is it?", df_image["image"]])
answer[["ml_generate_text_llm_result", "image"]]

Klicken Sie auf Ausführen .

Der Code gibt die ersten beiden Bilder in df_image zusammen mit Text zurück, der als Antwort auf die Frage what item is it? für beide Bilder generiert wurde.

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

# Ask different questions
df_image["question"] = [  # type: ignore
    "what item is it?",
    "what color is the picture?",
]
answer_alt = gemini.predict(
    df_image, prompt=[df_image["question"], df_image["image"]]
)
answer_alt[["ml_generate_text_llm_result", "image"]]

Klicken Sie auf Ausführen .

Der Code gibt die ersten beiden Bilder in df_image zurück. Für das erste Bild wird Text als Antwort auf die Frage what item is it? generiert und für das zweite Bild Text als Antwort auf die Frage what color is the picture?.

Einbettungen generieren

Generieren Sie Einbettungen für multimodale Daten mit der predict-Methode der MultimodalEmbeddingGenerator-Klasse:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

# Generate embeddings on images
embed_model = llm.MultimodalEmbeddingGenerator()
embeddings = embed_model.predict(df_image["image"])
embeddings

Klicken Sie auf Ausführen .

Der Code gibt die Einbettungen zurück, die durch einen Aufruf eines Einbettungsmodells generiert wurden.

PDFs in Chunks aufteilen

Teilen Sie PDF-Objekte in Chunks auf, indem Sie die pdf_chunk-Methode der Series.BlobAccessor-Klasse verwenden:

Erstellen Sie im Notebook eine Codezelle und kopieren Sie den folgenden Code hinein:

# PDF chunking
df_pdf = bpd.from_glob_path(
    "gs://cloud-samples-data/bigquery/tutorials/cymbal-pets/documents/*", name="pdf"
)
df_pdf["chunked"] = df_pdf["pdf"].blob.pdf_chunk(engine="pypdf")
chunked = df_pdf["chunked"].explode()
chunked

Klicken Sie auf Ausführen .

Der Code gibt die in Chunks aufgeteilten PDF-Daten zurück.

Bereinigen

Achtung: Das Löschen von Projekten hat folgende Auswirkungen:

Alle Inhalte des Projekts werden gelöscht. Wenn Sie für die Aufgaben in diesem Dokument ein bereits bestehendes Projekt verwendet haben und dieses löschen, werden auch alle anderen im Rahmen des Projekts erstellten Daten gelöscht.
Benutzerdefinierte Projekt-IDs gehen verloren. Beim Erstellen dieses Projekts haben Sie möglicherweise eine benutzerdefinierte Projekt-ID erstellt, die Sie weiterhin verwenden möchten. Damit die URLs, die die Projekt-ID nutzen, zum Beispiel eine appspot.com-URL, erhalten bleiben, sollten Sie ausgewählte Ressourcen innerhalb des Projekts löschen, anstatt das gesamte Projekt.

Wenn Sie mehrere Architekturen, Anleitungen und Kurzanleitungen durcharbeiten möchten, können Sie die Überschreitung von Projektkontingenten verhindern, indem Sie Projekte wiederverwenden.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.