Data Science on Google Cloud

Einheitliche Plattform für Datenverwaltung, Analysen und Machine-Learning-Tools, um Ihre Daten-zu-KI-Workflows zu beschleunigen.

Praktischer Leitfaden für Data Science mit Google Cloud

Warum Google Cloud für Data Science?

Mit der einheitlichen Daten- und KI-Plattform von Google Cloud

So steigern Sie die Geschwindigkeit und Agilität Ihres Unternehmens und schaffen kurz- und langfristige Mehrwerte.

3x


Kosteneffizienter durch minimierte Datenverschiebung

4 x


Schnelleres Modelltraining, schnellere Feinabstimmung und Bereitstellung

10-mal


Geringere KI-Kosten, wodurch sich ROI-Ziele leichter erreichen lassen

Integrierte Tools für Data Science

Einheitliche Plattform für End-to-End-Workflows im Bereich Data Science

Einheitliche Lösung für den gesamten Data Science- und Machine Learning-Lebenszyklus, die auf einer multimodalen Datenbasis aufbaut und eine einheitliche Governance gewährleistet. Nutzen Sie leistungsstarke Analyse-Engines wie BigQuery SQL und Spark und erstellen Sie dann Modelle mit BigQuery ML oder Vertex AI. Mit dem KI-basierten Colab Enterprise-Notebook und robusten MLOps, unterstützt durch branchenführende KI, können Sie die Entwicklung optimieren.

Zentralisierter Arbeitsbereich mit KI-basierten Notebooks

Es stehen mehrere Notebook-Lösungen für Data Science in Unternehmen zur Verfügung. Colab Enterprise bietet eine sichere, verwaltete Umgebung, die in Vertex AI und BigQuery eingebunden ist. Vertex AI Workbenches bieten anpassbare JupyterLab-Instanzen, während Cloud Workstations vollständige IDEs unterstützen. Außerdem können Sie mit Erweiterungen selbst gehostete Tools direkt mit den Google Cloud-Diensten verbinden.

Data Science Agent

Integrierter Data-Science-Agent

Beschleunigen Sie die Data-Science-Entwicklung mit agentischen Funktionen, die die Datenexploration, ‑transformation und ML-Modellierung erleichtern. Beginnen Sie mit einem allgemeinen Ziel in natürlicher Sprache. Der Data-Science-Agent erstellt dann einen detaillierten Plan, der alle Aspekte der Data-Science-Modellierung abdeckt: Daten laden, untersuchen, bereinigen, visualisieren, Feature Engineering, Daten aufteilen, Modell trainieren/optimieren und bewerten.

KI-gestützte Datenvorbereitung ohne Silos

Nutzen Sie eine einheitliche Datenbasis, um sowohl strukturierte als auch unstrukturierte Daten (Bilder, Dokumente usw.) mit SQL für die Analyse und KI-Funktionen für die Verarbeitung zu verwalten. Die KI-gestützte Datenvorbereitung stellt Vorschläge für die Datenbereinigung und ‑transformation bereit. Der Data Engineering Agent automatisiert Aufgaben im Bereich Data Engineering, einschließlich der Aufnahme und Erstellung von Pipelines, durch Anweisungen in natürlicher Sprache.

Data Engineering Agent
Verwaltetes Dataproc und serverloses Spark

Flexible Datenverarbeitung mit mehreren Engines

Sie können eine beliebige Verarbeitungs-Engine auswählen – die SQL-Engine von BigQuery oder ein Open-Source-Framework wie Apache Spark – und direkt mit einer einzigen, einheitlichen Datenkopie arbeiten. So müssen Sie keine separaten Datenkopien für verschiedene Systeme verwalten.

Data Science mit BigQuery DataFrames für Python skalieren

Sie bevorzugen Python-native Bibliotheken? BigQuery DataFrames bieten eine Pandas ähnliche API, die Python-Code in optimiertes SQL für die Ausführung in der BigQuery-Engine übersetzt. So können Sie das richtige Tool für die jeweilige Aufgabe verwenden, ob SQL, PySpark oder ein DataFrame im Pandas-Stil, und dabei immer mit denselben zugrunde liegenden Daten arbeiten.

Video: BigQuery DataFrames
BQML

ML-Modelle erstellen, trainieren, abstimmen und ausführen

Mit BigQuery ML können Sie Modelle mit SQL erstellen, trainieren, bewerten und bereitstellen, ohne Daten verschieben zu müssen. Nutzen Sie integrierte, vortrainierte Modelle oder SQL-Funktionen, die Gemini für die Datenanalyse/Datenanreicherung aufrufen. Für benutzerdefinierte Modelle unterstützt Vertex AI PyTorch, TensorFlow und andere ML-Bibliotheken. Die nahtlose Einbindung ermöglicht das Feature Engineering in BigQuery, das Training benutzerdefinierter Modelle in Vertex AI und die Inferenz zurück in BigQuery über SQL.

Einbettungen generieren und Vektorsuche aktivieren

Multimodale Einbettungen generieren und verwenden, um eine Vektorsuche durchzuführen, die ein semantisches Verständnis und einen auf Ähnlichkeit basierenden Abruf multimodaler Daten ermöglicht. So können Sie ausgefeilte Systeme für semantische Suchen, Empfehlungen oder Segmentierungen erstellen, ohne eine separate, spezialisierte Vektordatenbank verwalten zu müssen.

Einbettungen und Vektorsuche

Mit integrierten MLOps vom Modell zur Produktion

BigQuery und Vertex AI lassen sich einbinden, um die „letzte Meile“ von MLOps zu optimieren. Zentralisieren Sie Features im Vertex AI Feature Store, um Trainings-Serving-Skew und redundante Arbeit zu vermeiden. Verwenden Sie Vertex AI AutoML, um die Modellerstellung für tabellarische Daten zu automatisieren. Alle Modelle, ob aus BigQuery ML oder Vertex AI, werden automatisch in der Vertex AI Model Registry registriert. Anschließend können Sie sie ganz einfach versionieren, auswerten und bereitstellen und so einen nahtlosen End-to-End-Lebenszyklus auf nur einer Plattform schaffen.


Google Cloud