Data science su Google Cloud

Piattaforma unificata per la gestione dei dati, l'analisi e gli strumenti di machine learning per accelerare i workflow data-to-AI.

Una guida pratica alla data science con Google Cloud

Perché Google Cloud per la data science

Piattaforma unificata di dati e AI di Google Cloud

Migliora la velocità e l'agilità della tua attività e genera valore a breve e lungo termine.

3x


Più conveniente con uno spostamento dei dati ridotto al minimo

4 volte


Addestramento, ottimizzazione e deployment più rapidi dei modelli

10 volte


Costo inferiore dell'AI, con obiettivi di ROI più raggiungibili

Strumenti integrati per la data science

Piattaforma unificata per workflow di data science end-to-end

Soluzione unificata per l'intero ciclo di vita della data science e del machine learning, basata su una base di dati multimodale che garantisce una governance unificata. Sfrutta motori di analisi potenti come BigQuery SQL e Spark, quindi crea modelli utilizzando BigQuery ML o Vertex AI. Semplifica lo sviluppo con il notebook Colab Enterprise basato sull'AI e MLOps robusti, basati su un'AI leader del settore.

Workspace centralizzato con notebook basati sull'AI

Scegli tra una suite di soluzioni di notebook per la data science aziendale. Colab Enterprise offre un ambiente gestito e sicuro integrato con Vertex AI e BigQuery. Vertex AI Workbenches fornisce istanze JupyterLab personalizzabili, mentre Cloud Workstations supporta IDE completi. Le estensioni collegano anche gli strumenti self-hosted direttamente ai servizi Google Cloud.

Data Science Agent

Data Science Agent integrato

Accelera lo sviluppo della data science con funzionalità agentiche che facilitano l'esplorazione, la trasformazione e la modellazione ML dei dati. Inizia con un obiettivo di alto livello in inglese semplice e l'agente di data science genera un piano dettagliato che copre tutti gli aspetti della modellazione di data science, dal caricamento, l'esplorazione, la pulizia, la visualizzazione, la feature engineering, la suddivisione dei dati, l'addestramento/ottimizzazione del modello e la valutazione.

Preparazione dei dati assistita dall'AI senza silo

Sfrutta una base di dati unificata, gestendo sia dati strutturati che non strutturati (immagini, documenti e altri) utilizzando SQL per l'analisi e funzioni di AI per l'elaborazione. La preparazione dei dati assistita dall'AI fornisce suggerimenti per la pulizia e la trasformazione dei dati. Data Engineering Agent automatizza le attività di data engineering, tra cui l'importazione e la creazione di pipeline, tramite istruzioni in linguaggio naturale.

Agente di data engineering
Dataproc gestito e Spark serverless

Elaborazione flessibile dei dati con più motori

Scegli qualsiasi motore di elaborazione, che si tratti del motore SQL di BigQuery o di un framework open source come Apache Spark, per lavorare direttamente su una singola copia unificata dei dati. In questo modo si evita la necessità di mantenere copie di dati separate per sistemi diversi.

Scalare la data science con BigQuery DataFrames per Python

Preferisci le librerie native di Python? BigQuery DataFrames fornisce un'API simile a pandas che traduce il codice Python in SQL ottimizzato per l'esecuzione sul motore BigQuery. Ciò offre la flessibilità di utilizzare lo strumento giusto per il lavoro, che si tratti di SQL, PySpark o un DataFrame in stile pandas, il tutto lavorando sugli stessi dati sottostanti.

Video su BigQuery DataFrames
BQML

Crea, addestra, ottimizza ed esegui modelli ML

Crea, addestra, valuta ed esegui il deployment di modelli con BigQuery ML utilizzando SQL, eliminando lo spostamento dei dati. Sfrutta i modelli pre-addestrati integrati o le funzioni SQL che chiamano Gemini per l'analisi/l'arricchimento dei dati. Per i modelli personalizzati, Vertex AI supporta PyTorch, TensorFlow e altre librerie ML. L'integrazione perfetta consente la progettazione delle caratteristiche in BigQuery, l'addestramento di modelli personalizzati in Vertex AI e l'inferenza in BigQuery tramite SQL.

Genera gli embedding e abilita la ricerca vettoriale

Genera e utilizza embedding multimodali per eseguire la ricerca vettoriale, consentendo la comprensione semantica e il recupero basato sulla somiglianza di dati multimodali. Ciò consente di creare sofisticati sistemi di ricerca semantica, consigli o segmentazione senza dover gestire un database vettoriale separato e specializzato.

embedding e ricerca vettoriale

Passa dal modello alla produzione con MLOps integrato

BigQuery e Vertex AI si integrano per semplificare l'"ultimo miglio" dell'MLOps. Centralizza le caratteristiche in Vertex AI Feature Store per evitare disallineamento addestramento/erogazione e il lavoro ridondante. Utilizzare Vertex AI AutoML per automatizzare la creazione di modelli per dati tabulari. Tutti i modelli, sia di BigQuery ML che di Vertex AI, vengono registrati automaticamente in Vertex AI Model Registry. Da lì, puoi facilmente versionarli, valutarli ed eseguirne il deployment, creando un ciclo di vita end-to-end senza interruzioni su un'unica piattaforma.


Google Cloud