Che cos'è BigQuery ML?

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

BigQuery ML ti consente di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL standard. BigQuery ML democratizza il machine learning consentendo ai professionisti SQL di creare modelli utilizzando gli strumenti e le competenze SQL esistenti. BigQuery ML aumenta la velocità di sviluppo eliminando la necessità di spostare i dati.

La funzionalità BigQuery ML è disponibile utilizzando:

  • Nella console Google Cloud
  • Strumento a riga di comando bq
  • L'API REST di BigQuery
  • Uno strumento esterno, ad esempio un blocco note Jupyter o una piattaforma di business intelligence

Il machine learning su grandi set di dati richiede un'ampia programmazione e una conoscenza approfondita dei framework ML. Questi requisiti limitano lo sviluppo di soluzioni a un gruppo molto ristretto di persone all'interno di ciascuna azienda, escludendo gli analisti di dati che comprendono i dati, ma hanno competenze limitate di machine learning e programmazione.

BigQuery ML consente agli analisti di dati di utilizzare il machine learning attraverso strumenti e competenze SQL esistenti. Gli analisti possono utilizzare BigQuery ML per creare e valutare modelli ML in BigQuery. Gli analisti non hanno bisogno di esportare piccole quantità di dati in fogli di lavoro o in altre applicazioni o di attendere risorse limitate da un team di data science.

Modelli supportati in BigQuery ML

Un modello in BigQuery ML rappresenta ciò che un sistema ML ha imparato dai dati di addestramento.

BigQuery ML supporta i seguenti tipi di modelli:

  • Regressione lineare per la previsione, ad esempio le vendite di un articolo in un determinato giorno. Alle etichette viene assegnato un valore reale (non possono essere +/- infinito o NaN).
  • Regressione logistica binaria per la classificazione, ad esempio per determinare se un cliente farà un acquisto. Le etichette possono avere solo due valori possibili.
  • Regressione logistica multiclasse per la classificazione. Questi modelli possono essere utilizzati per prevedere più valori possibili, ad esempio se un input è "valore basso", "valore medio" o "valore elevato". Le etichette possono avere fino a 50 valori unici. In BigQuery ML, l'addestramento di regressione logistica multiclasse utilizza una classificatore multinomiale con una funzione di perdita di entropia.
  • Il clustering K per la segmentazione dei dati, ad esempio l'identificazione di segmenti di clienti. K-means è una tecnica di apprendimento non supervisionato, pertanto l'addestramento del modello non richiede etichette né suddivisione dei dati per l'addestramento o la valutazione.
  • Fattorizzazione della matrice per la creazione di sistemi di suggerimenti sui prodotti. Puoi creare consigli sui prodotti utilizzando il comportamento storico dei clienti, le transazioni e le valutazioni dei prodotti, quindi utilizzare questi consigli per le esperienze cliente personalizzate.
  • Serie temporali per l'esecuzione di previsioni di serie temporali. Puoi utilizzare questa funzionalità per creare milioni di modelli di serie temporali e utilizzarli per la previsione. Il modello gestisce automaticamente anomalie, stagionalità e festività.
  • Albero potenziato per la creazione di modelli di classificazione e regressione basati su XGBoost.
  • Rete neurale profonda (DNN) per la creazione di reti neurali profonde basate su TensorFlow per modelli di classificazione e regressione.
  • Vertex AI AutoML Tables per eseguire machine learning con dati tabulari utilizzando interfacce e processi semplici.
  • Importazione di modelli TensorFlow. Questa funzionalità consente di creare modelli BigQuery ML da modelli TensorFlow addestrati in precedenza, quindi di eseguire previsioni in BigQuery ML.
  • Codificatore automatico per la creazione di modelli BigQuery ML basati su Tensorflow con il supporto di rappresentazioni sparse dei dati. I modelli possono essere utilizzati in BigQuery ML per attività come il rilevamento di anomalie non supervisionate e la riduzione della dimensione non lineare.

In BigQuery ML, puoi utilizzare un modello con i dati di più set di dati BigQuery per l'addestramento e la previsione.

Guida alla selezione del modello

Diagramma per aiutarti a scegliere un modello di ML per la tua attività Scarica la scheda di riferimento

Vantaggi di BigQuery ML

BigQuery ML offre i seguenti vantaggi rispetto ad altri approcci all'utilizzo del ML con un data warehouse basato su cloud:

  • BigQuery ML democratizza l'uso del machine learning consentendo agli analisti di dati, gli utenti principali del data warehouse, di creare ed eseguire modelli utilizzando i fogli di lavoro e gli strumenti di business intelligence esistenti. L'analisi predittiva può guidare le decisioni aziendali in tutta l'organizzazione.
  • Non è necessario programmare una soluzione di machine learning utilizzando Python o Java. Addestramento e accesso ai modelli in BigQuery mediante SQL, un linguaggio familiare agli analisti di dati.

  • BigQuery ML aumenta la velocità di sviluppo e innovazione dei modelli, eliminando la necessità di esportare i dati dal data warehouse. Invece, BigQuery ML porta il machine learning ai dati. BigQuery ML presenta i seguenti vantaggi rispetto all'esportazione e alla riformattazione dei dati:

    • Riduce la complessità perché sono necessari meno strumenti
    • Aumenta la velocità di produzione perché lo spostamento e la formattazione di grandi quantità di dati per i framework ML basati su Python non sono richiesti per l'addestramento del modello in BigQuery.

BigQuery ML e Vertex AI

BigQuery ML si integra con Vertex AI, la piattaforma end-to-end di AI/ML di Google Cloud. Quando registri i tuoi modelli BigQuery ML in Vertex AI Model Registry, puoi eseguire il deployment di questi modelli negli endpoint per la previsione online.

Aree geografiche supportate

BigQuery ML è supportato nelle stesse regioni di BigQuery. Consulta la pagina delle località per un elenco completo delle regioni supportate e delle regioni multiple.

Prezzi

I modelli BigQuery ML sono archiviati in set di dati BigQuery come tabelle e viste. Per informazioni sui prezzi di BigQuery ML, consulta i prezzi di BigQuery ML.

Per informazioni sui prezzi dello spazio di archiviazione di BigQuery, vedi Prezzi dello spazio di archiviazione. Per informazioni sui prezzi delle query in BigQuery ML, consulta Prezzi delle query.

Quote

Oltre ai limiti specifici di BigQuery ML, le query che utilizzano le funzioni e le istruzioni CREATE MODEL di BigQuery ML sono soggette alle quote e ai limiti per i job di query BigQuery.

Per ulteriori informazioni su tutte le quote e i limiti di BigQuery ML, consulta Quote e limiti.

Passaggi successivi