Che cos'è BigQuery ML?

BigQuery ML ti consente di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL standard. BigQuery ML democratizza il machine learning consentendo ai professionisti SQL di creare modelli utilizzando strumenti e competenze SQL esistenti. BigQuery ML aumenta la velocità di sviluppo eliminando la necessità di spostare i dati.

La funzionalità di BigQuery ML è disponibile utilizzando:

  • Google Cloud Console
  • Lo strumento a riga di comando bq
  • L'API REST BigQuery
  • Uno strumento esterno come un blocco note Jupyter o una piattaforma di business intelligence

Il machine learning su grandi set di dati richiede una programmazione e una conoscenza approfondite dei framework ML. Questi requisiti limitano lo sviluppo di soluzioni a un gruppo molto ristretto di persone all'interno di ciascuna azienda ed escludono gli analisti di dati che comprendono i dati, ma hanno competenze limitate in materia di machine learning e programmazione.

BigQuery ML consente agli analisti di dati di utilizzare il machine learning attraverso strumenti e competenze SQL esistenti. Gli analisti possono utilizzare BigQuery ML per creare e valutare modelli ML in BigQuery. Gli analisti non hanno bisogno di esportare piccole quantità di dati in fogli di lavoro o altre applicazioni o di attendere risorse limitate da un team di data scientist.

Modelli supportati in BigQuery ML

Un modello in BigQuery ML rappresenta ciò che un sistema di ML ha appreso dai dati di addestramento.

BigQuery ML supporta i seguenti tipi di modelli:

  • Regressione lineare per le previsioni, ad esempio le vendite di un elemento in un determinato giorno. Le etichette hanno un valore reale (non possono essere +/- infinito o NaN).
  • Regressione logistica binaria per la classificazione, ad esempio per determinare se un cliente farà un acquisto. Le etichette possono avere solo due valori possibili.
  • Regressione logistica multiclasse per la classificazione. Questi modelli possono essere utilizzati per prevedere più possibili valori, ad esempio se un input è " di basso valore", "medio; valore medio" o "& alto valore". Le etichette possono avere fino a 50 valori univoci. In BigQuery ML, l'addestramento per la regressione logistica multiclasse utilizza un classificatore multinomiale con una funzione di perdita interentropia.
  • Clustering K-media per la segmentazione dei dati, ad esempio identificando i segmenti di clienti. K-means indica una tecnica di apprendimento non supervisionato, pertanto l'addestramento del modello non richiede etichette né la suddivisione dei dati per l'addestramento o la valutazione.
  • Fattorizzazione matrice per la creazione di sistemi di suggerimenti di prodotti. Puoi creare suggerimenti sui prodotti utilizzando il comportamento storico dei clienti, le transazioni e le valutazioni dei prodotti e quindi utilizzare tali consigli per esperienze cliente personalizzate.
  • Serie temporali per l'esecuzione di previsioni delle serie temporali. Puoi utilizzare questa funzionalità per creare milioni di modelli di serie temporali e utilizzarli per la previsione. Il modello gestisce automaticamente anomalie, stagionalità e festività.
  • Albero potenziato per creare modelli di classificazione e regressione basati su XGBoost.
  • Deep Neural Network (DNN) per la creazione di reti Deep Neural basate su TensorFlow per i modelli di classificazione e regressione.
  • Tabelle AutoML per creare modelli all'avanguardia senza dover ricorrere a ingegneristica o selezione di modelli. AutoML Tables cerca una serie di architetture di modelli per decidere il modello migliore.
  • Importazione dei modelli TensorFlow. Questa funzionalità consente di creare modelli BigQuery ML da modelli TensorFlow precedentemente addestrati, quindi eseguire una previsione in BigQuery ML.
  • Autoencoder per la creazione di modelli BigQuery ML basati su Tensorflow con il supporto di rappresentazioni sparse dei dati. I modelli possono essere utilizzati in BigQuery ML per attività quali il rilevamento non supervisionato delle anomalie e la riduzione della linearità non lineare.

In BigQuery ML puoi utilizzare un modello con dati di più set di dati BigQuery per l'addestramento e le previsioni.

Guida alla selezione del modello

Diagramma per aiutarti a scegliere un modello di ML per la tua attività Scarica la scheda di riferimento

Vantaggi di BigQuery ML

BigQuery ML offre i seguenti vantaggi rispetto ad altri approcci per l'utilizzo del machine learning con un data warehouse basato su cloud:

  • BigQuery ML democratizza l'uso del machine learning consentendo agli analisti di dati, gli utenti principali di data warehouse, di creare ed eseguire modelli utilizzando strumenti e fogli di lavoro di business intelligence esistenti. L'analisi predittiva può guidare i processi decisionali aziendali in tutta l'organizzazione.
  • Non è necessario programmare una soluzione di machine learning utilizzando Python o Java. L'addestramento e l'accesso ai modelli vengono eseguiti in BigQuery utilizzando SQL, un noto sistema di analisi dei dati.
  • BigQuery ML aumenta la velocità di sviluppo e innovazione dei modelli rimuovendo la necessità di esportare dati dal data warehouse. BigQuery ML porta il machine learning ai dati. La necessità di esportare e riformattare i dati presenta i seguenti svantaggi:

    • Aumenta la complessità perché sono necessari più strumenti.
    • Riduce la velocità, perché lo spostamento e la formattazione di grandi quantità di dati per i framework ML basati su Python richiedono più tempo dell'addestramento dei modelli in BigQuery.
    • Richiede più passaggi per l'esportazione dei dati dal magazzino, limitando la possibilità di eseguire esperimenti sui dati.
    • Possono essere evitati da restrizioni legali, ad esempio le linee guida HIPAA.

Aree geografiche supportate

BigQuery ML è supportato nelle stesse aree geografiche di BigQuery. Consulta la pagina delle località per un elenco completo delle aree geografiche supportate e di più aree geografiche.

Prezzi

I modelli BigQuery ML sono archiviati in set di dati BigQuery come tabelle e viste. Per informazioni sui prezzi di BigQuery ML, consulta i prezzi di BigQuery ML.

Per informazioni sui prezzi dello spazio di archiviazione di BigQuery, vedi Prezzi dello spazio di archiviazione. Per informazioni sui prezzi delle query in BigQuery ML, consulta Prezzi delle query.

Quote

Oltre ai limiti specifici di BigQuery ML, le query che utilizzano le funzioni di BigQuery ML e le istruzioni CREATE MODEL sono soggette alle quote e ai limiti dei job di query BigQuery.

Per ulteriori informazioni su tutte le quote e i limiti di BigQuery ML, consulta Quote e limiti.

Passaggi successivi