Che cos'è BigQuery ML?

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

BigQuery ML ti consente di creare ed eseguire modelli di machine learning in BigQuery utilizzando query SQL standard. BigQuery ML democratizza il machine learning consentendo ai professionisti SQL di creare modelli utilizzando gli strumenti e le competenze SQL esistenti. BigQuery ML aumenta la velocità di sviluppo eliminando la necessità di spostare i dati.

La funzionalità BigQuery ML è disponibile utilizzando:

  • Nella console Google Cloud
  • Lo strumento a riga di comando bq
  • L'API REST BigQuery
  • Uno strumento esterno come un blocco note Jupyter o una piattaforma di business intelligence

Il machine learning su grandi set di dati richiede una programmazione e una conoscenza approfondite dei framework ML. Questi requisiti limitano lo sviluppo di soluzioni a un gruppo molto ristretto di persone all'interno di ciascuna azienda ed escludono gli analisti di dati che comprendono i dati, ma hanno competenze di machine learning e competenze di programmazione limitate.

BigQuery ML consente agli analisti di dati di utilizzare il machine learning attraverso competenze e strumenti SQL esistenti. Gli analisti possono utilizzare BigQuery ML per creare e valutare modelli ML in BigQuery. Gli analisti non hanno bisogno di esportare piccole quantità di dati in fogli di lavoro o altre applicazioni o di attendere risorse limitate da un team di data science.

Modelli supportati in BigQuery ML

Un modello in BigQuery ML rappresenta ciò che un sistema ML ha appreso dai dati di addestramento.

BigQuery ML supporta i seguenti tipi di modelli:

  • Regressione lineare per la previsione, ad esempio le vendite di un articolo in un dato giorno. Le etichette sono con un valore reale (non possono essere +/- infinito o NaN).
  • Regressione logistica binaria per la classificazione, ad esempio per determinare se un cliente effettuerà un acquisto. Le etichette possono avere solo due valori possibili.
  • Regressione logistica multiclasse per la classificazione. Questi modelli possono essere utilizzati per prevedere più possibili valori, ad esempio se un input è "basso valore", "medio valore" o "alto valore." Le etichette possono avere fino a 50 valori unici. In BigQuery ML, l'addestramento per la regressione logistica multiclasse utilizza un classificatore multinomiale con una funzione di perdita interentropia.
  • K-means clustering per la segmentazione dei dati, ad esempio l'identificazione dei segmenti di clienti. K-means è una tecnica di apprendimento non supervisionato, pertanto l'addestramento del modello non richiede etichette né la suddivisione dei dati per l'addestramento o la valutazione.
  • Fattorizzazione a matrice per la creazione di sistemi per suggerimenti di prodotti. Puoi creare consigli sui prodotti utilizzando il comportamento storico dei clienti, le transazioni e le valutazioni dei prodotti e poi utilizzare tali consigli per esperienze cliente personalizzate.
  • Serie temporali per l'esecuzione di previsioni per serie temporali. Puoi utilizzare questa funzionalità per creare milioni di modelli di serie temporali e utilizzarli per la previsione. Il modello gestisce automaticamente anomalie, stagionalità e festività.
  • Albero potenziato per la creazione di modelli di classificazione e regressione basati su XGBoost.
  • Deep Neural Network (DNN) per la creazione di reti Deep Neural basate su TensorFlow per i modelli di classificazione e regressione.
  • Tabelle AutoML per creare i migliori modelli senza dover utilizzare la progettazione delle funzionalità o la selezione dei modelli. Le tabelle AutoML eseguono una ricerca in vari modelli di architetture per stabilire il modello migliore.
  • Importazione dei modelli TensorFlow. Questa funzionalità consente di creare modelli BigQuery ML da modelli TensorFlow addestrati in precedenza, quindi di eseguire previsioni in BigQuery ML.
  • Codificatore automatico per la creazione di modelli BigQuery ML basati su Tensorflow con il supporto di rappresentazioni di dati sparse. I modelli possono essere utilizzati in BigQuery ML per attività quali il rilevamento di anomalie non supervisionate e la riduzione della dimensione non lineare.

In BigQuery ML, puoi utilizzare un modello con dati di più set di dati BigQuery per l'addestramento e la previsione.

Guida alla selezione del modello

Diagramma per aiutarti a scegliere un modello ML per la tua attività Scarica la scheda di riferimento

Vantaggi di BigQuery ML

BigQuery ML offre i seguenti vantaggi rispetto ad altri approcci per l'utilizzo del ML con un data warehouse basato su cloud:

  • BigQuery ML democratizza l'uso del machine learning consentendo agli analisti di dati, gli utenti principali del data warehouse, di creare ed eseguire modelli utilizzando gli strumenti e i fogli di lavoro dell'intelligence aziendale esistente. L'analisi predittiva può guidare il processo decisionale dell'azienda in tutta l'organizzazione.
  • Non è necessario programmare una soluzione ML utilizzando Python o Java. I modelli vengono addestrati e accessibili in BigQuery utilizzando SQL, un linguaggio noto per gli analisti di dati.
  • BigQuery ML aumenta la velocità di sviluppo e innovazione del modello eliminando la necessità di esportare i dati dal data warehouse. BigQuery ML aggiunge invece il machine learning ai dati. La necessità di esportare e riformattare i dati presenta i seguenti svantaggi:

    • Aumenta la complessità poiché sono necessari più strumenti.
    • Riduce la velocità perché lo spostamento e la formattazione di grandi quantità di dati per i framework ML basati su Python richiedono più tempo rispetto all'addestramento dei modelli in BigQuery.
    • Richiede più passaggi per esportare i dati dal warehouse, limitando la possibilità di eseguire esperimenti sui dati.
    • Possono essere evitati da restrizioni legali, ad esempio le linee guida HIPAA.

Aree geografiche supportate

BigQuery ML è supportato nelle stesse aree geografiche di BigQuery. Consulta la pagina delle località per un elenco completo delle aree geografiche supportate e di più aree geografiche.

Prezzi

I modelli BigQuery ML sono archiviati in set di dati BigQuery come tabelle e viste. Per informazioni sui prezzi di BigQuery ML, consulta la pagina relativa ai prezzi di BigQuery ML.

Per informazioni sui prezzi dell'archiviazione BigQuery, consulta Prezzi dell'archiviazione. Per informazioni sui prezzi delle query BigQuery ML, consulta la pagina Prezzi delle query.

Quote

Oltre ai limiti specifici di BigQuery ML, le query che utilizzano le funzioni di BigQuery ML e le istruzioni CREATE MODEL sono soggette alle quote e ai limiti dei job di query di BigQuery.

Per ulteriori informazioni su tutte le quote e i limiti di BigQuery ML, consulta Quote e limiti.

Passaggi successivi