Cosa sono i prodotti di dati?

Un prodotto di dati è semplicemente un modo di confezionare i dati in modo che risolvano un problema aziendale specifico. Invece di offrire dati non elaborati che potrebbero essere disordinati o confusi, li trattiamo come un prodotto sullo scaffale di un negozio, completo di una descrizione di cosa sono, come usarli e una promessa che siano accurati. In questo modo, le informazioni non elaborate vengono convertite in un asset di alta qualità e rilevabile su cui l'intera organizzazione può fare affidamento.

Immagina la differenza tra acquistare ingredienti sfusi e acquistare un kit per la preparazione di un pasto. Un prodotto di dati è proprio questo kit: raggruppa i dati non elaborati con le istruzioni e il contesto necessari per risolvere un problema aziendale specifico. Trasforma i dati sparsi in qualcosa di affidabile, facile da trovare e immediatamente utile per l'organizzazione.

Concetti fondamentali

I prodotti di dati possono essere utilizzati in molte forme, tra cui:

  • API che restituiscono punteggi predittivi (come un punteggio di rischio di credito)
  • Dashboard incorporate in un'app per mostrare l'analisi degli utenti
  • Motori per suggerimenti che consigliano film o prodotti
  • Modelli di machine learning che rilevano le frodi in tempo reale
  • Agenti AI che possono essere addestrati e operare su dati che sono già stati puliti, organizzati e allineati agli obiettivi aziendali

Dati come prodotto (Data as a product) e prodotti di dati

Può essere facile confondere i termini "prodotti di dati" e "dati come prodotto", ma hanno significati diversi. Comprendere la differenza è importante per la creazione di soluzioni cloud.

  • Il dato come prodotto (DaaP, data as a product) è una mentalità o una strategia e di solito si riferisce al concetto architettonico di "Data Mesh". Significa trattare i set di dati interni con la stessa cura che si riserva a un prodotto software pubblico.
  • I prodotti di dati, d'altra parte, sono i risultati tecnici effettivi. Sono i dati pre-confezionati che alimentano il software o gli strumenti che crei utilizzando questi dati di alta qualità.

Differenze principali:

Funzionalità

Dati come prodotto

Prodotti di dati

Che cos'è?

Una strategia o una filosofia.

Un asset di dati predefinito.

Obiettivo principale

Per migliorare la qualità e l'affidabilità dei dati.

Per risolvere un problema specifico dell'utente.

Esempio

Una tabella "Customer" pulita e documentata in BigQuery con un proprietario assegnato.

Un prodotto di dati "Customer 360" che estrae dati da questa tabella per mostrare la cronologia di un utente.

Funzionalità

Dati come prodotto

Prodotti di dati

Che cos'è?

Una strategia o una filosofia.

Un asset di dati predefinito.

Obiettivo principale

Per migliorare la qualità e l'affidabilità dei dati.

Per risolvere un problema specifico dell'utente.

Esempio

Una tabella "Customer" pulita e documentata in BigQuery con un proprietario assegnato.

Un prodotto di dati "Customer 360" che estrae dati da questa tabella per mostrare la cronologia di un utente.

Casi d'uso dei prodotti di dati

I prodotti di dati fungono da funzionalità di governance, in quanto raggruppano dati e modelli in unità logiche, sicure e rilevabili. Ciò consente alle organizzazioni di stabilire una proprietà chiara e un accesso gestito tramite flussi di lavoro di approvazione.


I retailer possono raggruppare i dati sul comportamento dei clienti e i modelli di consigli sui prodotti in un unico "prodotto di dati di personalizzazione". Utilizzando Knowledge Catalog, l'organizzazione può garantire che solo gli sviluppatori autorizzati possano accedere ai set di dati sottostanti e agli endpoint del modello. Questo livello di governance fornisce il contesto tramite i metadati (aspetti) proteggendo al contempo le interazioni sensibili degli utenti.

Gli istituti finanziari possono creare un prodotto di dati "Rischio di frode" che raggruppa flussi di transazioni in tempo reale con modelli di machine learning. Questo pacchetto unificato consente un flusso di lavoro di approvazione sicuro. Quando un investigatore ha bisogno di accedere ai punteggi di rischio, li richiede tramite un portale centrale. Ciò garantisce che l'accesso sia limitato nel tempo e completamente controllato, impedendo l'esposizione non autorizzata dei dati.

Nel settore manifatturiero, un prodotto di dati "integrità della macchina" combina i dati dei sensori con modelli di rilevamento delle anomalie. Le funzionalità di governance come i controlli automatici della qualità dei dati e la profilazione assicurano che il modello consumi solo dati affidabili. In questo modo si evitano previsioni di guasto errate causate da sensori difettosi o input non elaborati "disordinati".

I team di logistica possono raggruppare gli algoritmi di routing e i set di dati sui vincoli dei veicoli come prodotto di dati "ottimizzazione della consegna". Stabilendo la proprietà a livello di dominio in un data fabric, l'azienda può tracciare la derivazione dei dati, mostrando esattamente come i dati grezzi sulla posizione sono stati trasformati in programmi finali per i conducenti.

Vantaggi dei prodotti di dati

La creazione di prodotti di dati può offrire vantaggi significativi per un'azienda. Possono contribuire a spostare l'attenzione dalla semplice raccolta di dati al loro utilizzo effettivo per generare valore.

Processo decisionale più efficiente

Le organizzazioni possono utilizzare i prodotti di dati per mettere informazioni critiche direttamente a disposizione delle persone che ne hanno bisogno. Ciò consente ai team di fare scelte strategiche più intelligenti basate su prove piuttosto che sull'intuizione.

Innovazione più rapida:

I prodotti di dati riutilizzabili riducono il tempo necessario per implementare nuovi casi d'uso. Gli sviluppatori possono integrare i prodotti di dati esistenti nelle loro applicazioni, il che li aiuta a distribuire le funzionalità e a risolvere i problemi più rapidamente senza dover gestire pipeline di dati non elaborati complesse.

Aumento delle entrate

I prodotti di dati aiutano le aziende a monetizzare direttamente i propri asset. Ad esempio, un'azienda potrebbe raggruppare i propri dati proprietari per consentirne l'utilizzo da parte di altri sviluppatori.

Vantaggio competitivo

Le organizzazioni basate sui dati sono spesso più efficaci nell'acquisizione e nella fidelizzazione dei clienti. Offrendo esperienze più intelligenti e personalizzate, le aziende possono distinguersi dalla concorrenza che non utilizza i propri dati in modo efficace.

Crea agenti in modo sicuro

Creando agenti AI basati su questi prodotti di dati "preconfezionati", ti assicuri che l'AI apprenda da informazioni verificate e di alta qualità, anziché da dati non elaborati e disordinati. In questo modo si crea un ambiente sicuro in cui l'AI fornisce risposte accurate di cui ci si può fidare, senza divulgare accidentalmente informazioni sensibili o errate.

Esempio: sviluppatore di e-commerce aziendale che utilizza Knowledge Catalog e BigQuery

Vediamo come potresti creare un prodotto di dati, come un "Retail Inventory Predictor", utilizzando strumenti come BigQuery e Knowledge Catalog.

L'obiettivo: creare uno strumento interno che indichi ai responsabili dei negozi quali articoli stanno per esaurirsi e preveda cosa devono ordinare per la settimana successiva.

Passaggio 1: importare e archiviare i dati con BigQuery

Innanzitutto, ti serve un posto in cui archiviare i dati di vendita. Puoi utilizzare BigQuery, un data warehouse serverless, per configurare una pipeline che trasmetta in modalità flusso i dati di vendita giornalieri di ogni negozio nelle tabelle BigQuery.

Passaggio 2: gestisci e governa i dati con Knowledge Catalog

Prima di creare il modello, devi assicurarti che i dati siano puliti. Utilizza Knowledge Catalog per gestire il ciclo di vita dei dati, in quanto può aiutarti a:

  • Catalogare i dati in modo che altri sviluppatori possano trovarli
  • Impostare regole di qualità dei dati (ad esempio, "Il prezzo non può essere negativo")
  • Proteggere i dati in modo che solo gli utenti autorizzati possano accedervi

Passaggio 3: crea il modello con BigQuery ML

Ora crei l'intelligenza. Invece di esportare i dati in uno strumento separato, utilizzi BigQuery ML per scrivere una semplice query SQL che addestra un modello di machine learning. Questo modello esamina le tendenze di vendita passate per prevedere la domanda futura.

  • SQL
Caricamento in corso...

Passaggio 4: esponi il prodotto di dati

Infine, puoi creare un'API semplice o una dashboard utilizzando Looker. Quando un responsabile del negozio esegue l'accesso, invece di vedere query SQL, vede un'interfaccia pulita che dice: "Ordina altri 50 camicie rosse entro martedì". Complimenti! Hai trasformato i dati non elaborati in un prodotto di dati utile.

Risolvi le tue sfide aziendali con Google Cloud

I nuovi clienti ricevono 300 $ di crediti senza costi da spendere su Google Cloud.

Risorse aggiuntive

Fai un passo avanti

Inizia a creare su Google Cloud con 300 $ di crediti senza costi e oltre 20 prodotti sempre senza costi.

Google Cloud