Un data warehouse, chiamato anche data warehouse aziendale (EDW, enterprise data warehouse), è una piattaforma di dati aziendali utilizzata per l'analisi e il reporting di dati strutturati e semistrutturati provenienti da più origini dati, tra cui transazioni point of sale, marketing automation, gestione dei rapporti con i clienti e altro ancora.
I data warehouse includono un database analitico, nonché componenti e procedure analitici critici. Supportano l'analisi ad hoc e la generazione di report personalizzati, come pipeline di dati, query e applicazioni aziendali. Possono consolidare e integrare enormi quantità di dati attuali e storici in un unico posto e sono progettati per fornire una visione a lungo termine dei dati nel tempo. Queste funzionalità di data warehouse hanno reso il data warehousing un punto fermo dell'analisi aziendale che aiuta a supportare decisioni aziendali consapevoli.
Scopri di più su BigQuery, il data warehouse aziendale serverless, multi-cloud conveniente di Google Cloud.
Un data warehouse è un sistema aziendale utilizzato per l'analisi e il reporting di dati strutturati e semi-strutturati provenienti da molteplici origini, come le transazioni point of sale, il marketing automation, la gestione dei rapporti con i clienti e altro ancora. Un data warehouse è adatto sia per analisi ad hoc che per il reporting personalizzato. Un data warehouse è in grado di archiviare i dati attuali e storici in una posizione centralizzata ed è progettato per offrire una visione a lungo termine dei dati nel tempo, diventando così una componente principale della business intelligence.
I data warehouse tradizionali sono ospitati on-premise, con dati che provengono da database relazionali, sistemi transazionali, applicazioni aziendali e altri sistemi di origine. Tuttavia, sono generalmente progettati per acquisire un sottoinsieme di dati in batch e archiviarli in base a schemi rigidi, rendendoli inadatti a query spontanee o analisi in tempo reale. Le aziende devono anche acquistare il proprio hardware e software, con un data warehouse on-premise, il che ne rende costoso la scalabilità e la manutenzione. In un warehouse tradizionale, lo spazio di archiviazione è generalmente limitato rispetto all'elaborazione di calcolo, quindi i dati vengono trasformati rapidamente e poi eliminati per mantenere libero lo spazio di archiviazione.
Le attività di analisi dei dati odierne si sono trasformate nel centro di tutte le attività aziendali principali, tra cui la generazione di entrate, il contenimento dei costi, il miglioramento delle operazioni e il miglioramento dell'esperienza dei clienti. Man mano che i dati si evolvono e si diversificano, le organizzazioni hanno bisogno di soluzioni di data warehouse più solide e di strumenti di analisi avanzati per archiviare, gestire e analizzare grandi quantità di dati nelle proprie organizzazioni.
Questi sistemi devono essere scalabili, affidabili, sufficientemente sicuri per i settori regolamentati e abbastanza flessibili da supportare un'ampia varietà di tipi di dati e casi d'uso dei big data. Devono inoltre supportare prezzi e computing flessibili, quindi paghi solo per quello che ti serve invece di indovinare la tua capacità. I requisiti vanno oltre le funzionalità della maggior parte dei data warehouse legacy. Di conseguenza, molte aziende si stanno rivolgendo a soluzioni di data warehouse basate su cloud.
Un data warehouse su cloud non elimina compromessi rispetto a un data warehouse tradizionale, ma estende le funzionalità ed è eseguito su un servizio completamente gestito nel cloud. Il data warehousing nel cloud offre scalabilità immediata per soddisfare i mutevoli requisiti aziendali e una potente elaborazione dei dati per supportare query analitiche complesse.
Con un data warehouse su cloud, puoi sfruttare la flessibilità intrinseca di un ambiente cloud con costi più prevedibili. L'investimento iniziale è in genere molto inferiore e i tempi di risposta sono più brevi con le soluzioni di data warehouse on-premise, perché il fornitore di servizi cloud gestisce ed esegue la manutenzione dell'infrastruttura fisica.
Come un data warehouse tradizionale, i data warehouse su cloud raccolgono, integrano e archiviano dati provenienti da origini interne ed esterne. I dati vengono in genere trasferiti da un sistema di origine utilizzando una pipeline di dati. I dati vengono estratti dal sistema di origine, trasformati e poi caricati nel data warehouse, un processo noto come ETL (Extract, Transform, Load). I dati possono anche essere inviati direttamente a un repository centrale e poi convertiti utilizzando i processi ELT (estrazione, caricamento, trasformazione). Da qui, gli utenti possono utilizzare diversi strumenti di business intelligence (BI) per accedere, estrarre e generare report sui dati. I data warehouse su cloud dovrebbero anche supportare i casi d'uso in modalità flusso per l'attivazione sui dati in tempo reale o quasi in tempo reale.
I data warehouse su cloud offrono archiviazione, elaborazione, integrazione, pulizia, caricamento e così via di dati strutturati e semistrutturati all'interno di un ambiente cloud pubblico. Puoi anche utilizzarli con un data lake su cloud per raccogliere e archiviare dati non strutturati. Con alcuni provider è persino possibile unificare il data warehouse e il data lake per mantenere e gestire centralmente un'unica copia dei dati aziendali.
Provider cloud diversi possono adottare approcci diversi per quanto riguarda i servizi di data warehouse su cloud. Ad esempio, alcuni data warehouse su cloud potrebbero utilizzare un'architettura basata su cluster simile a un data warehouse tradizionale. Al contrario, altri adottano una moderna architettura serverless, che riduce ulteriormente al minimo le responsabilità di gestione dei dati. Tuttavia, la maggior parte dei data warehouse su cloud offre funzionalità integrate di archiviazione dei dati e gestione della capacità e upgrade automatici.
Altre funzionalità chiave dei data warehouse su cloud includono:
Le aziende si stanno allontanando sempre più dai data warehouse tradizionali e stanno migrando al cloud, sfruttando il risparmio sui costi e la scalabilità che i servizi gestiti possono offrire.
Ecco i principali vantaggi del data warehousing nel cloud.
Creati per la scalabilità
I data warehouse su cloud sono elastici e offrono archiviazione e capacità quasi illimitate. Puoi fare lo scale up o lo scale down facilmente in base alle esigenze della tua azienda e pagare solo per ciò che utilizzi.
Iniziative di machine learning e AI
I clienti possono sbloccare e rendere operativi rapidamente modelli di machine learning e tecnologie AI nei data warehouse su cloud per il data mining, prevedere i risultati aziendali e ottimizzare altre aree, dalla gestione del ciclo di vita dei dati ai processi aziendali fino ai costi operativi.
Migliore uptime
I cloud provider sono obbligati a rispettare gli accordi sul livello di servizio (SLA) e a fornire un miglior uptime con un'infrastruttura cloud affidabile e in grado di scalare in modo efficiente. I data warehouse on-premise presentano limiti di scalabilità e risorse che potrebbero incidere sulle prestazioni.
Prevedibilità dei costi
Il cloud offre prezzi più flessibili e prevedibili. Alcuni provider applicano una tariffa in base alla velocità effettiva oppure all'ora per nodo. Altri addebitano un prezzo fisso per una determinata quantità di risorse. In ogni caso, eviterai gli enormi costi di un data warehouse on-premise eseguito 24 ore al giorno, sette giorni alla settimana, indipendentemente dal fatto che le risorse siano in uso o meno.
Risparmio operativo
Un data warehouse su cloud è completamente gestito, il che ti consente di esternalizzare i problemi di gestione a provider cloud che devono rispettare gli accordi sul livello del servizio (SLA). In questo modo è possibile risparmiare sui costi operativi e il tuo team interno può rimanere concentrato sulle iniziative di crescita.
Analisi in tempo reale
I data warehouse su cloud offrono un'elaborazione più potente che supporta i flussi di dati, consentendoti di eseguire query sui dati in tempo reale. Di conseguenza, puoi accedere ai dati e utilizzarli molto più velocemente rispetto a un data warehouse on-premise, consentendoti di ottenere insight più accurati più rapidamente e prendere decisioni aziendali più consapevoli.
Il data warehousing su cloud presenta una gamma di soluzioni che possono apportare vantaggi a un'organizzazione. Ecco alcuni dei casi d'uso più comuni del data warehouse:
Prendere decisioni in tempo reale: analizza i dati in tempo reale per affrontare le sfide in modo proattivo, identificare opportunità, aumentare l'efficienza, ridurre i costi e rispondere in modo proattivo agli eventi aziendali.
Consolidare i dati isolati: estrai rapidamente i dati da più origini strutturate nella tua organizzazione, ad esempio sistemi point of sale, siti web e mailing list, e riuniscili in un'unica posizione in modo da poter eseguire l'analisi e ottenere approfondimenti.
Attivazione dei report aziendali e dell'analisi ad hoc: conserva i dati storici su un server separato dai dati operativi in modo che gli utenti finali possano accedervi ed eseguire le proprie query e i propri report senza influire sulle prestazioni dei sistemi operativi o attendere l'aiuto dell'IT.
Implementazione del machine learning e dell'AI: raccogli dati storici e in tempo reale per sviluppare algoritmi in grado di fornire informazioni predittive, ad esempio per prevedere i picchi di traffico o suggerire prodotti pertinenti a un cliente che naviga su un sito web.
Molti tipi di aziende e settori richiedono un'analisi dei dati che non sia solo su vasta scala, ma anche continuativa e in tempo reale. Ad esempio, alcuni provider di servizi utilizzano i dati in tempo reale per regolare dinamicamente i prezzi nel corso della giornata. Le compagnie di assicurazione tengono traccia di polizze, vendite, sinistri, stipendi e altro ancora. Utilizzano inoltre il machine learning per prevedere le frodi. Le aziende produttrici di videogiochi devono monitorare e reagire al comportamento degli utenti in tempo reale per migliorare l'esperienza del giocatore. I data warehouse rendono possibili tutte queste attività.
Se la tua organizzazione possiede o svolge una delle seguenti attività, probabilmente i data warehouse fanno al caso tuo:
Quando si sceglie un data warehouse basato su cloud, è fondamentale valutare il funzionamento delle soluzioni e comprendere a fondo i casi d'uso esistenti che il data warehouse su cloud dovrà supportare.
Oltre alle funzionalità di warehousing, ci sono molti aspetti da considerare quando si sceglie tra diversi provider, comprese le differenze in termini di architettura, scalabilità, sicurezza, prezzi, prestazioni e altro ancora. Ad esempio, potresti scoprire che una soluzione semplice da implementare non è così facile da scalare oppure potresti dover riaddestrare tutti gli analisti di dati e acquistare licenze aggiuntive per eseguire l'upgrade del tuo sistema attuale.
Oltre a esaminare le differenze tra i fornitori, è anche importante considerare cosa comporterà nello specifico la migrazione a un data warehouse su cloud e come questo sarà correlato agli investimenti IT esistenti e alle esigenze aziendali specifiche.
I data warehouse aziendali svolgono un ruolo centrale nel processo decisionale di un'organizzazione. Dovrai quindi assicurarti di avere una profonda comprensione dei requisiti aziendali, dei casi d'uso attuali e di eventuali lacune con le soluzioni esistenti. Può essere utile coinvolgere i principali stakeholder nelle prime fasi del processo per comprendere le implicazioni della sostituzione di una soluzione di data warehouse legacy, i requisiti funzionali per affrontare le sfide e informazioni tecniche dettagliate su origini dati, strumenti, framework e altro ancora.
Inizia a creare su Google Cloud con 300 $ di crediti gratuiti e oltre 20 prodotti Always Free.