Analisi dei dati ed Azure Synapse: come non perdersi per strada

Cos’è l’analisi dei dati? Come possiamo integrarla nel nostro business, e qual è la sua utilità? In questo articolo cercheremo di rispondere a queste domande, introducendovi al mondo dei Data Analytics e dello strumento che permette di integrare e sfruttare al massimo i dati, Azure Synapse Analytics.

Data Analytics: la nuova frontiera del business

Per poter interpretare qualsiasi fenomeno – sia esso l’eco del Big Bang ai confini dell’universo o il saldo mensile del conto corrente bancario – è necessario raccogliere i dati prodotti e poi analizzarli, ne siamo tutti consapevoli.

Ma sapete quanti dati ci perdiamo per strada? Microsoft stima che nel 2020 siano stati collezionati più di 44 Zettabyte di dati (circa 2 mila miliardi di volte il contenuto di Wikipedia!) e che di questi solo un terzo sia stato effettivamente analizzato.

Spesso questo succede perché le aziende non sanno come utilizzare e tradurre i dati in valore per il business, oppure perché non conoscono gli strumenti giusti per integrarli e interpretarli. Per questo è diventato sempre più importante il ruolo dei “Team Dati” composti da diverse figure professionali che grazie al loro know-how sanno movimentare, immagazzinare e analizzare i flussi dati nel modo più efficiente ed efficace possibile.

Dopo la raccolta, i dati possono essere analizzati in modi differenti – per indicarli si usano termini inglesi come Descriptive, Diagnostic, Predictive Analytics – e ogni tipo di analisi risponde a domande diverse.

Di seguito cerchiamo di fare un po’ di chiarezza con un esempio concreto. Supponiamo di essere un’azienda che produce automobili: come possiamo utilizzare i nostri dati? A quali domande possiamo rispondere grazie alla loro analisi?

Fotografare e comprendere il passato

Per prima cosa, i nostri dati sono sicuramente utili per fare una fotografia e capire il passato.

Attraverso la Descriptive Analysis o Explorative Data Analysis (EDA) possiamo analizzare i dati “grezzi” e studiare l’andamento delle vendite dell’azienda negli anni passati, In questo modo riusciremo a individuare i periodi o le aree geografiche in cui le vendite sono state più intense.

Ma per capire perché, per esempio, un particolare modello di macchina nel 2020 sia stato acquistato soprattutto in Italia, dovremo utilizzare la Diagnostic Analysis. Questa analisi potrebbe evidenziare che l’aumento delle vendite è dipesa dall’inizio di una campagna pubblicitaria online.

Esistono tanti prodotti sul mercato, più o meno avanzati, utili per fare Business Intelligence. Microsoft, secondo gli studi di Gartner, è da anni leader nel settore BI con il software Power BI, che unendo dati provenienti da fonti diverse consente di creare dashboard e report interattivi accattivanti e di facile lettura, che permettono una rapida comprensione dell’andamento del business.

Fare previsioni per il futuro

Ora che abbiamo queste informazioni sul passato ci domandiamo: quanto una campagna pubblicitaria può influire sulle vendite? È stato un caso fortuito o c’è un rapporto di causa – effetto che vale la pena approfondire?

Per formulare una risposta dobbiamo affidarci alla Predictive Analysis: assumendo che il comportamento di un sistema sia sempre determinato dalla stessa serie di fattori si possono utilizzare tecniche di Machine Learning per studiare il passato e predire cosa è più probabile che accada in futuro.

Possiamo sfruttare il Machine Learning per rispondere a domande semplici (Cosa succederà? Quante auto venderò il prossimo anno?) o a domande complesse (Come devo modificare gli investimenti in campagne pubblicitarie per vendere un milione di auto nel 2021?). I dati a disposizione dovranno, ovviamente, essere analizzati in modo approfondito (si parla infatti di Advanced Analytics) e i risultati elaborati quasi in tempo reale. Servono perciò performance e velocità!

Azure Machine Learning è una soluzione ad hoc offerta da Microsoft per gestire un progetto di Predictive Analysis, dall’acquisizione dei dati allo sviluppo di un modello predittivo e alla sua integrazione nel business (guarda questo webinar per approfondire l’argomento).

Azure Synapse Analytics per un’analisi dei dati a 360 gradi

Power BI e Azure Machine Learning operano uno di fianco all’altro e sono sufficienti a fornire un’analisi dati a più livelli, ma quando si parla di Big Data – quindi, ad esempio, enormi quantità di dati prodotti da una casa automobilistica – oltre ad uno scale up della potenza computazionale delle tecnologie, è necessario anche un maggior grado di integrazione fra di esse.

Proprio per questo motivo, Microsoft ha creato Azure Synapse Analytics: una piattaforma cloud all in one dedicata ai progetti di Big Data che, oltre a gestire la raccolta dati, integra funzionalità per la Descriptive e la Diagnostic Analytics con quelle più avanzate di Predictive Analytics.

Inoltre, se hai già dimestichezza con tecnologie quali TSQL (per la gestione del data warehouse) e Spark (per l’elaborazione dei dati) non avrai bisogno di imparare nuove procedure per la gestione dei dati o nuovi linguaggi di programmazione, ma potrai subito iniziare ad utilizzare Synapse Analytics.

La sinergia con l’ecosistema cloud di Azure è poi assicurata grazie ai moduli “nativi” che permettono di gestire, in un unico strumento, il dato a 360 gradi:

  • i dati possono essere raccolti in storage SQL e NOSQL;
  • il trasferimento di dati fra tipi differenti di storage può avvenire attraverso il modulo Azure Data Factory;
  • la fase di Descriptive e Diagnostic Analysis è gestita dal modulo Power BI, che come la sua controparte “stand alone” riesce ad elaborare dati presenti su differenti tipi di storage
  • la fase di Advanced Analysis e di integrazione dei modelli predittivi nel business è gestita dal modulo Azure Machine Learning

Al vantaggio di avere un unico hub che connette tutti gli strumenti, si aggiunge quello di avere un sistema di security “cross-platform” che consente a ogni membro del team di accedere ai singoli sistemi grazie a un solo set di permessi, definito direttamente in Synapse.

Da dove iniziare?

I dati e il loro studio sono diventati la nuova frontiera del business: l’analisi è fondamentale per comprendere i fenomeni aziendali e prendere decisioni strategiche, sia che si tratti dei ricavi di una piccola azienda, sia che si tratti del funzionamento dei macchinari di un grande impianto industriale.

In questo articolo introduttivo abbiamo visto che esistono diverse tipologie di analisi dei dati per specifici scopi. Fortunatamente, però, è possibile integrarle tutte nella piattaforma Microsoft Azure Synapse Analytics.

Se vuoi approfondire queste tematiche o se stai sviluppando un progetto Big Data e non sai da dove iniziare, contattaci e richiedi una consulenza ai nostri esperti.

Leave a comment