Data Science: dal valore dei dati al Data Scientist

Abbiamo parlato recentemente di Machine Learning. Data Science è un tema evidentemente affine: inizia tutto dai dati.

Big Data: un Grande patrimonio

Per Big Data si intende:

…una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici specifici per l’estrazione di valore o conoscenza.     (Wikipedia)

Dalla definizione è possibile delineare due macro-temi:

  • la quantità di dati prodotti
  • la capacità di analisi di questi ultimi

La quantità di dati prodotti

4,7 Zettabyte è la quantità di dati che Cisco VNI (Visual Networking Index) ha stimato verranno prodotti nel 2022 (per intenderci, uno Zettabyte equivale a 10^21 byte), questo significa che in un solo anno verrà prodotto lo stesso quantitativo di informazioni digitali prodotti dalla nascita di Internet (1984) al 2016.
Ad oggi, abbiamo superato il primo Zettabyte, la crescita sarà evidentemente repentina nei prossimi 3 anni.

La capacità di analisi

Contestualmente alla produzione, la definizione di Big Data parla di tecnologie in grado di trarre valore da queste informazioni. La capacità di elaborazione oggi ha raggiunto performance impensabili anche solo 20 anni fa. Ma la strada è stata lunga.

L’analisi dei dati ha origini antichissime

Spesso si guarda all’analisi del dato come a una materia recente, ma non è così.

Le prime forme scritte giunte sino a noi di “data collection” risalgono al 3.200 a.C.: in Mesopotamia venivano registrati i dati transazionali.
Ai faraoni si devono invece le trascrizioni delle prime informazioni demografiche. Siamo circa nel 3.000 a.C.

Ad interpretare e sfruttare il potenziale delle informazioni raccolte ci pensò Talete di Mileto (624 a.C. circa – 546 a.C. circa). Dopo avere studiato la produzione di olive, intuì le cause di una migliore o peggiore “annata”. Così, in anticipo sulla raccolta successiva, affittò tutti i frantoi della regione. Giunto il momento, tutti gli olivicoltori dovettero rivolgersi ai suoi strumenti. Il guadagno di Talete fu enorme.

Il percorso di valorizzazione si è arricchito e strutturato negli anni, arrivando a guidare le economie globali.

Data driven economy: al volante il dato

Oggi a guidare le strategie aziendali ci sono i dati. Analizzare queste informazioni è diventato il nuovo vantaggio competitivo.

Data is the new oil. Questo è un mantra che ci accompagna ormai da tempo. Certo, non tutte le aziende hanno capacità di estrazione dei “big five”, ma è sempre più nei piani delle imprese strutturare un processo di analisi, interno o esterno, dei propri database.

Quali sono le prospettive di adozione di strumenti di Business Intelligence? Ce lo hanno raccontato 40 decision maker nel nostro nuovo studio

I numeri a favore di questa apertura da parte delle aziende parlano chiaro:

  • Il valore della Data Economy europea si attesta a circa 300 miliardi di euro. Le previsioni per il 2020 la portano a 739 miliardi. (Report “Open Data maturity in Europe 2017)
  • 1,393 miliardi di euro è il valore complessivo del mercato italiano dei Big Data Analytics (osservatori.net)

Il trend è estremamente positivo. Ma come possono le aziende intercettare queste informazioni e produrne valore? Creando team dedicati: team di Data Science.

Data Science: di cosa si tratta

Per Data Science si intende quell’insieme di tecniche capaci di trarre valore dai dati. Si tratta di algoritmi, sistemi e processi utili nel lavorare con dati strutturati.

Peter Naur ne diede una prima definizione nel 1974, nel suo libro “Concise Survey of Computer Methods”. Evoluzione di datalogy e computer science: un concetto che rientrava nel mondo della statistica applicata, grazie all’utilizzo di software. Negli anni è stata poi pian piano separata e declinata come materia a sé.

L’importanza di saper leggere i dati

Per le aziende, lo studio dei dati assume un ruolo trasversale nella strategia: coinvolge diversi attori e gli output vanno ad impattare le scelte future.

Quando si hanno a disposizione le informazioni, le scelte sono molto più precise.

Sviluppo di nuove opportunità, conoscenza dei clienti, riduzione dei costi, potenziale inespresso: sono tutte possibili applicazioni derivate dall’analisi del patrimonio informativo.

Le aziende dove possono trovare questi dati?

Questi dati sono prodotti costantemente dagli utenti e per la maggior parte sono storicizzati nelle piattaforme che utilizziamo ogni giorno. Dalle proprietà web (sito web, eCommerce o pagine sui social network), alle piattaforme di direct marketing (MagNews), passando per il CRM. Integrare queste soluzioni rende la visione dei propri utenti univoca e specifica.

Scopri il nostro Analytics Connector. Semplice da integrare e gratuito.

La comprensione di questi report analitici migliora:

  • Conoscenza dei propri utenti: è possibile generare offerte più personalizzate, conoscendo profondamente le necessità della propria customer base, in modo da aumentare conseguentemente il fatturato.
  • Performance aziendali: sapere quali asset generano maggior ROI permette di generare opportunità di business, andando a strutturare meglio l’offerta.
  • Previsioni di fatturato: conoscendo l’andamento passato e le variabili presenti è possibile dare quasi con certezza un riscontro sulle attività in atto, senza rischiare “sorprese”.

Lo studio di queste informazioni permette quindi di conoscere esattamente l’attività attuale e, soprattutto, di avere il controllo su quelle future. Dotarsi di software per il reporting e la data visualization è fondamentale per strutturare gli output, ma l’analisi mantiene un carattere “umano” grazie ai professionisti legati al Data Science.

Data Scientist e Data Analyst: gli specialisti del dato

“Data Scientist: the sexiest job of the 21st century” (HBR, 2012)

Estrarre informazioni, creare modelli, descrivere le osservazioni e riportare alle figure di business: queste sono le attività che ogni giorno toccano i “professionisti del dato”.
Le definizioni del ruolo di Data scientist e Data analyst si differenziano per la profondità e tipologia di analisi che producono. Nel primo caso, ci si riferisce a figure generalmente tech, con uno spiccato background di programmazione; nel secondo caso, invece, si parla di un ruolo più dedito allo studio delle informazioni quindi con diverse sfumature sul lato matematico-statistico.

Data Science e Diennea

Come detto lavorare sul proprio patrimonio informativo non è più solo una prerogativa delle grandi aziende. L’analisi del dato è da sempre nel nostro diennea. Il nostro obiettivo è affiancare i clienti nella strutturazione di questi processi di valorizzazione, costruendo strategie data-driven in grado di monetizzare i propri dati: come abbiamo fatto per Parmalat. Un progetto di dashboard e data visualization incentrato su un programma di Loyalty.

Per averne una copia e per conoscere come sfruttare al 100% i dati del tuo business,

Niccolò Milazzo

Content Marketing Specialist.