header

Big Data, Big Opportunity

Big Data è un termine di cui sentiamo sempre più parlare e che ormai sempre più spesso rimbalza in rete, ma cosa sono esattamente questi Big Data? Alexander James, ricercatore presso Google, ha affermato che "i dati siamo noi" perché noi utilizziamo un numero sempre più diffuso di dispositivi elettronici, i quali generano una massa di informazioni, spesso indirette, che ci riguardano in prima persona e che possono alimentare basi di dati di grandi dimensioni. Il termine Big Data si riferisce in particolare al modo con cui vengono gestiti volumi di informazioni in costante aumento e per i quali non è possibile utilizzare applicazioni analitiche e sistemi data warehouse tradizionali.

I Big Data, tuttavia, non sono caratterizzati solo dal loro volume, che riesce ad arrivare nell'ordine degli zetabytes, ossia un miliardo di terabytes, ma anche da altri due elementi: velocità e varietà. Per velocità si intende la rapidità con cui questi dati diventano obsoleti, in quanto modificati o aggiornati e la necessità conseguente di comprimerne i tempi di gestione e di analisi. E' strategico presidiare quindi tutto il ciclo di vita di questi dati e si devono utilizzare software specifici per archiviare e gestire con velocità l'analisi delle informazioni evitando l'obsolescenza del dato. La varietà dei dati è un fattore nuovo: oltre alle informazioni tradizionali esistono oggi una tipologia di dati definibili "non strutturati", generati dalla rete. Sono nate quindi nuove figure professionali specializzate nelle analisi delle informazioni non strutturate, come il data scientist, dal profilo tecnico ma anche artistico, capace di interpretare i dati, sviluppare idee innovative e individuare nuovi mercati; si parla in questo caso di Big Data Analytics. Le principali fonti per la Big Data Analytics sono i dati strutturati in tabelle (relazionali), i dati semistrutturati (XML e simili), i dati di eventi e macchinari (messaggi, batch o real time, sensori, RFID e periferiche), i dati non strutturati (linguaggio umano, audio, video), i dati non strutturati da social media (social network, blog, tweet), i dati dalla navigazione web (clickstream), i dati GIS (geospatial GPS), i dati scientifici (astronomici, genetica, media).

Un tema delicato legato alla gestione dei Big Data è la privacy. Il tema della Cyber Security ha infatti portato alla creazione di strutture dedicate a garantire la corretta gestione dei dati e della privacy e alla promulgazione di leggi e decreti relativi in vari stati del mondo e anche l'Italia si sta muovendo in questo senso.

Il rinnovato interesse per i Big Data deriva dal fatto che la cattura e l'analisi di questi dati può portare vantaggi enormi in termini di processi decisionali. "Aziende pubbliche e private di tutto il mondo stanno prendendo consapevolezza di che cosa sono i big data e come possono innovare e trasformare il loro business. Ora le domande che si pongono riguardano le strategie e le competenze necessarie, il modo di assicurarsi un ritorno sull'investimento concreto e quantificabile" (Doug Laney, research vice president di Gartner).

Molte aziende si trovano ancora nella parte iniziale dell'adozione dei Big Data e non sono ancora stati disegnati approcci adeguati o non è chiaro il loro impatto sull'infrastruttura o sul settore di riferimento.

E' necessario semplificare i processi per rendere immediata la relazione diretta con i clienti che si rivelerà tanto più redditizia quanto più sarà razionale l'interconnessione dei dati.

Dopo aver definito le strategie per la gestione e l'ottimizzazione dei Big Data, la nuova frontiera per le aziende sarà la gestione dei dati senza l'intervento diretto dell'uomo (Machine-to-Machine), permettendo vantaggi strategici rivelanti e notevoli miglioramenti di business.

Source: RGI