Il “dato”: il nuovo Re

Siamo nell’era dei dati, produciamo dati e ne consumiamo quotidianamente in quantità enormi, esiste un rapporto sul traffico internet elaborato da uno dei colossi dell’informatica mondiale, Cisco, che incrociato con le informazioni rese disponibili da operatori di rete stima che l’intero universo digitale è grosso modo dimensionabile su una produzione giornaliera di 44 zettabytes. Se la stima è corretta vuole dire che abbiamo a disposizione in bytes 40 volte il numero di stelle osservabili nell’universo. Per quanto suggestivo il numero però è calcolato per difetto. Non nel senso quantitativo ma metodologico. Prendiamo in esame alcuni produttori di dati, tipo i social network. Ogni giorno vengono pubblicati 500 milioni di tweet. Vengono inviate 294 miliardi di mail. E quattro petabytes di dati sono creati solo da Facebook. Senza contare che su WhatsApp si stimano 65 miliardi di messaggi. Due aspetti sono importanti ai fini della protezione dei dati generati sul web, uno di natura tecnologica e l’altro di carattere giuridico. Si tratta delle sfide alla privacy che sono oggi affrontate dalle organizzazioni che producono, trattano, detengono dati. La prima sfida è la re-identificazione dei dati anonimi hanno richiamato l’attenzione su uno dei concetti fondamentali della protezione dei dati: la loro ri-classificazione. Infatti, la possibilità di deanonimizzazione dei dati insieme alla grande offerta di dati personali risultante dal ‘Data Mining’ hanno non soltanto creato una nuova categoria dei Big Data, ma hanno anche cambiato l’approccio al concetto di dato anonimo o statistico, richiedendo il cambiamento della natura di alcuni degli strumenti e istituti ormai classici nella protezione dei dati.
Ci sembra un concetto nuovo, nuovissimo, invece è molto più vecchio. Daniel Rosenberg, storico della data visualization, nel suo saggio “Data before the fact” (Cambridge, MIT Press, 2013) scrive che l’origine della parola «dato» in lingua inglese viene usato per la prima volta nel 1646, in un trattato teologico dove si parla di «mucchio di dati», quindi al plurale data e non datum al singolare, dal latino, termine che praticamente in inglese non è mai stato adottato. Fino a quel momento il «dato» in inglese veniva usato come qualcosa di pre-definito, qualcosa di scontato e non discutibile perché in qualche modo calato dall’alto. Sia per la filosofia che per la matematica che la teologia il termine «dati» identificava fatti e principi che lo erano per definizione, al di là di qualsiasi dibattito.
Nella sua ricerca Rosenberg si imbatte però nel lavoro di Joseph Priestley, filosofo e educatore del Settecento, che per primo raffigura i dati in un formato che oggi chiameremmo «linea del tempo». Rosenberg si stupisce del fatto che Priestley parli di «fatti della storia» riferendosi a essi per la prima volta come «dati», cioè usando la parola data e non fact.
Oggi, quando parliamo di dati, pensiamo subito ai numeri, ai dataset, a qualcosa che qualcuno si è messo a contare lo facciamo perché dall’Illuminismo in poi sia la visualizzazione dati sia il concetto di dati sono stati associati alla moderna statistica e alla scienza. Alla fine del XVIII secolo invece il termine «dati» viene usato per riferirsi a fatti ed evidenze determinate da esperimenti scientifici, esperienze vissute o da una raccolta empirica.
I dati sono diventati un asset fondamentale delle imprese, parte del loro valore sul mercato, determinano il successo delle organizzazioni e definiscono il perimetro della reputazione quando ben trattati. Ibm nel suo paper “The Rise of the Data Economy: Driving Value through Internet of Things Data Monetization” lo dice chiaramente: i dati saranno la misura chiave per capire se un’impresa resterà rilevante attraversando la rivoluzione digitale e se saprà gestire il ciclo di vita del dato, dalla sua acquisizione e creazione al momento dell’aggregazione, del trattamento e arricchimento, fino alla presentazione.
L’innovazione data driven per le imprese è anche sotto osservazione da tempo dalle grandi organizzazioni internazionali. Secondo l’Ocse le aziende, facendo leva sui dati, possono ottenere grandi performance, sia in termini di riduzione di costi che di creazione di valore. Tra gli esempi, l’ottimizzazione della catena del valore, un uso più efficace dei fattori di produzione, incluso l’utilizzo della forza lavoro, e relazioni con il cliente “su misura”.