La rivoluzione dell’informazione: big data e la rivincita degli statistici

Posted by on 25 Gennaio 2016 in Blog | 3 comments

La rivoluzione dell’informazione: big data e la rivincita degli statistici

Le prime idee sulla società dell’informazione sono nate nei lontani anni ’50 e si sono lentamente diffuse grazie ad una serie di studi pionieristici che mettevano in risalto il ruolo crescente delle tecnologie della comunicazione. L’espressione fa riferimento ad una società post-industriale caratterizzata dal prevalere di un paradigma centrato sull’informazione su quello orientato alla semplice produzione di beni materiali.

[shareaholic app=”share_buttons” id=”5709362″]

Oggi il termine è entrato nell’uso comune, ha perso la capacità evocativa degli albori, come altre nozioni un tempo di rottura è diventato banale. Oggi siamo tutti convinti di vivere nella società dell’informazione, che ci appare esemplarmente rappresentata dagli smartphone e dai social media. Pochi tuttavia riescono a coglierne le caratteristiche profonde, pochissimi sono in grado di capire fino a che punto potrà spingersi il processo di informatizzazione e quali conseguenze potrà comportare per la società e la cultura del futuro. Tale limitazione deriva probabilmente da un idea assai riduttiva di informazione: ai più essa pare indissolubilmente legata ai media che la veicolano e composta  esclusivamente da messaggi in forma audio-video-testuale destinati direttamente o indirettamente a fruitori umani. Parlando di informazione insomma, quasi tutti pensano ai contenuti che vengono trasmessi dai vecchi e dai nuovi media, pochi riflettono sugli scopi che gli attori sociali perseguono nel produrli e nel diffonderli, e ancor meno riflettono a fondo ai significati che essi veicolano e generano nell’interazione con i fruitori. Certo dobbiamo ammettere che viviamo immersi in un mare di informazioni e che la soglia da superare per catturare l’attenzione delle persone diventa sempre più alta proprio perché ognuno elabora meccanismi di selezione e di difesa indispensabili per dare senso al proprio ambiente di vita. Vivere in questo ambiente ci mette di fronte all’esperienza diretta del rumore di fondo e all’ambiguità caratteristica della società dell’informazione; nostro malgrado ci rende consapevoli  dei limiti che abbiamo, in quanto sistemi biologici di elaborazione di informazione, nell’affrontare questa complessità caratteristica dei nuovi ambienti di vita.
In quest’ottica possiamo pensare il mondo dell’informazione come una biblioteca infinita, un archivio che si autoalimenta per le azioni stesse dei suoi utilizzatori, un deposito culturale che contiene in forma digitale infinite informazioni che nessuno potrà mai attingere e dominare completamente. Contrariamente all’inquietante biblioteca fisica di Borges la digitalizzazione consente a tutti e ad ognuno di essere sia produttori che consumatori in un processo che ne fa aumentare esponenzialmente l’ampiezza. In linea di principio la mega biblioteca digitale che si alimenta è un prodotto collettivo su scala planetaria, un potenziale bene comune di cui allo stato attuale si ignorano ancora i limiti e i reali utilizzi. E’, già ora e ancor di più nel   prossimo futuro, un bene utilizzabile allo stesso modo del linguaggio che ognuno di noi impara – gratuitamente – dal momento che viene al mondo.

Questa prospettiva rappresenta tuttavia solo una piccola parte del problema e, a ben vedere, neppure la più importante. Accanto e dietro ai flussi di informazione digitale direttamente destinati agli umani esistono in potenza se non in atto giganteschi giacimenti di informazioni incorporate nei manufatti, nelle tecnologie, nelle organizzazioni, nelle istituzioni, nei documenti cartacei, nei reperti storici ed archeologici, nelle istituzioni deputate alla scienza e alla conoscenza, nelle grandi burocrazie. Essi assumono propriamente la forma di conoscenze che, opportunamente codificate, la tecnologia digitale rende replicabili all’infinito a costo zero. Soprattutto crescono esponenzialmente le informazioni che noi stessi produciamo direttamente, spesso senza averne precisa coscienza: ogni interazione che abbiamo con qualsiasi dispositivo digitale, ogni clic sulla tastiera del pc, ogni uso della carta di credito, ogni fotografia o videoclip, è informazione che viene restituita al sistema tecnologico: in internet nulla va perduto e si sta creando dunque un enorme deposito dinamico di informazioni che continua a crescere e a svilupparsi in seguito alle azioni quotidiane svolte da miliardi di persone, milioni di aziende e Amministrazioni, decine di miliardi di dispositivi connessi nel cosiddetto internet delle cose (IOT) che è in grado di raccogliere informazioni in modo automatico. Non si tratta più dei meri contenuti ai quali ci riferiamo quando pensiamo alla società dell’informazione: si tratta di  tracce, processi, segni, localizzazioni, data point granulari che consentono di qualificare e posizionare nel tempo e nello spazio ogni tipo di contenuto, in grado di gestire qualsiasi tipo di processo: è il tipo di informazione che consente il funzionamento del navigatore dell’auto, il riconoscimento automatico delle nostre preferenze in qualsiasi negozio digitale, la precisione micidiale di un missile militare…
In quest’ottica possiamo immaginare il mondo digitalizzato come un’immensa matrice digitale alimentata da una enorme e crescente rete di connessione materiali che, poco alla volta, si sovrappone e per certi versi sostituisce l’ambiente naturale. In questo mondo virtuale ogni cittadino lascia tracce indelebili del suo passaggio in forma di informazioni che, cumulandosi nel tempo, consentiranno di disegnare automaticamente profili personali sempre più precisi, attitudini, preferenze, opinioni, atteggiamenti.

Big Data png

Questa colossale produzione e disponibilità di informazioni è davvero rivoluzionaria anche se l’impulso dal quale scaturisce ha radici molto antiche. L’esigenza di dati affidabili è nata con l’affermarsi dei grandi imperi e con le necessità di controllo delle burocrazie statali; con l’età moderna e la nascita della scienza fondata sull’osservazione, l’esperimento e la matematica, l’’esigenza di disporre informazioni traducibili in dati realmente utilizzabili è andata crescendo: proprio la difficoltà e il costo della raccolta di buone informazioni rappresentava (e in molti casi rappresenta ancora) un vincolo sostanziale per la produzione scientifica, l’amministrazione statale e la gestione di grandi imprese. Non a caso per aggirare questa difficolta i primi statistici avevano messo a punto le tecniche di campionamento che consentono a tutt’oggi di individuare pochi casi in base alle rigorose regole del caso, studiarli ed estendere le conclusioni all’intero universo con un ristretto e prevedibile margine di errore.

Anche in questi contesti la digitalizzazione tecnologica irrompe con una potenza devastante e rivoluzionaria: per la prima volta nella storia il problema non è più solamente quello di produrre direttamente le informazioni che servono strappandole con fatica dai contesti naturali ma, piuttosto, quello di selezionare e combinare informazioni già esistenti per generare qualcosa di nuovo. La straordinaria quantità di dati disponibili cambia radicalmente il panorama: le scienze sociali per prime sono messe in crisi da questi sconvolgimenti che aprono grandi opportunità e per certi versi ne mettono in discussione l’utilità se non proprio il fondamento. Questo passaggio dall’analogico al digitale, dal qualitativo al quantitativo, dai chilogrammi ai bit, dal reale al virtuale, è una rivoluzione paragonabile a quella di Gutenberg che passa incredibilmente sotto silenzio; big data è il termine con cui si etichetta questo fenomeno di abbondanza informativa assolutamente nuovo. Con tale termine si designa da un lato l’infinita disponibilità di informazioni traducibili in dati utilizzabili direttamente attraverso i calcolatori e, dall’altro, le operazioni che si possono fare su di essi attraverso potenti algoritmi di calcolo. Queste operazioni consistono nell’applicare la matematica e la statistica ad un universo di informazioni in crescita esponenziale per estrapolare tendenze e probabilità, scoprire strutture sottostanti ed eccezioni, individuare regolarità e storie ricorrenti, trovare nicchie e casi estremi, generare e testare ipotesi e teorie, in modi inaccessibili al costoso campionamento e sicuramente molto più rapidi ed economici. Oggi, sempre più ricercatori ritengono che in molti campi del sapere la  quantità di informazioni anche vaghe ed imprecise ma ben manipolata dalla potenza degli algoritmi di calcolo sia in grado di battere la (costosa) qualità dei dati raccolti in modo mirato. Tutti i dati, tutte le informazioni raccolte per uno scopo si prestano ad essere utilizzati anche in altri modi ed anche in questa flessibilità risiede la loro capacità di generare valore. Proprio intorno a questa possibilità si scatena la  competizione per scoprire il valore intrinseco non ancora espresso dei dati, nel farli parlare in modo innovativo. Un valore economico e commerciale enorme che risiede in potenza negli archivi digitali che proprio in questo momento stiamo contribuendo ad alimentare: un valore che attualmente spetta in via quasi esclusiva ai proprietari dei contenitori digitali (basti pensare a FaceBook o Google) che possono usare a titolo gratuito i contributi dei miliardi di persone connesse in rete direttamente (ad esempio tramite i social) o indirettamente (tramite i comportamenti rilevati dai sistemi di sensori, i chip, le fidelity card etc.).

Potenzialmente non c’è limite alle informazioni che possono essere estratte attraverso gli algoritmi di calcolo; queste possibilità mettono in discussione il nostro modo di vivere e di interagire con il mondo, creano nuove indicazioni o nuove forme di valore con modalità che vengono a modificare i mercati, le organizzazioni, le relazioni tra cittadini e governi, il lavoro, il concetto stesso di privacy, il modo di fare ricerca. Armati delle interpretazioni prodotte dagli algoritmi digitali possiamo rileggere il nostro mondo con modalità che si stanno appena cominciando ad apprezzare. Nel mondo di big data la noiosa statistica diventa improvvisamente sexy e l’analista di dati (data scientist) diventa una nuova figura di scienziato costantemente impegnato nella ricerca di correlazioni e nella messa a punto di algoritmi matematici sempre più potenti e raffinati. Uno gnomo post moderno che scava nel mondo digitale alla ricerca di tesori virtuali. Nel futuro paradiso degli statistici ognuno potrebbe esplorare la matrice digitale per fare grandi scoperte, per inventarsi un nuovo modo di vivere e di dar senso alla propria vita.

Ma anche gli statistici più visionari già vedono il loro successo di breve durata, minacciato da nuove generazioni di macchine molto più “intelligenti” di loro…

3 Responses to “La rivoluzione dell’informazione: big data e la rivincita degli statistici”

  1. avatar
    Catina Balotta says:

    La riflessione di Donati non comprendeva il problema della presenza e del trattamenti digitalizzato delle informazioni. Quella è una riflessione mia che mi sembrava coerente.
    Le informazioni hanno un potere primario che è quello di fare da collante per le “strutture sociali” …. in questo senso direi che il loro valore è indubbio e chiaro. Se spostiamo la riflessione sulla possibilità che ci sarà di estrarre informazioni sugli universi di popolazione e quindi (volendo) di manipolarle per vendere, comprare, imparare, vincere, sottomettere …. allora sì si passa a qualcosa potenzialmente inquietante. Non so se siamo lontani da questa deriva, sicuramente non siamo ancora consapevoli di tutte le possibili conseguenze. Certo per un vestito di Luisa Spagnoli super scontato …. io carico la mia anagrafica in un secondo sul portale internet della nota stilista perugina. Senza pentimenti.

  2. avatar
    Bruno Vigilio Turra says:

    Indubbiamente le riflessioni PP Donati sono affascinanti. Tuttavia la riflessione era – soprattutto – sull’uso di informazioni digitalizzate e sulle modalità attraverso cui la tecnologia degli algoritmi di calcolo può estrarre informazioni in modo (quasi) automatico (così come lo statistico tradizionale estrae informazioni da una matrice casi per variabili….). Proprio questo è un aspetto rivoluzionario i cui impatti sulla società (e anche sulle professioni dei manipolatori di simboli) saranno probabilmente drammatiche e comunque imprevedibili.

  3. avatar
    Catina Balotta says:

    Siamo in presenza di una rivoluzione epocale. Invece di estrarre campioni di casi estraiamo costellazioni di informazioni pertinenti un certo fenomeno, se non addirittura informazioni che ipotizzano la soluzione di un problema che qualcuno/diversi di noi ha già risolto chissà quando e chissà dove. E’ davvero impressionante la quantità di dati che viene prodotta ogni giorno, per lavoro e per svago, così come è impressionante il potere esplicativo che tali informazioni hanno su chi le ha immesse in un qualsiasi circuito.
    Mi ha sempre affascinato il rapporto che la sociologia pone come discutibile tra umano e sociale. O meglio, cosa fa da collante tra umano e sociale?. “Non c’è dubbio che per gran parte del pensiero post-moderno, il sociale sia inesorabilmente condannato a essere sistema, ossia una grande macchina che si sviluppa per proteggere l’uomo dai rischi e dalle casualità, finanche dalle catastrofi cosmiche. L’umano di cui si parla viene in gran parte ad essere collocato fuori dal sociale e quasi mai al suo interno. L’umano resta con noi ma solo nell’inumano che è nel bambino, nell’arte senza scopo, nella letteratura senza canoni, nella scrittura e nei graffiti della strada, nei consumi estetizzanti, nella sfera erotica, nel tribale, nel pensiero senza fissa dimora” (Donati, 1995). Secondo una delle scuole post-moderne il collante fra umano e sociale si recupera attraverso la relazione che i soggetti intrattengono tra loro e con i sistemi dati. Nella relazione il sociale diventa umano e viceversa. Affascinante tema, direi. Ora l’informazione così come funziona oggi ha ancora qualcosa di umano o ha escluso l’umano per essere solo società? La domanda è serissima. Mi chiedo se la produzione continua di informazioni per la società non deprivi l’uomo di una parte di se stesso trasformando in sociale ciò che era umano (estromettendo l’umano in quanto tale). Anche le costellazioni di informazioni possibili possono essere considerate costruzioni sociali come la famiglia, lo stato e l’esercito? Se sì, allora i circuiti informativi sono fonte di una socializzazione molto spinta che ha poco di umano. Questo fino a quando l’umano non si approprierà di nuovo di tali informazioni per essere creativo, per esprimere desideri…. Insomma per comunicare con i suoi simili l’essenza dell’esistere. Siamo in un momento di transizione in cui il recupero delle relazioni importanti porterà con sé il recupero delle informazioni che, nel sociale, descrivono tali relazioni. Le informazioni ritorneranno a chi le ha prodotte attraverso un processo di ridistribuzione di secondo livello che sarà affascinante. Cosa centra la statistica con tutto ciò? Molto poco.

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.