Miliardi di immagini per creare un nuovo Rinascimento (e qualche rischio)

Mr TT

Nel mondo si producono e si “distribuiscono” miliardi di immagini, solo su Instagram si stimano oltre 40 miliardi di fotografie, oltre 100 milioni di fotografie vengono caricate ogni giorno (il dato è di un anno fa, ora sarà probabilmente superiore), ma ovviamente poi ci sono altri canali di diffusione, come Facebook, Pinterest e mille altri. Questa abitudine coinvolge una gran parte della popolazione del web, con punte di curiosità interessanti: per esempio, la pizza è il cibo più instagrammato al mondo, seguito dal sushi, la seconda popolazione femminile al mondo su Instagram è quella brasiliana (dopo gli USA).

Sarebbe però estremamente limitativo pensare che questa mole di immagini sia solo una testimonianza vanitosa sociale, come molti pensano. E’ incredibile, immensa, la potenzialità che si può sfruttare: se interpretiamo miliardi di informazioni visive per quello che effettivamente sono (dati, veramente “BIG data”), comprendiamo che si tratta di qualcosa che potrebbe avviare un nuovo Rinascimento culturale e del sapere. Esagerato? No, e ovviamente questo è stato sapientemente analizzato da chi “possiede” Instagram, ovvero Facebook che pochi giorni fa ha segnalato, durante l’evento F8, una ricerca molto interessante (vi eravate fermati all’annuncio del nuovo servizio di incontri online stile Tinder?): l’intenzione è quella – sulla base di questo numero incalcolabile di dati – di generare quello che è chiamata “Deep learning”, quindi una conoscenza profonda da integrare a sistemi di intelligenza artificiale. Per dirla in modo semplice, rendere identificabili i soggetti di un’immagine e quindi “insegnare” i sistemi digitali al riconoscimento di soggetti simili, ma anche poter descrivere i contenuti di un’immagine a chi non ha capacità visiva (per esempio, se ne parlava due anni fa). Ovvio che tutto questo non è nuovo, il riconoscimento dell’immagine ha già fatto grandi passi in avanti, in questi ultimi anni, ma è interessante capire che è il livello di approfondimento (“Deep”) che si può raggiungere, qui sotto un esempio di quello che era “prima” (riconoscere in un’immagine un fiore, un uccello, un albero) e quello che invece potrà essere (il tipo di fiore, la razza di uccello, la tipologia di albero).

Tutto questo prevede, in partenza, un immenso lavoro “uomo”: dire alle macchine qualcosa che è molto più complesso che il (pur difficile) identificare le forme di un orso o di una pizza, ed è sempre stato il grande problema, il maggiore investimento, ma ecco la soluzione… gli hashtag: codici, dati che vengono inseriti da centinaia di milioni di persone che postano miliardi di immagini (gratuitamente…). Il team che si occupa di AI (Intelligenza Artificiale) all’interno di Facebook ha fatto un esperimento su un “piccolo campione” composto da 3,5 miliardi di immagini contraddistinte da 17 mila hashtag, analizzando le specifiche criticità: per esempio, le persone indicano con degli hashtag situazioni e descrizioni che spesso, a livello umano, possono essere anche considerate “giuste”, ma che nella realtà non sono precise: se si fa una foto alla fidanzata in primo piano durante una visita alla Tour Eiffel, potrebbe essere normale inserire l’hashtag #TourEiffel ma questo non può trasformare la fidanzata in una torre di 300 metri di metallo!

Serve quindi un lavoro molto importante di ottimizzazione, che è parte integrante del lavoro svolto dai ricercatori che hanno sviluppato un modello di apprendimento che si basa su 861 milioni di parametri che ha portato attualmente ad un’accuratezza di oltre l’85% usando un numero di dati inferiore rispetto al campione di cui parlavano (“solo” 1 miliardo di immagini e 1500 hashtag: anche i sistemi super potenti di calcolo a disposizione del gigante dei social network hanno dei limiti), ma presto questa accuratezza potrà crescere grazie a nuovi modelli di predizione hashtag su scala ancora più allargata.

Affascinante, ma anche per certi versi inquietante: in un periodo in cui abbiamo i nervi esposti dall’uso sconsiderato dei nostri dati personali (leggasi: Cambridge Analytica-Facebook), ci si può domandare se queste tecnologie, sempre più evolute, potrebbero e potranno essere usate per spremere sempre più informazioni da noi, singoli utenti o comunità. I dati immagine per effettuare queste ricerche – dicono quelli di Facebook – sono stati estrapolati da dati “pubblici”, ma quasi tutto quello che noi condividiamo è, di fatto, qualcosa di “pubblico”. Forse nemmeno immaginiamo quello che potrebbe essere “elaborato” da dati apparentemente “irrilevanti”, e in questo forse ha senso guardare – sempre all’interno degli annunci di Facebook F8 – ad altre visioni come quelle che propongono, per un prossimo futuro, la ricreazione di ambientazioni tridimensionali ed immersive partendo da immagini 2D (foto o video), al fine di ricostruire l’emozione e teletrasportarci in quella situazione passata. In questo momento la tecnologia ridisegna le zone “non conosciute” con un effetto “puntinato”, e viene considerata comunque una resa sufficiente per un effetto “sogno” (dicono: non si sogna in HD… si tratta di sensazioni), ma in futuro? Guardando le immagini del link che vi abbiamo segnalato, non abbiamo non potuto pensare che una ricostruzione più precisa potrebbe essere realizzata unendo tante immagini scattate, anche negli anni, da varie posizioni… una ricostruzione 3D di una casa, di un ambiente… usando la fotogrammetria e immensi dati che sono a disposizione e che possono essere comparati. Si potrebbe sapere come è fatta casa vostra, con precisione pazzesca. Ricordiamo che tra gli investimenti fatti da Facebook c’è Oculus, il più potente sistema di visualizzazione della realtà virtuale, e ovviamente queste idee si integrano alla perfezione e segnaliamo anche la presentazione del sistema Oculus Go, passo evolutivo importante per il VR, che consente una potenza simile al modello top – che però richiede un computer collegato con un cavo – e i sistemi Cardboard dove si usa il cellulare come schermo: tale ricostruzione consentirà di entrare “ancora di più” a casa vostra/nostra. Affascinante (ci ripetiamo)… o incredibilmente invasivo? Ancora una volta, è come verranno usate, le tecnologie, e sappiamo che saranno usate in entrambi i modi: belli e brutti.

Tutto questo deve farci riflettere, sull’importanza e sulla evoluzione dell’immagine, nella nostra cultura e nel nostro futuro: sarà (è già) la base del nostro sapere, della nostra comunicazione, ma anche per il nostro controllo, per predire il nostro comportamento, per influenzarci. Se non siamo noi, persone che si occupano di immagine, a preoccuparci/occuparci di questo, chi lo farà?