UN NUOVO ALGORITMO DI MACHINE LEARNING ACCESSIBILE A TUTTI

Mosaici da satellite per migliorare la vita

Pubblicato su Nature Communications un ambizioso progetto di democratizzazione della scienza: un sistema basato sull’apprendimento automatico per analizzare in modo semplice e autonomo i dati provenienti da satellite. Si tratta di un vero e proprio passepartout per studiare e risolvere problemi globali e locali, dal cambiamento climatico alle dinamiche sociali dei singoli paesi, alla povertà

     22/07/2021

Da alcuni anni ormai i big data non sono più prerogativa di pochi, potenti colossi informatici. Sulla Terra – principalmente grazie ai social e ai grandi sistemi di ricerca di rete – ma anche nello spazio. Sono oltre 700 i satelliti in orbita intorno al nostro pianeta che ogni giorno trasmettono ai database a terra una vasta mole di informazioni sotto forma di immagini: dati che riguardano il cambiamento climatico, la salute, la povertà. Si stima che il volume giornaliero arrivi circa a 80 terabyte – per confronto, gli utenti di Instagram, caricando circa 23mila foto ogni minuto in tutto il mondo, producono un traffico attorno ai 180 terabyte al giorno, poco più del doppio.

Immagine satellitare che mostra centinaia di stagni verdi di acquacoltura nello stato indiano di Andhra Pradesh (cliccare per ingrandire). Crediti: Nasa / Joshua Stevens, Landsat U.S. Geological Survey

Il problema con i satelliti, però, è che i destinatari di queste informazioni – dai ricercatori ai decisori politici – spesso hanno difficoltà ad accedervi. Per sfruttare il potenziale di problem solving (ampiamente inespresso) contenuto nelle immagini satellitari, i ricercatori della Uc Berkeley, in California, hanno ideato un sistema di apprendimento automatico (in inglese, machine learning) che fa uso di una tecnologia a basso costo e facile da usare. La loro soluzione, pensata per essere facilmente accessibile a ricercatori e governi di tutto il mondo, è descritta in un articolo pubblicato questa settimana su Nature Communications.

«Le immagini satellitari contengono un’incredibile quantità di dati sul mondo, ma bisogna saper tradurre i dati in intuizioni utilizzabili senza avere una persona che passi al vaglio ogni singola immagine», dice Esther Rolf, studentessa di dottorato in informatica alla Uc Berkeley e coautrice dello studio. «Abbiamo progettato il nostro sistema perché chiunque possa essere in grado di farlo funzionare anche su un computer portatile, senza avere una formazione specializzata, e per affrontare problemi locali».

Il progetto a cui hanno dato vita gli autori dello studio è uno straordinario esempio di unione fra discipline che spesso guardano il mondo e interagiscono con esso in modi diversi, e che parlano lingue diverse: l’informatica, le scienze ambientali e climatiche, la statistica, l’economia e la politica. L’interesse è però comune: creare uno strumento di libero accesso che democratizzi il potere della tecnologia, rendendola utilizzabile anche da comunità e paesi che non hanno risorse e competenze tecniche avanzate.

Cominciamo dal nome: si chiama Mosaiks – Multi-Task Observation using Satellite Imagery & Kitchen Sinks – e dovrebbe poter consentire l’analisi di centinaia di variabili tratte dai dati satellitari su scala globale – dalle condizioni del suolo e dell’acqua, alle abitazioni, alla salute e alla povertà. Un esempio immediato delle sue potenzialità riguarda il monitoraggio del cambiamento climatico, un fenomeno diffuso e difficile da osservare nel dettaglio in un singolo luogo, ma che salta all’occhio quando si fa un passo indietro e si osservano regioni estese. Gli autori citano le immense aree di pascolo delle Grandi Pianure negli Stati Uniti, il Sahel in Africa, o anche la Groenlandia e l’Antartide, che stanno assistendo a una vertiginosa e incessante perdita della loro superficie ghiacciata. Grazie a Mosaiks, il processo di conta degli iceberg in quest’ultime diverrebbe automatizzato, consentendo di tracciare in modo efficiente e statistico il mutamento del territorio nel tempo.

Illustrazioni che mostra come il Mosaiks predice, in dettaglio, la copertura forestale (sopra, in verde) e la popolazione (sotto). Crediti: Esther Rolf, Jonathan Proctor, Tamma Carleton, Ian Bolliger, Miyabi Ishihara, Vaishaal Shankar, Benjamin Recht e Solomon Hsiang

Al di là del tempo che impiegherebbe una persona a osservare una a una queste immagini, comunque, il problema dei dati da satellite riguarda soprattutto il modo in cui essi giungono a terra. Non già come immagini ordinate e pronte all’uso, bensì come dati grezzi espressi in sistema binario. Per accedervi, così come sono, bisogna avere un’idea precisa di cosa si va cercando e di come tradurlo. Prima di Mosaiks, sottolineano gli autori, l’accesso a questi dati era elitario.

«Prima non c’era possibilità, ad esempio, che un’agenzia di conservazione in Kenya fosse in grado di accedere alla tecnologia e agli esperti per fare questo lavoro», dice Solomon Hsiang, direttore del Global Policy Lab alla Goldman School of Public Policy e coautore dello studio. «Volevamo trovare un modo per dare loro questo potere. Abbiamo deciso di creare una sorta di coltellino svizzero – uno strumento pratico a cui tutti possono accedere».

Vediamo come funziona. Mosaiks inizia con l’imparare a riconoscere modelli minuscoli che si ripetono nelle immagini: se pensiamo al gioco dello Scarabeo, possiamo dire che l’algoritmo comincia imparando a riconoscere ogni lettera. In questo caso, le tessere sono minuscoli pezzi di immagine satellitare, 3×3 pixel. Una volta riconosciuti modelli simili in diverse zone del mondo, li raggruppa insieme in modo ordinato. A questo punto, i ricercatori possono estrarre particolari dati relativi al paese di interesse, divisi per aree tematiche (l’umidità del suolo, le condizioni sanitarie, la migrazione umana, il valore delle case e così via). Si tratta, a tutti gli effetti, di un potente traduttore che prende una grande mole di dati ingombranti e illeggibili e li trasforma in informazioni utilizzabili.

«Abbiamo mandato così tanta roba nello spazio… È un risultato incredibile», commenta Hsiang. «Ma possiamo sfruttare molto di più tutti questi dati che stiamo già tirando giù. Lasciamo che il mondo li usi in modo utile. Usiamoli per il meglio».

Per saperne di più:

Guarda il tutorial su YouTube (in inglese):