CANNIBALISMO GALATTICO SVELATO DAL DEEP LEARNING

Nyx, un ammasso che viene da lontano

Grazie a simulazioni, modelli al computer e algoritmi d’apprendimento automatico, è stato individuato – tra i milioni di sorgenti osservate dal satellite Gaia – un particolare ammasso di 250 stelle, nel disco della nostra galassia, appartenenti probabilmente a un’antica galassia nana inglobata dalla Via Lattea. Lo studio è pubblicato su Nature Astronomy

     09/07/2020

Screenshot da una simulazione della formazione di singole galassie, a partire dall’epoca in cui l’universo aveva solo pochi milioni di anni. Crediti: Hopkins Research Group, Caltech

Si dice che la partita sia lo specchio dell’allenamento. Se ci si allena fisicamente e mentalmente nel modo giusto, studiando adeguatamente l’avversario – e se l’avversario è abbastanza alla portata, naturalmente – ci sono buone possibilità di portare a casa il risultato. Lina Necib – giovane ricercatrice postdoc in fisica teorica del Caltech – ha sviluppato, assieme alla squadra di ricercatrici e ricercatori che ha giocato con lei, un vero e proprio percorso di allenamento in preparazione a una prova che si è disputata nel campo di gioco della Via Lattea. Un percorso intenso e complesso, che ha visto coinvolti supercomputer, tecniche di deep learning e dati simulati – quelli del Gaia mock catalog sviluppato da Robyn Sanderson della University of Pennsylvania. E che ha condotto a una prima “vittoria” sui dati reali raccolti dalla sonda spaziale Gaia, rivelando la presenza di un particolare ammasso stellare nelle vicinanze del Sole.

Con la sua orbita prograda con una componente di velocità radiale, Nyx – questo il nome che Lina Necib e Mariangela Lisanti, ricercatrice a Princeton e coautrice dello studio, hanno scelto per l’ammasso, in onore della dea greca della notte – potrebbe essere ciò che rimane di una galassia nana che si è fusa con il disco della Via Lattea, e che appare stiracchiata lungo la sua orbita dalle forze mareali prima di essere completamente distrutta. L’articolo che riporta il risultato è stato pubblicato questa settimana su Nature Astronomy.

«Le galassie si formano inglobando altre galassie», spiega Necib. «Abbiamo ipotizzato che la Via Lattea abbia avuto un passato abbastanza tranquillo quanto a fusioni, e per un momento eravamo preoccupati per quanto apparisse quieta, dal momento che le nostre simulazioni mostravano diverse fusioni. Ora, con la possibilità di studiare strutture più piccole, abbiamo capito che non era così tranquilla come sembrava. Gli strumenti di cui disponiamo, dati e simulazioni, sono molto potenti. Essi devono però essere usati tutti insieme per poter risolvere questo problema. Ci troviamo nelle fasi iniziali di sviluppo delle capacità per indagare e comprendere la formazione della Via Lattea.»

Partiamo dunque dall’allenamento: scopriamo le ragioni per cui esso è tanto importante e a quali strumenti e metodi fa riferimento la prima autrice dello studio.

Una fra le più corpose e precise raccolte dati sulle stelle della Via Lattea mai condotte è quella del telescopio spaziale Gaia, lanciato nel 2013 dall’Agenzia spaziale europea. Da allora, Gaia ha raccolto informazioni su posizioni e moti di circa un miliardo di stelle nella nostra galassia, determinando le velocità tridimensionali di sette milioni di esse. Una mappatura del genere è però un’arma a doppio taglio: una miniera di informazioni impossibili da recuperare e analizzare con la sola percezione umana.

«Prima, gli astronomi si basavano molto sull’osservazione e il tracciamento di grafici, magari usando qualche algoritmo per riconoscere raggruppamenti di oggetti. Ma ora non è più possibile», continua Necib. «Non possiamo fissare sette milioni di stelle e capire cosa stanno facendo. Quello che abbiamo fatto in questa serie di progetti è stato partire dai cataloghi simulati di Gaia».

Questi cataloghi, basati sulle simulazioni realizzate nell’ambito del progetto Fire (Feedback In Realistic Environments), riproducono con fedeltà il campione di stelle osservate da Gaia, esattamente come il satellite le vede. Le simulazioni, a differenza delle osservazioni che ci forniscono fotografie istantanee, includono le “ricette” fisiche che descrivono la storia di formazione ed evoluzione delle galassie. Il vantaggio delle simulazioni è che tutti i parametri utilizzati sono noti, e si conoscono pertanto con precisione le proprietà fisiche e la storia di provenienza di ogni stella presente, potendo dire con certezza quali stelle provengano, ad esempio, da una galassia che dalla Via Lattea è stata cannibalizzata.

L’allenamento, dicevamo, consiste nello sfruttare le simulazioni per sviluppare delle tecniche di calcolo che addestrino i modelli a riconoscere i casi reali. Per questo è stato fondamentale il contributo del secondo autore dello studio, Bryan Ostdiek, ricercatore precedentemente coinvolto in Lhc, che ha portato la sua esperienza nel trattare enormi campioni di dati con le tecniche del machine learning e del deep learning.

«A Lhc abbiamo simulazioni incredibili, ma temiamo che le macchine addestrate su di esse possano imparare la simulazione e non la fisica reale», commenta Ostdiek. «In modo simile, le galassie Fire forniscono un ambiente meraviglioso per addestrare i nostri modelli, ma non sono la Via Lattea. Abbiamo dovuto imparare non solo cosa poteva aiutarci a identificare le stelle interessanti nella simulazione, ma anche come far sì che questo si possa applicare alla nostra galassia reale.»

Il team ha sviluppato un metodo per tracciare i movimenti di ogni stella nelle galassie virtuali ed etichettare le stelle nate nella galassia ospitante, così come quelle provenienti da fusioni fra galassie. I due tipi di stelle hanno impronte diverse, ma le differenze sono spesso sottili. Queste etichette sono state utilizzate per allenare modelli di deep learning, il cui apprendimento è stato messo in seguito alla prova su altre simulazioni Fire. In particolare, il modello attribuisce a ciascuna stella una probabilità di essere nata fuori dalla Via Lattea in un intervallo di valori fra zero e uno. Dopo la fase di addestramento, viene eseguito il cosiddetto transfer learning, che consiste nell’applicare il modello a un campione di dati diverso ma correlato al precedente, per evitare un completo salto nel vuoto.

Il metodo, spiega Necib, è stato infine applicato ai dati di Gaia. «Abbiamo chiesto alla rete neurale: “In base a quello che hai imparato, puoi etichettare le stelle come autoctone o no?».

Per verificare l’attendibilità del metodo, i ricercatori sono anzitutto andati in cerca di strutture note nella Via Lattea – come i resti di galassie nane che si sono fuse con la Via Lattea circa sei o dieci miliardi di anni fa – per vedere se queste venivano identificate correttamente. L’allenamento ha funzionato. Una volta applicato al campione osservato da Gaia, il modello ha identificato un’altra struttura, del tutto inedita: un ammasso di 250 stelle, in orbita prograda nel disco della Via Lattea, e con una componente di velocità che punta verso il centro della galassia. Questa struttura, impossibile da identificare senza le tecniche computazionali impiegate, ha permesso di identificare una classe di oggetti difficili da rivelare con metodologie standard: detriti stellari immigrati nel disco della galassia, che co-ruotano con esso e hanno caratteristiche chimiche simili alle stelle autoctone che popolano il disco spesso.

Necib e il suo team hanno ora intenzione di osservare Nyx utilizzando telescopi terrestri. Questo fornirà informazioni sulla composizione chimica dell’ammasso e altri dettagli che aiuteranno gli astrofisici a datare l’arrivo di Nyx nella Via Lattea, e possibilmente forniranno indizi sulla sua provenienza. E la partita non finisce qui. Il ricchissimo know-how appreso per la necessità di sviluppare rapidamente tecniche e conoscenze computazionali per l’analisi e la gestione dei dati raccolti da Gaia, infatti, costituisce un prezioso strumento non solo nella ricerca scientifica, ma nel progresso tecnologico in generale.

Per saperne di più: