Gli universi di Camels per addestrare l’AI

Il progetto Camels (Cosmology and Astrophysics with MachinE Learning Simulations) combina oltre 4mila simulazioni cosmologiche, milioni di galassie e 350 terabyte di dati per decifrare i segreti dell’universo. Crediti: Camels/UConn

Con 4233 universi simulati, milioni di galassie e 350 terabyte di dati, la nuova release di dati del progetto Camels – acronimo di Cosmology and Astrophysics with MachinE Learning Simulations – costituisce un vero e proprio tesoro per i cosmologi, che si propone di essere il riferimento per eccellenza per addestrare modelli di intelligenza artificiale (AI) capaci di decifrare le proprietà dell’universo.

I dati di queste simulazioni possono essere scaricati gratuitamente e gli scienziati li stanno già utilizzando. Uno di questi è Francisco Villaescusa-Navarro, alla guida di un progetto che vede coinvolti i due ricercatori Shy Genel e Daniel Anglés-Alcázar del Flatiron Institute del Centro di Astrofisica Computazionale (Cca). «Il machine learning sta rivoluzionando molte aree della scienza, ma richiede un’enorme quantità di dati per essere sfruttato», afferma Anglés-Alcázar. «Il rilascio dei dati pubblici di Camels, con migliaia di universi simulati che coprono un’ampia gamma di modelli fisici plausibili, fornirà a coloro che studiano la formazione delle galassie e alla comunità cosmologica un’opportunità unica per esplorare il potenziale dei nuovi algoritmi di apprendimento automatico per risolvere una varietà di problemi».

Il team di Camels ha generato le simulazioni utilizzando il codice dei progetti IllustrisTng e Simba. Il team di Camels include infatti membri di entrambi i progetti, con Genel che fa parte del core team di IllustrisTng e Anglés-Alcázar che ha sviluppato Simba. Circa la metà delle simulazioni combina la fisica a grande scala con quella a piccola scala, essenziale per studiare la formazione delle galassie. Ogni simulazione viene eseguita con ipotesi di partenza sull’universo leggermente diverse, ad esempio riguardo alla quantità di materia oscura rispetto all’energia oscura oppure la quantità di energia che i buchi neri supermassicci emettono nello spazio tra le galassie.

I ricercatori hanno progettato le simulazioni per darle in pasto a modelli di apprendimento automatico, che saranno in grado di estrarre informazioni dalle osservazioni dell’universo reale osservabile. Con 4233 simulazioni cosmologiche, Camels è la più grande suite mai realizzata di simulazioni dettagliate progettate per addestrare algoritmi di apprendimento automatico. «I dati consentiranno nuove scoperte e collegheranno la cosmologia con l’astrofisica attraverso l’apprendimento automatico», afferma Villaescusa-Navarro. «Non c’è mai stato niente di simile, con così tante simulazioni di universi».

Il set di dati Camels è già stato utilizzato in diversi progetti di ricerca, che hanno prodotto svariati articoli, tra cui quelli di Pablo Villanueva-Domingo dell’Università di Valencia in Spagna. Insieme ai suoi colleghi ha sfruttato queste simulazioni per addestrare un modello di intelligenza artificiale per misurare la massa della nostra galassia, la Via Lattea, con anche l’alone di materia oscura circostante, e della vicina galassia di Andromeda, con il suo alone. Le misurazioni – le prime in assoluto eseguite utilizzando l’intelligenza artificiale – hanno stimato il peso della Via Lattea da mille miliardi a 2.6 migliaia di miliardi di volte la massa del Sole. Tali stime sono più o meno in linea con quelle effettuate con altri metodi, a dimostrazione dell’accuratezza dell’approccio dell’intelligenza artificiale.

Nel contempo, Villaescusa-Navarro ha utilizzato i dati di Camels per stimare il valore di due parametri che governano le proprietà fondamentali dell’universo: la frazione di materia nell’universo e quanto uniformemente la massa è distribuita nel cosmo. In primo luogo, lui e i suoi colleghi hanno utilizzato Camels per generare mappe della distribuzione della materia oscura, del gas e delle diverse proprietà delle stelle. Poi, utilizzando le mappe, hanno addestrato una rete neurale per prevedere i valori dei due parametri. «Si tratta dello stesso tipo di algoritmo utilizzato per distinguere tra un gatto e un cane dai pixel di un’immagine», afferma Genel, coautore dell’articolo. «L’occhio umano non può determinare quanta materia oscura c’è in una simulazione, ma una rete neurale è in grado di farlo».

Secondo Villaescusa-Navarro, questi risultati sono solo un esempio di ciò che si potrà ottenere sfruttando Camels, per stimare con precisione tali parametri sulla base delle future osservazioni dell’universo.

Per saperne di più:

Leggi su arXiv l’articolo “The CAMELS Multifield Dataset: Learning the Universe’s Fundamental Parameters with Artificial Intelligence” di Francisco Villaescusa-Navarro, Shy Genel, Daniel Angles-Alcazar, Leander Thiele, Romeel Dave, Desika Narayanan, Andrina Nicola, Yin Li, Pablo Villanueva-Domingo, Benjamin Wandelt, David N. Spergel, Rachel S. Somerville, Jose Manuel Zorrilla Matilla, Faizan G. Mohammad, Sultan Hassan, Helen Shao, Digvijay Wadekar, Michael Eickenberg, Kaze W.K. Wong, Gabriella Contardo, Yongseok Jo, Emily Moser, Erwin T. Lau, Luis Fernando Machado Poletti Valle, Lucia A. Perez, Daisuke Nagai, Nicholas Battaglia, Mark Vogelsberger

Guarda il servizio su MediaInaf Tv: