Un algoritmo vi seppellirà (di dati)

Finora i software automatici non erano in grado di decodificare le stringhe di testo proposte in maniera distorta da un programma di captcha. Crediti: captcha.net

Non lavorano né alla U.S. Robots descritta da Isaac Asimov né alla Tyrell Corporation di Blade Runner, bensì per l’azienda californiana Vicarious AI – il cui motto suona come “Intelligenza Artificiale per l’epoca dei robot” – i dodici autori di uno studio pubblicato oggi su Science riguardo a un software che, in poche mosse, può risolvere i captcha basati sul testo. I cosiddetti captcha (un neologismo informatico che si può probabilmente tradurre con “Ti ho beccato!”) sono programmi per la sicurezza informatica che sottopongono l’utente di un’applicazione a un test per discernere se è effettivamente un umano o piuttosto un software automatico. Tipicamente, viene prodotta un’immagine in cui è nascosta una stringa di caratteri, che l’utente deve riconoscere e digitare correttamente.

Siccome il cervello umano è straordinariamente bravo a imparare e generalizzare da pochi esempi, mentre gli algoritmi per riconoscere caratteri scritti in maniera non standard necessitano di milioni di esempi o di regole codificate, i captcha si sono rivelati piuttosto efficaci nel loro compito.

Una rappresentazione della lettera A secondo un modello generativo di rete corticale ricorsiva. Crediti: Vicarious AI

Gli autori del nuovo studio sostengono di avere ora sviluppato un algoritmo di riconoscimento del testo 300 volte più efficiente degli attuali modelli deep learning. Il nuovo modello, soprannominato rete corticale ricorsiva (Rcn), incorpora scoperte provenienti dalle neuroscienze per “addestrare” il computer a generalizzare, al di là di ciò che viene fornito come informazione di base. Grazie a questo, l’algoritmo può riconoscere captcha, identificare cifre scritte a mano, delineare i contorni di oggetti stratificati a più livelli, riconoscere il testo presente all’interno di immagini del mondo reale.

È del tutto evidente che se algoritmi come questo da una parte complicano la vita ai sistemi anti-spamming, dall’altra aprono prospettive entusiasmanti per il riconoscimento automatico delle immagini. Una tematica a cui anche l’astrofisica è assolutamente sensibile, come dimostra, ad esempio, l’utilizzo delle reti neurali per aumentare la definizione di immagini di galassie o per l’analisi rapida di oggetti catturati grazie all’effetto di lente gravitazionale.

Si parla di lente gravitazionale quando la luce proveniente da un oggetto astronomico sullo sfondo (ad esempio una galassia lontana) viene deflessa da un oggetto che si trova più prossimo a noi (ad esempio un ammasso di galassie) e che funge da vera e propria lente di ingrandimento.

Grazie a queste “lenti” naturali, gli astronomi riescono a osservare oggetti anche molto distanti, altrimenti fuori dalla portata degli attuali telescopi. Attualmente, le lenti gravitazionali vengono identificate all’interno di più ampie immagini del cielo da astronomi professionisti, ma anche da appassionati attraverso progetti di citizen science come Galaxy Zoo. Tuttavia, i grandi telescopi in fase di costruzione, di cui alcuni entreranno presto in servizio, produrranno una quantità tale di dati da richiedere forzatamente l’aiuto dell’intelligenza artificiale per l’analisi e l’interpretazione delle immagini.

Proprio in questo senso, un gruppo di ricercatori europei, tra cui due dell’Inaf, ha ora sviluppato un metodo per identificare lenti gravitazionali all’interno di enormi moli di osservazioni. I ricercatori hanno pubblicato il loro metodo, assieme al catalogo di 56 nuovi oggetti celesti candidati a essere classificati come lenti gravitazionali dopo opportuna verifica osservativa, nel numero di novembre della rivista Monthly Notices of the Royal Astronomical Society.

Alcune delle innumerevoli immagini di lenti gravitazionali utilizzate per istruire la rete neurale. Crediti: Enrico Petrillo / Rijksuniversiteit Groningen

«Questa è la prima volta che una rete neurale convoluzionale è stata utilizzata per trovare degli oggetti particolari in un’indagine astronomica», spiega Carlo Enrico Petrillo dell’Università di Groningen, in Olanda, primo firmatario del nuovo studio. «Ritengo che diventerà la norma poiché i futuri campionamenti del cielo produrranno un’enorme quantità di dati, superiore alla capacità degli astronomi di analizzarli visivamente».

Questo metodo si basa sullo stesso algoritmo di intelligenza artificiale, ispirato dall’organizzazione della corteccia visiva animale, che, ad esempio, Facebook utilizza per riconoscere cosa contengono le immagini pubblicate nelle timeline degli utenti, o di cui si serve Tesla per sviluppare sistemi automatici di guida per veicoli. Gli astronomi hanno invece istruito la rete neurale dandogli in pasto milioni di immagini di lenti gravitazionali appositamente costruite, facendo poi confrontare le conoscenze acquisite con milioni di nuove immagini del cielo che complessivamente andavano a coprire meno dell’uno per cento della volta celeste.

Due delle 57 candidate lenti gravitazionale rintracciate grazie alla rete neurale. Crediti: Carlo Enrico Petrillo / University of Groningen

Mentre attualmente si conoscevano tre sole lenti gravitazionali nell’area di cielo in esame, la rete neurale ha trovato 761 candidati, campione che è stato poi ridimensionato a 56 dopo un controllo visivo da parte degli astronomi. Un risultato soddisfacente che, secondo gli autori, potrà essere ulteriormente migliorato.

Le immagini processate dalla rete neurale provengono dalla campagna di campionamento intensivo di una fetta di cielo denominata Kilo-Degree Survey, effettuata con il telescopio Vst (VLT Survey Telescope) dell’Eso in Cile, uno strumento a cui ha grandemente contribuito l’Inaf. Il campionamento ha lo scopo di mappare la distribuzione della materia nell’universo, e le lenti gravitazionali rivestono in questo un ruolo cruciale.

«Uno dei grandi interrogativi che affliggono gli astronomi riguarda la materia oscura: cos’è, quanta ce n’è, com’è distribuita», commenta a Media Inaf Aniello Grado dell’Osservatorio Inaf di Capodimonte, tra gli autori del nuovo studio e responsabile del centro dati Vst a Napoli. «Le lenti gravitazionali sono uno strumento straordinario che ci permette di rispondere ad alcune di queste domande fondamentali».

Per saperne di più:

Leggi l’articolo pubblicato su Science “A generative vision model that trains with high data effciency and breaks text-based CAPTCHAs“, di D. George, W. Lehrach, K. Kansky, M. Lázaro-Gredilla, C. Laan, B. Marthi, X. Lou, Z. Meng, Y. Liu, H. Wang, A. Lavin e D.S. Phoenix
Leggi l’anteprima dell’articolo pubblicato su Monthly Notices of the Royal Astronomical Society “Finding strong gravitational lenses in the Kilo Degree Survey with Convolutional Neural Networks”, di C.E. Petrillo, C. Tortora, S. Chatterjee, G. Vernardos, L.V.E. Koopmans, G. Verdoes Kleijn, N.R. Napolitano, G. Covone, P. Schneider, A. Grado e J. McFarland
Leggi l’articolo pubblicato su Nature “Fast automated analysis of strong gravitational lenses with convolutional neural networks“, di Yashar D. Hezaveh, Laurence Perreault Levasseur e Philip J. Marshall.
Leggi l’anteprima dell’articolo pubblicato su Monthly Notices of the Royal Astronomical Society “Generative Adversarial Networks recover features in astrophysical images of galaxies beyond the deconvolution limit”, di Kevin Schawinski, Ce Zhang, Hantian Zhang, Lucas Fowler e Gokula Krishnan Santhanam