Il follow-up degli allarmi scientifici esterni al progetto AGILE ricevuti dai rilevatori di Gamma-Ray Bursts (GRB) e di Onde Gravitazionali (GW), cioè la fase di controllo periodico e programmato di una ricerca scientifica tramite contributi esterni, è una delle attività principali del team del telescopio spaziale AGILE (Astrorilevatore Gamma ad Immagini LEggero). Il team AGILE ha sviluppato una pipeline automatica di analisi in tempo reale per analizzare i dati del rilevatore di immagini a raggi gamma per rilevare possibili controparti ottiche delle GW nell'intervallo di energia 0,1-10 GeV. Questo lavoro presenta un nuovo approccio per il rilevamento dei GRB poiché utilizza una rete neurale convoluzionale (CNN), migliorando la capacità di rilevamento dei GRB. In questo articolo vedremo come la rete CNN sia stata addestrata a questo compito.
Introduzione
AGILE (Astrorilevatore Gamma ad Immagini LEggero Light Imager for Gamma-Ray Astrophysics) è una missione scientifica dell'Agenzia Spaziale Italiana (ASI) lanciata ad aprile 2007. Il rilevatore del carico utile AGILE consiste nel Silicon Tracker (ST), il rilevatore a raggi X SuperAGILE, il Mini-Calorimetro CsI(Tl) (MCAL), e un Sistema di AntiCoincidenza (ACS). La combinazione di ST, MCAL e ACS forma il Gamma-Ray Imaging Detector (GRID). AGILE-GRID è usato per osservazioni nell'intervallo di energia 30 MeV50 - GeV. Il sistema di posizionamento preciso e i due sensori stellari forniscono informazioni accurate su tempi, posizione e assetto. L'ST, che possiamo vedere in Figura 1, è il cuore di AGILE-GRID e si basa sul processo di conversione dei fotoni in coppie elettrone-positrone. Consiste di 12 vassoi, i primi 10 dei quali includono un convertitore di tungsteno seguito da una coppia di rilevatori a microstrip di silicio con strisce ortogonali l'una all'altra, gli ultimi due consistono solo di rilevatori al silicio. I raggi γ sono convertiti in elettroni dagli strati di tungsteno (silicio), e un'elettronica di lettura acquisisce ed elabora i dati.
Il team AGILE ha sviluppato una pipeline automatizzata per reagire agli avvisi scientifici esterni ricevuti dal Gamma-Ray Coordinates Network (GCN). Un allarme scientifico è una comunicazione da/per la comunità astrofisica che indica un fenomeno transitorio che si verifica nel cielo. Questa pipeline automatizzata può reagire in modo veloce e rilevare una possibile controparte GRB a breve termine (< 1000 sec). Il rilevamento avviene quando la pipeline trova un segnale con una significatività statistica al di sopra di una soglia definita, ovvero ≥ 3σ. Le posizioni dei GRB e i tempi di innesco sono noti in anticipo perché la pipeline reagisce ad allarmi scientifici esterni. L'analisi viene eseguita utilizzando la fotometria di apertura, valutando i conteggi rilevati all'interno di una finestra temporale contenente il bersaglio (Ton) e una finestra temporale contenente solo lo sfondo (Tof). I conteggi sono selezionati dalla lista di fotoni AGILE-GRID in un raggio di 10° dal centro della regione di localizzazione del segnale dell'allarme esterno, al fine di contenere l'immagine della sorgente. Il fondo viene valutato prima del tempo di innesco perché la vera durata del GRB è sconosciuta. Nel metodo attuale usato dalla pipeline automatizzata AGILE-GRID, la significatività di una rilevazione di GRB è calcolata con la formula di Li&Ma, utilizzando i conteggi estratti nelle fasi precedenti. Il Li&Ma è un metodo di rapporto di verosimiglianza applicato alla fotometria. E' largamente usato in astronomia dei raggi γ e dal Team AGILE come analisi standard per la rilevazione dei GRB. Questo metodo, però, ha dei limiti. Il principale è che richiede che i conteggi in entrambe le finestre temporali Ton e Tof non siano troppo pochi. Le rilevazioni con un conteggio inferiore a dieci, solitamente, vengono quindi scartate. Il lavoro del gruppo di Nicolò Parmiggiani, ricercatore ventinovenne dell’Istituto Nazionale di Astrofisica, propone un nuovo metodo di rilevamento per superare questo limite e migliorare la capacità della pipeline automatizzata AGILE-GRID di rilevare i GRB durante il follow-up degli allarmi scientifici ricevuti da altri osservatori attraverso la rete GCN.
Algoritmi di Deep Learning: CNN
I metodi Deep Learning (DL) fanno parte dei metodi di apprendimento automatico (ML). I metodi ML, tipicamente, utilizzano algoritmi di addestramento automatico per imparare a prevedere l'output corretto riguardo a diversi problemi (classificazione, regressione, ecc.) senza essere direttamente programmati per farlo. L'addestramento viene eseguito utilizzando un set di dati che è un sottoinsieme dell'intera popolazione di possibili input che il modello otterrà per predire l'output. Le tecniche di ML non possono essere utilizzate direttamente sui dati grezzi ma richiedono un primo passo di ingegneria delle caratteristiche (estrazione) dai dati grezzi. Questa operazione è dispendiosa in termini di tempo e deve essere eseguita da esperti del settore con una comprensione completa dei dati. Una volta estratte, le caratteristiche sono usate come input per il modello ML. I metodi DL, al contrario, non richiedono questa ingegneria delle caratteristiche eseguita da esperti perché possono estrarre le caratteristiche direttamente dai dati grezzi. Le architetture DL, chiamate Deep Neural Network (DNN), sono composte da diversi strati che sono in grado di estrarre caratteristiche a diversi livelli di astrazione. Il numero di livelli può variare con la complessità del problema e la potenza di calcolo disponibile. Le DNN sono diventate ancora più popolari negli ultimi anni grazie a tre fattori principali:
- Il miglioramento dell'hardware computazionale necessario per addestrare DNN con milioni o miliardi di parametri
- La disponibilità di enormi quantità di dati adatti all'addestramento di grandi modelli DNN
- Lo sviluppo di framework che possono essere utilizzati per implementare questi modelli DNN con tecnologie standard
Le CNN, reti neurali convoluzionali, sono una classe di reti neurali profonde specificamente sviluppate per analizzare e classificare le immagini. La CNN sviluppata in questo lavoro è utilizzata per classificare le mappe di intensità AGILE-GRID e rilevare la presenza di GRB nel campo. Le mappe di intensità sono mappe di conteggi divise per l'esposizione. La CNN richiede una fase di addestramento con grandi set di dati simulati di mappe di intensità che rappresentano il livello medio di fondo e la distribuzione del flusso dei GRB prevista nell'intervallo di energia AGILE-GRID 0.1-10 GeV. Dopo aver eseguito l'addestramento, la distribuzione dei valori dalle mappe di sfondo è calcolata in diverse condizioni osservative. La CNN viene poi applicata ai dati reali utilizzando la posizione dei GRB e il tempo di innesco di AGILE-GRID. Perché l'apprendimento automatico migliora le capacità di rilevamento di GRB? La CNN può essere addestrata sui dati di uno specifico strumento, imparando da enormi set di dati simulati. Inoltre, viene addestrata con set di dati simulati utilizzando il livello di fondo calcolato durante l'osservazione reale AGILE-GRID. Infine, i flussi dei GRB simulati sono estratti dal catalogo Fermi-LAT GRB, e scalati all'intervallo di energia AGILE. Tutta questa conoscenza viene appresa dalla CNN. Inoltre, la CNN non richiede un numero minimo di eventi, per essere applicabile.
ATTENZIONE: quello che hai appena letto è solo un estratto, l'Articolo Tecnico completo è composto da ben 2007 parole ed è riservato agli ABBONATI. Con l'Abbonamento avrai anche accesso a tutti gli altri Articoli Tecnici che potrai leggere in formato PDF per un anno. ABBONATI ORA, è semplice e sicuro.