Sul blog di Elettronica Open Source puoi leggere non solo tutti gli articoli Premium riservati agli abbonati Platinum 2.0 e inseriti nella rivista Firmware 2.0 (insieme ad articoli tecnici, progetti, approfondimenti, news, tutorial a puntate e molto altro) ma anche gli articoli della Rubrica Firmware Reload. In questa Rubrica del blog abbiamo raccolto gli articoli tecnici della vecchia rivista cartacea Firmware, che contengono argomenti e temi evergreen per Professionisti, Makers, Hobbisti e Appassionati di elettronica. In questo articolo ci occuperemo dell’interazione tra particelle elementari e radiazioni ad alta energia con oggetti di uso quotidiano, le apparecchiature elettroniche utilizzate nelle nostre case e nelle nostre automobili, in particolare. Questo è uno dei rari casi in cui la fisica delle particelle elementari ha effetti visibili macroscopici, seppur rari, potenzialmente evidenti all’uomo della strada.
Introduzione
Dove cielo e terra si incontrano, non senza qualche apprensione…Certamente l’argomento incuriosisce chi si occupa di scienza e tecnologia. L’effetto di radiazioni ionizzanti di vario genere sui semiconduttori è stato storicamente studiato nell’ambito delle applicazioni dell’elettronica nello spazio, nell’industria nucleare, militare e strumentazione fisica (acceleratori di particelle, rilevatori, eccetera). L’attenzione per questi fenomeni ha conosciuto un’accelerazione a partire dagli anni '70, con la diffusione di circuiti integrati densi e caratterizzati da geometrie di fabbricazione sempre più piccole. Si è iniziato ad introdurre il concetto di “soft error”, malfunzionamenti casuali e temporanei causati dall’alterazione dei dati, senza danneggiamento permanente a dei componenti elettronici. Eventi particolarmente energetici, accompagnati dall’esponenziale aumento del numero dei componenti per circuito integrato e la riduzione della geometria connessa, rischiano però di veder aumentare anche casi di “hard error”, ovvero malfunzionamenti accompagnati a danneggiamento e quindi non automaticamente recuperabili. In questo articolo, dopo un breve richiamo sulle radiazioni ionizzanti di interesse nell’ambito dei circuiti integrati e qualche richiamo alla struttura di circuiti integrati CMOS, discuteremo degli effetti potenziali sul funzionamento dei circuiti elettronici e vedremo brevemente le precauzioni prese per prevenirli e gestirli quando non evitabili.
RAGGI COSMICI ED ALTRE SORGENTI DI RADIAZIONI
Trascurando situazioni particolari, quali apparecchiature installate dentro impianti nucleari, sugli aerei o nello spazio, la principale sorgente di radiazioni ionizzanti che le applicazioni elettroniche possono incontrare nella vita di ogni giorno, è costituita dai raggi cosmici. A seguito di studi compiuti negli anni ‘30 furono scoperte radiazioni ionizzanti nell’atmosfera e si dimostrò che queste erano di origine extraterrestre. A queste radiazioni venne dato il nome generico di raggi cosmici. I raggi cosmici sono principalmente costituiti da adroni, cioè protoni ed elettroni e nuclei di atomi fino a peso atomico pari agli atomi di ferro. I protoni da soli costituiscono quasi il 90% delle particelle interessate. Le particelle ad alta energia costituenti i raggi cosmici interagiscono con i nuclei dei gas atmosferici, creando i cosiddetti sciami di particelle secondarie ad energia progressivamente ridotta. Sostanzialmente tutte le particelle originabili con l’energia a disposizione della particella principale, vengono create in una serie di interazioni successive. L’energia a disposizione dei raggi cosmici è quindi molto più elevata alle alte quote per ridursi progressivamente avvicinandosi al livello del mare. Un gran numero di particelle diverse vengono prodotte durante il processo, accompagnate anche da emissione di energia sotto forma di raggi gamma. I raggi gamma trasportano una parte dell’energia prodotta dal decadimento delle particelle instabili createsi durante i processi di urto, quali i pioni. In pratica, le particelle originali costituenti raggi cosmici raramente arrivano al livello del mare. I raggi cosmici hanno molteplici origini, riconoscibili e classificabili in funzione della loro energia. A bassa energia troviamo le emissioni delle stelle come il nostro sole, ad energia media abbiamo emissioni generate dal processo di esplosione delle stelle massicce (supernove), i raggi gamma d’energia maggiore provengono dai buchi neri super massicci posti al centro di galassie non molto lontane dalla Via Lattea.
Le particelle prodotte dagli sciami originati dai raggi cosmici che maggiormente interagiscono con il dispositivo semiconduttore sono i nuclei di elio, composto da due protoni e due neutroni, chiamati anche particelle alfa, ed i neutroni. Le particelle alfa hanno energia inferiore ai neutroni, ma hanno una carica elettrica relativamente elevata e massa evidentemente maggiore. Anche i neutroni a bassa energia, cosiddetti termici, possono creare problemi nei semiconduttori. Questi neutroni catturati dai nuclei di boro contenuti come additivi nelle resine impiegate per la fabbricazione dei contenitori, creano isolate fissioni con emissione di nuclei di litio, particelle alfa e raggi gamma. I nuclei di litio e le particelle alfa possono creare soft error. Composti di boro sono usati per ridurre la temperatura di fusione nelle resine ed aumentarne la fluidità e quindi migliorare la planarizzazione ed omogeneità dei contenitori prodotti. Le particelle alfa provenienti dall’esterno vengono facilmente bloccate dai materiali costituenti il package stesso. Occorre quindi occuparsi solo delle particelle generate internamente al contenitore da impurità radioattive secondo il meccanismo descritto. Oggi, la maggior parte dei fenomeni sui semiconduttori sono determinati da neutroni, in particolare aventi energia uguale o maggiore di 10 MeV. I neutroni non sono affatto ostacolati dai contenitori dei circuiti integrati, occorrono infatti spessori di parecchie decine di centimetri di cemento per ottenere un’attenuazione significativa. Per dare un’idea, il flusso di neutroni a livello del mare aventi energia maggiore di 10 MeV e dell’ordine di 14 neutroni/centimetro quadrato/per ora. Ad un’altezza di 3000 m il flusso di neutroni è almeno 10 volte il valore a livello del mare. È lecito ed interessante chiedersi quale possa essere l’effetto di tale flusso di radiazioni sugli organismi viventi, ma questa è un’altra storia.
EFFETTI SUI CIRCUITI INTEGRATI
Rivediamo la struttura tipica di un circuito integrato logico CMOS in Figura 1. Possiamo ben comprendere come, ridurre le dimensioni fisiche delle strutture componenti il circuito integrato a pochi strati di atomi, renda i dispositivi più suscettibili a danneggiamenti microscopici. Due sono i meccanismi di azione delle radiazioni sul semiconduttore. Abbiamo danni da dislocamento quando particelle spostano gli atomi del reticolo cristallino dalle loro posizioni iniziali. Abbiamo invece danni da ionizzazione quando sono generate cariche libere nel semiconduttore che possono eventualmente essere intrappolate negli ossidi isolanti, creando nel tempo concentrazioni di cariche e relativi campi elettrici indesiderati. Le particelle ad alta energia iniettate nel semiconduttore generano coppie elettrone lacuna. Cariche elettriche possono essere intrappolate negli ossidi isolanti oppure alle interfacce. Gli effetti elettrici possono essere alterazione delle soglie dei componenti attivi o aumento delle correnti di perdita degli isolanti. Le cariche anomale alterano l’equilibrio preesistente, arrivando a modificare lo stato logico di una cella o di un nodo del circuito. L’effetto è impredicibile a priori, andando dall’alterazione dei dati, che può essere più o meno tollerato dal sistema in funzione dell’applicazione, fino a perdita di funzionalità con conseguenze potenzialmente serie. Mentre l’alterazione di un bit in un file JPG ha buone possibilità di passare del tutto inosservata, l’alterazione di un bit in una memoria programma causa un errore di esecuzione. Se pensiamo alle applicazioni dell’elettronica alla guida attiva o passiva delle automobili, ci rendiamo conto della potenziale pericolosità. La sensibilità a soft error aumenta con la riduzione della tensione di lavoro e la capacità intrinseca presentata dai singoli nodi del circuito, quest’ultima ridotta a causa del processo di miniaturizzazione, quindi il fenomeno tenderebbe ad accentuarsi con il progredire delle tecniche di fabbricazione.
PREVENIRE E CURARE
l produttori di circuiti integrati già da qualche anno hanno eliminato quasi completamente le sorgenti di soft error locali, dovute a contaminanti presenti nei materiali costituenti i wafer, nel package o nelle leghe di saldatura. Questo è stato ottenuto riducendo la percentuale di contaminanti contenuta nei materiali grezzi ed adottando composti più stabili, non soggetti a decadimento con emissione di neutroni termici. Sono anche stati adottati alcuni accorgimenti nei processi di diffusione, al fine di aumentare la qualità degli strati isolanti e ridurre la circolazione di cariche indesiderate. Purtroppo non c’è la possibilità di ridurre a zero l’incidenza dei raggi cosmici, tali “schermi” appartengono solo alla fantascienza, almeno allo stato attuale delle conoscenze. Una serie di contromisure, presentate nel seguito, sono utilizzabili per mitigarne o assorbirne gli effetti, poiché non è possibile intervenire sulla causa. In passato si puntava ad ottenere circuiti integrati che non cambiano il loro comportamento in presenza di irraggiamento, secondo i processi di selezione definiti “rad hard”. La tendenza moderna è invece volta a mantenere le performance del dispositivo lungo tutta la sua vita utile, accettando quindi un certo degrado dovuto a danni di irraggiamento. Il primo approccio comporterebbe l’utilizzo di tecnologie meno spinte come livello di integrazione, con conseguenti basse performance e costi relativamente elevati, fattori non compatibili con le esigenze di mercato per apparecchiature a larga diffusione. Il secondo approccio consente di utilizzare le tecnologie allo stato dell’arte e sposta l’attenzione a gestire le conseguenze.
A livello di circuito integrato una prima protezione deriva dalla topologia di realizzazione dei circuiti. Si fa ad esempio in modo che celle di memoria appartenenti alla stessa Word non siano fisicamente vicine nel layout su silicio. In questo modo si evita che un singolo evento di interferenza provochi multipli errori, situazione non rilevabile ai circuiti di Error Correction Code (ECC) di primo livello. Il secondo approccio fondamentale è l’implementazione di circuiti ECC direttamente nelle macro celle di memoria (non volatile, statica e dinamica), direttamente nel circuito integrato. Durante le operazioni di scrittura l’algoritmo di codifica ECC include bit di parità che vengono memorizzati insieme al dato. In tutte le operazioni di lettura l’algoritmo ECC, realizzato in hardware, utilizza il bit di parità per determinare se vi sia stata alterazione del dato. In presenza di un errore su singolo bit l’algoritmo ECC ne determina la posizione e provvede alla correzione cambiandone lo stato logico. Un altro livello di protezione è offerto dai meccanismi di interrupt o trap che, attivati dal riconoscimento di un’istruzione illegale, consentono al programma in esecuzione di saltare a routine di recupero e gestione errori o di re-inizializzare il programma.
A livello di sistema è possibile implementare algoritmi ECC più sofisticati. I microprocessori possono trascorrere i tempi morti dell’esecuzione verificando il contenuto della memoria e confrontandolo con firme ottenute in precedenza, per rilevare eventuali errori. I circuiti di watchdog, comunemente implementati per ridurre la suscettibilità elettromagnetica, si rivelano utili anche in questo caso. Essi consentono di re-inizializzare il sistema, uscendo così da situazioni di errore. Per applicazioni critiche quali possono essere i controlli drive-by-wire degli autoveicoli, sono stati introdotti System on Chip che contengono CPU multiple, sincronizzabili nell’esecuzione dello stesso programma ed in grado di rilevare discrepanze nei dati calcolati dalle diverse unità. È quindi possibile mantenere il controllo dell’applicazione mentre si segnala all’utente l’insorgere di un problema (vedi Riferimento 2). E' questa un’applicazione delle tecniche di ridondanza sviluppate in ambito avionica e spazio, resa possibile anche in applicazioni a basso costo e di larga diffusione, grazie al livello di integrazione raggiunto. Il progettista del sistema è quindi in grado di aumentarne la affidabilità con un’opportuna scelta dei componenti fondamentali (microcontrollori) e l’attuazione di meccanismi di protezione hardware e software. La ricerca italiana è stata ed è molto attiva in questo settore, vedi Riferimento 3 per approfondimenti.
Articolo della rivista cartacea Firmware Anno 2015/Numero 114-115