CHIP VULNERABILI ALLO SPACE WEATHER

In tilt per colpa dei raggi cosmici

Presentata oggi a Boston, al meeting dell’American Association for the Advancement of Science, una ricerca della Vanderbilt University sul rischio di danni causati ai circuiti elettronici da particelle energetiche come, per esempio, quelle prodotte dall’impatto dei raggi cosmici con l’atmosfera

In questo grafico, il failure rate, per le ultime tre architetture di semiconduttori (28, 20 e 16 nm), dovuto a single event upset a livello di singolo transistor (linea rossa), di circuito integrato (linea blu) e di intero dispositivo (linea nera). Benché la vulnerabilità dei singoli transistor sia calata significativamente, il loro numero per dispositivo è aumentato ancora di più, rendendo così nel complesso i sistemi comunque più suscettibili a errori. Crediti. Bharat Bhuva, Vanderbilt University

Schaerbeek, Belgio, 18 maggio 2003: giorno di elezioni federali. Sono le 22:30 quando in una delle macchine per il voto elettronico un candidato si ritrova, da un istante all’altro, 4096 voti in più. Uno scatto impossibile, sia per la subitaneità sia, soprattutto, perché quei 4096 elettori proprio non esistono. E un numero, quel 4096, che a chiunque mastichi un po’ di informatica fa subito drizzare le antenne: nei circuiti dei computer, è il valore che corrispondente a un singolo bit, il dodicesimo.

Cinque anni più tardi, sono le 12:40:28 del 7 ottobre 2008, sull’Airbus 330 della Qantas QF72, in volo da Singapore verso Perth, il pilota automatico si disattiva da solo. Di colpo l’aereo perde quota, scendendo di 210 metri in appena 23 secondi. Alcuni membri dell’equipaggio e circa un terzo dei passeggeri riportano lesioni serie al punto da costringere i piloti a un atterraggio nell’aeroporto più vicino per portare i feriti in ospedale.

Due eventi molto diversi fra loro, che sembrerebbero però avere una cosa in comune: la causa. Una causa che arriverebbe da lontano, addirittura dall’esterno del nostro pianeta. E che potrebbe talvolta essere responsabile anche di piccoli – ma comunque spiacevoli – eventi che tutti noi abbiamo sperimentato nella nostra vita quotidiana: quelli che ci costringono a spegnere e riaccendere un dispositivo, per esempio, dall’improvviso e inspiegabile blocco del telefonino alla celebre schermata nota come blue screen of death, che appariva in molti computer quando di colpo il sistema operativo andava in crash.

Tutte anomalie che, in assenza di altre cause (per esempio, bug del software), potrebbero essere spiegate da quelli che gli scienziati chiamano single event upset (Seu): eventi dovuti a una singola particella energetica che fa cambiare lo stato di un singolo bit, come quel dodicesimo bit che avrebbe regalato 4096 voti al candidato belga.

All’origine ci sono raggi cosmici originati al di fuori del Sistema solare: quando, viaggiando a velocità prossime a quella della luce, colpiscono l’atmosfera terrestre, generano una cascata di particelle: neutroni, muoni, pioni e particelle alfa. Particelle innocue, visto che ogni secondo sono milioni quelle che raggiungono il nostro corpo senza alcun effetto nocivo. Indirettamente, però, come dimostra il caso del volo QF72, di danni possono causarne anche loro. Ed è proprio di questo rischio che ha parlato, oggi a Boston, nel corso del meeting annuale della American Association for the Advancement of Science (Aaas), l’ingegnere elettronico della Vanderbilt University Bharat Bhuva.

Rischio derivante dalla vulnerabilità dei circuiti elettronici a queste particelle, e che è possibile quantificare usando come unità di misura il ”fit”: failure in time. Un singolo fit corrisponde a un errore per transistor su un miliardo di ore di calcolo. Può sembrare poco, ma se pensiamo che ognuno dei nostri dispositivi elettronici, di transistor, ne può contenere miliardi, e che a loro volta questi dispositivi – basti pensare agli smartphone – sono miliardi, ecco che il problema diventa statisticamente significativo, considerando che la maggior parte dei componenti elettronici ha un failure rate nell’ordine delle centinaia, se non migliaia, di fit.

«Le società che producono semiconduttori sono molto preoccupate per questo problema, perché aumenta sempre più mano a mano che diminuiscono le dimensioni dei transistor nei chip dei computer e cresce la potenza e la capacità dei sistemi digitali», spiega Bhuva. «Senza contare che i circuiti microelettronici sono ormai ovunque, e ne siamo sempre più dipendenti».

Non solo. Mentre aumentano i dispositivi elettronici e la densità dei transistor al loro interno, rendendo così più probabile che lo stato di uno di essi venga alterato da una particella energetica, si riduce anche la quantità di carica elettrica necessaria a rappresentare uno stato logico: così calano i consumi, ed è una buona notizia, ma cala anche la stabilità. Detto altrimenti, è più facile, per una particella vagante, far cambiare lo stato di un bit da 0 a 1 o viceversa.

E uno scudo protettivo? Più semplice a dirsi che a farsi: per proteggere un circuito dall’impatto di neutroni energetici, occorrerebbe una parete di cemento spessa più di tre metri. Impraticabile. Piuttosto conviene progettare circuiti ridondanti: se per ogni bit i transistor sono tre, quand’anche uno venisse alterato è possibile non solo accorgersene ma anche sapere quale dei tre, visto che è assai improbabile che due particelle colpiscano due transistor della tripletta contemporaneamente. È il caso del triple modular redundancy approach, il sistema adottato dalla Nasa per migliorare l’affidabilità dei computer a bordo delle sonde spaziali.