Lo scorso dicembre all’AGU’s Fall Meeting di San Francisco, ho presentato un poster senza uno straccio di nuova scienza. Eppure potrebbe rivelarsi la presentazione di maggior impatto che ho fatto.
Con il poster, diversi colleghi e io abbiamo introdotto WALDO al mondo. WALDO, o l’archivio mondiale di dati a bassa frequenza e osservazioni, è un grande – e crescente – tesoro di dati radio a bassa frequenza (0,5 a 50 kilohertz) raccolti nel corso di decenni in siti di tutto il mondo. Mark Golkowski dell’Università del Colorado Denver (CU Denver) e io gestiamo insieme il database.
Questi dati hanno tutti i tipi di usi in geofisica, compreso il rilevamento e la caratterizzazione dei fulmini, il rilevamento remoto di fenomeni ionosferici e magnetosferici e il rilevamento di brillamenti solari, lampi di raggi gamma e onde di gravità. Fino a poco tempo fa, tuttavia, i dati su WALDO sono stati accumulati e memorizzati principalmente su decine di migliaia di DVD e quindi sono stati in gran parte inaccessibili a chiunque fosse interessato a usarli.
Il nostro obiettivo con WALDO è quello di trasferire e organizzare questi dati storici, aumentati con la raccolta di dati in corso, in un unico, standardizzato repository basato su cloud in modo che gli scienziati di oggi e in futuro possano accedervi e metterli a frutto negli studi sui fulmini, la ionosfera, la magnetosfera, il tempo spaziale e altro.
La scienza dell’ELF/VLF
Ogni milione di fulmini al giorno sulla Terra rilascia un impulso intenso, lungo circa 1 millisecondo, di energia radio a frequenza estremamente bassa o molto bassa (ELF/VLF) nota come sferica. Queste sferiche riflettono dalla ionosfera inferiore (60-90 chilometri di altitudine) e dalla terra, permettendo loro di viaggiare – ed essere rilevate – a livello globale. Una manciata di ricevitori VLF sparsi in tutto il mondo può geolocalizzare la maggior parte dei lampi con incredibile precisione a livello chilometrico. Il rilevamento sferico può anche essere utilizzato per caratterizzare le proprietà elettriche della ionosfera inferiore tra la sorgente e un ricevitore distante.
I radiofari a banda stretta usati dalla Marina degli Stati Uniti, nominalmente per le comunicazioni sottomarine, trasmettono anche nella banda di frequenza ELF/VLF, fornendo un altro mezzo di rilevamento remoto ionosferico. Anche se questi messaggi sono criptati per sicurezza, i segnali radio stessi sono un utile diagnostico ionosferico che può essere raccolto ovunque sulla Terra. I cambiamenti nelle condizioni ionosferiche, vale a dire la densità degli elettroni, si manifestano come cambiamenti nell’ampiezza o nella fase dei segnali ricevuti. A sua volta, la ionosfera può essere utilizzata come sensore per monitorare tutti i tipi di fenomeni geofisici, compresi i brillamenti solari, la precipitazione di elettroni dalla magnetosfera, le eclissi solari, il riscaldamento legato ai fulmini, i raggi gamma cosmici, le onde gravitazionali e molto altro. Ognuno di questi fenomeni disturba i segnali VLF che si propagano sotto la ionosfera in modi diversi – influenzando la velocità con cui un disturbo inizia e finisce, per esempio – e queste firme permettono di distinguerli l’uno dall’altro. Alcuni disturbi ionosferici sono molto affidabili e ripetibili, come l’effetto del sole che sorge e tramonta.
Alcuna energia ELF/VLF sfugge anche nella magnetosfera (come onde di plasma generate da un fulmine chiamate whistlers), dove può interagire con elettroni energetici intrappolati nella fascia di radiazione della Terra e innescare la precipitazione di elettroni nell’atmosfera. Le onde ELF/VLF sono anche generate e accelerate nella magnetosfera (come onde chiamate chorus e hiss) come risultato delle interazioni onda-particella e quindi giocano un ruolo nella dinamica del tempo spaziale sulla Terra. Lo studio delle onde radio ELF/VLF ci permette sia di studiare e comprendere meglio questi processi sia di mettere insieme i misteri di ciò che accade durante gli eventi meteorologici spaziali e le tempeste geomagnetiche.
Questi usi dei dati ELF/VLF, rivisti, per esempio, da Barr et al. , Inan et al. e Silber e Price, sono stati sviluppati dalla fine del 1800, quando i segnali naturali ELF/VLF potevano essere ascoltati accoppiandosi in lunghe linee telegrafiche. Ma un certo numero di altre applicazioni al di fuori degli usi tradizionali dei dati ELF/VLF sono spuntate di recente. Per esempio, il rilevamento di oggetti all’interno di scatole metalliche utilizzando onde ELF/VLF potrebbe essere utilizzato per scoprire un nascondiglio di armi nascosto all’interno di un container.
In collaborazione con un gruppo di ricerca sulla cybersicurezza presso il Georgia Institute of Technology (Georgia Tech), i colleghi ed io stiamo anche utilizzando i dati ELF/VLF per aumentare la sicurezza della rete elettrica contro i cyberattacchi, come il grande attacco in Ucraina nel dicembre 2015 in cui gli hacker hanno disattivato più sottostazioni elettriche. I dati ELF/VLF rilevati dai ricevitori radio possono essere utilizzati per monitorare i segnali della rete elettrica per le irregolarità. Questi dati sono anche disseminati di sferiche da lampi in tutto il mondo, che arrivano ai ricevitori in tempi quasi casuali come i fulmini. La natura fornisce così un efficace e rilevabile generatore di numeri casuali che, poiché i lampi non possono essere previsti in anticipo, ci permette di convalidare l’integrità degli altri dati rilevati dai ricevitori.
Sviluppo di WALDO
Il database WALDO – attualmente circa 200 terabyte e in crescita quotidiana – contiene già o conterrà presto dati che potrebbero arricchire gli studi di tutti i fenomeni e le applicazioni di cui sopra. Gran parte dei dati sono stati raccolti da ricevitori ELF/VLF dell’Università di Stanford e, più recentemente, da nuovi siti distribuiti da Georgia Tech e CU Denver.
.
.
WALDO include anche registrazioni ELF/VLF da esperimenti effettuati come parte del High-frequency Active Auroral Research Program (HAARP) in Alaska , che ha eseguito esperimenti per studiare la ionosfera ad alta latitudine dalla metà degli anni ’90. Include molti anni di dati dalla stazione Palmer sulla penisola antartica. E alla fine includerà molti dati dal famoso esperimento ELF della Siple Station, che ha funzionato dal 1973 al 1988 per studiare l’amplificazione e l’innesco di segnali ELF nella magnetosfera utilizzando un’antenna di 42 chilometri in Antartide. Entro la fine dell’anno, prevediamo di avere 500-1.000 terabyte di dati disponibili.
Lo sforzo di compilare questi insiemi di dati disparati in un unico database è iniziato nell’autunno 2018, quando lo spazio all’Università di Stanford dove questi dati erano fisicamente memorizzati su circa 80.000 DVD e CD e su un server gravemente danneggiato, ha dovuto essere liberato. I dischi, alcuni dei quali erano danneggiati dopo decenni di conservazione, sono stati imballati e spediti alla Georgia Tech o alla CU Denver, dove i robot che leggono i DVD e che possono strappare una pila di 300 dischi alla volta vengono utilizzati per spostare i dati su dischi rigidi. Nel frattempo, John DeSilva a Stanford ha lentamente estratto il contenuto del vecchio server e ha messo quei dati in un cloud storage temporaneo per noi da recuperare.
Dopo il recupero, i dati vengono passati attraverso uno schema di ordinamento digitale che aggiorna la formattazione in modo che sia tutto coerente e poi mette i dati in cartelle ordinate. Abbiamo sviluppato un’interfaccia online che permette un facile accesso ai dati, che possono anche essere condivisi con chiunque abbia un account Google su richiesta. Attraverso il sito web, gli utenti possono visualizzare i grafici quick-look generati automaticamente per rendere facile scoprire ciò che è disponibile, per esempio, le mappe dei siti riceventi da cui sono disponibili i dati di un dato giorno, i calendari annuali che mostrano la disponibilità dei dati e i grafici riassuntivi dei dati giorno per giorno.
Il valore dei dati polverosi
Il lavoro di conservazione dei dati è duro e richiede tempo, ma anche gratificante. Abbiamo visto la prova di questo in molti campi. Le serie di dati storici e a lungo termine sono state fondamentali negli studi sul clima e sugli ecosistemi, per esempio, gettando luce non solo sulle condizioni passate ma anche sul presente e sul futuro. E grazie agli sforzi di conservazione, abbiamo la fortuna di avere dati sulle macchie solari che risalgono a più di 400 anni fa – dati che sono alla base delle prime scoperte cruciali delle dinamiche meteorologiche spaziali.
Quando ero al terzo anno a Stanford nel gennaio 2002, mi sono avvicinato a uno dei miei professori, Umran Inan, e gli ho chiesto se potevo essere coinvolto nella ricerca. Sospetto che non si aspettasse molto da uno studente che aveva appena preso una C nel suo corso. Giorni dopo mi ritrovai in un magazzino polveroso e quasi abbandonato vicino al Dish di Stanford, a rovistare tra nastri magnetici Betamax e Ampex vecchi di 15 anni pieni di dati radio ELF/VLF. I nastri erano ancora infilati nelle loro scatole di cartone originali ed erano allineati su scaffali impilati a 5 metri di altezza in diverse file, ciascuna lunga probabilmente 30 metri. Perché ero lì?
Nel 1994, esplosioni di raggi gamma ad alta energia chiamati lampi di raggi gamma terrestri (TGF) sono stati scoperti serendipitously dallo spazio. Sembrava che i TGF avessero origine dai fulmini, ma questo era praticamente tutto quello che sapevamo su di loro. I dati ELF/VLF possono essere utilizzati per caratterizzare il fulmine che ha causato il fenomeno, ma gli scienziati avevano in mano solo due esempi di TGF che potevano essere collegati direttamente con il fulmine tramite i dati ELF/VLF. Il mio compito era quello di trovare altri esempi nascosti nei dati di tutti quei nastri.
Mentre tossivo via le ragnatele, pensavo a tutta la fatica che la gente aveva fatto per mantenere questi nastri Betamax (un formato ormai obsoleto anche allora). I dati che stavo esaminando erano registrati alla stazione Palmer, in Antartide, da un ricevitore montato su un ghiacciaio mobile che era attentamente sorvegliato da un tecnico scientifico a tempo pieno e revisionato ogni anno da uno studente del gruppo. Con ogni viaggio in barca dalla stazione, i nastri venivano spediti in grandi scatole, poi impilati e conservati in questo spazio infestato dai roditori, il tutto finanziato dai dollari dei contribuenti americani attraverso la National Science Foundation. E questo tipo di raccolta dati andava avanti da decenni nei siti di tutto il mondo gestiti da questo gruppo di ricerca.
Living Data Sets
“Ne valeva la pena? Ho pensato mentre lavoravo in quel magazzino. La risposta, come ho scoperto, è un sì inequivocabile (e non solo perché questi dati hanno portato ai miei primi articoli di ricerca con revisione paritaria e mi hanno aiutato a mettere il piede nella porta della ricerca). Ho imparato che gli insiemi di dati geofisici sono vivi e che il loro valore intellettuale si sposta come le nostre priorità scientifiche.
Quando le misure registrate su quei nastri Betamax sono state ottenute, nessuno immaginava di averne bisogno per studiare i TGF; le misure sono state originariamente raccolte per altri motivi. Sarebbe stato facile buttare via i dati prima che si rivelassero utili per lo studio dei TGF – o anche dopo. Dopo l’uso di nastri Betamax, siamo passati alla registrazione di dati digitali su CD, poi su DVD, poi su dischi rigidi esterni, poi su un grande server di dati e ora li stiamo spostando nel cloud. Ad ogni passo, abbiamo dovuto trascinare tutti i dati accumulati dai vecchi media nel presente. Ma poiché questi dati non sono stati scartati, sono ancora oggi disponibili per studiare numerosi fenomeni e processi naturali.
È giusto chiedersi se ne valga la pena, viste le spese e gli sforzi. Io penso di sì. Non si sa mai come potrebbero essere utilizzati questi dati. Non mi sarei mai aspettato che i dati dei fulmini geofisici avessero un impatto nel mondo della cybersecurity, per esempio. Oggi stiamo vedendo il calcolo ad alte prestazioni e l’apprendimento automatico rivelare nuove intuizioni da vecchi dati, e i progetti interdisciplinari spesso trovano usi sorprendenti per serie di dati storici. In un futuro non troppo lontano, sospetto che qualcuno penserà a un nuovo modo di guardare i dati ELF/VLF raccolti un decennio fa. Ma i dati saranno ancora disponibili?
Lo dobbiamo ai futuri scienziati e ai contribuenti statunitensi, che hanno finanziato gran parte di questo lavoro, per garantire che siano disponibili. Da quando abbiamo annunciato WALDO a dicembre, abbiamo ricevuto diverse richieste e notifiche da persone che utilizzano il database. La nostra speranza è che conservando questi dati in WALDO, apriremo le porte a scoperte sorprendenti e inaspettate.