Dit afgelopen december op AGU’s Fall Meeting in San Francisco, presenteerde ik een poster met niet een greintje nieuwe wetenschap op het. Toch zou het wel eens de presentatie met de meeste impact kunnen blijken te zijn die ik ooit heb gemaakt.
Met de poster hebben een aantal collega’s en ik WALDO aan de wereld voorgesteld. WALDO, of het Wereldwijd Archief van Low-frequency Data en Observaties, is een grote-en groeiende-trove van lage-frequentie (0,5 tot 50 kilohertz) radiogegevens verzameld over decennia op sites over de hele wereld. Mark Golkowski van de Universiteit van Colorado Denver (CU Denver) en ik beheren samen de database.
Dergelijke gegevens hebben allerlei toepassingen in de geofysica, met inbegrip van bliksemdetectie en -karakterisering, remote sensing van ionosferische en magnetosferische verschijnselen, en detectie van zonnevlammen, gammastraalflitsen, en zwaartekrachtgolven. Tot voor kort werden de gegevens van WALDO echter verzameld en opgeslagen op tienduizenden DVD’s – en waren dus grotendeels ontoegankelijk voor iedereen die ze wilde gebruiken.
Ons doel met WALDO is om deze historische gegevens, aangevuld met lopende gegevensverzameling, over te brengen en te organiseren in een enkele, gestandaardiseerde cloud-gebaseerde opslagplaats, zodat wetenschappers vandaag en in de toekomst er toegang toe kunnen krijgen en ze kunnen gebruiken voor onderzoek naar bliksem, de ionosfeer, de magnetosfeer, ruimteweer, en meer.
De wetenschap van ELF/VLF
Elke van de miljoenen blikseminslagen per dag op aarde laat een intense, ruwweg 1 milliseconde lange puls van extreem lage frequentie tot zeer lage frequentie (ELF/VLF) radio-energie los, bekend als een sferische. Deze sferische energie weerkaatst in de lagere ionosfeer (60-90 kilometer hoogte) en van de grond, waardoor zij zich over de hele wereld kan verplaatsen – en worden gedetecteerd. Een handvol VLF-ontvangers, verspreid over de hele wereld, kunnen de meeste bliksemflitsen met een ongelofelijke nauwkeurigheid op kilometerniveau lokaliseren. Met behulp van sferische detectie kunnen ook de elektrische eigenschappen van de lagere ionosfeer tussen de bron en een verre ontvanger worden gekarakteriseerd.
Narrowbandbakens die door de Amerikaanse marine worden gebruikt, in eerste instantie voor communicatie met onderzeeërs, zenden ook uit in de ELF/VLF-frequentieband, waardoor een ander middel voor ionosferische teledetectie wordt geboden. Hoewel deze berichten om veiligheidsredenen gecodeerd zijn, vormen de radiosignalen zelf een nuttige ionosferische diagnostiek die overal op aarde kan worden opgepikt. Veranderingen in de omstandigheden in de ionosfeer, namelijk de elektronendichtheid, uiten zich in veranderingen in de amplitude of de fase van de ontvangen signalen. De ionosfeer kan op zijn beurt worden gebruikt als sensor om allerlei geofysische verschijnselen te monitoren, waaronder zonnevlammen, elektronenneerslag uit de magnetosfeer, zonsverduisteringen, bliksemverwarming, kosmische gammastralen, zwaartekrachtgolven, en nog veel meer. Elk van deze verschijnselen verstoort VLF-signalen die zich onder de ionosfeer voortplanten op verschillende manieren – het beïnvloedt bijvoorbeeld hoe snel een verstoring begint en eindigt – en deze signaturen maken het mogelijk ze van elkaar te onderscheiden. Sommige verstoringen in de ionosfeer zijn zeer betrouwbaar en herhaalbaar, zoals het effect van het opkomen en ondergaan van de Zon.
Enige ELF/VLF-energie ontsnapt ook naar de magnetosfeer (als door bliksem opgewekte plasmagolven die fluiters worden genoemd), waar zij kan interageren met gevangen energetische elektronen in de stralingsgordel van de Aarde en neerslag van elektronen in de atmosfeer teweeg kan brengen. ELF/VLF-golven worden ook gegenereerd en versneld in de magnetosfeer (als golven die chorus en hiss worden genoemd) als gevolg van golf-deeltje interacties en spelen zo een rol in de dynamica van het ruimteweer op aarde. Het bestuderen van ELF/VLF radiogolven stelt ons in staat om zowel deze processen te bestuderen en beter te begrijpen als om mysteries te ontrafelen over wat er gebeurt tijdens ruimteweergebeurtenissen en geomagnetische stormen.
Deze toepassingen van ELF/VLF gegevens, besproken door bijvoorbeeld Barr et al. , Inan et al. , en Silber en Price , zijn ontwikkeld sinds het einde van de 19e eeuw, toen natuurlijke ELF/VLF signalen konden worden gehoord door koppeling in lange telegraaflijnen. Maar een aantal andere toepassingen buiten de traditionele toepassingen van ELF/VLF-gegevens zijn recentelijk ook opgedoken. Zo zou de detectie van voorwerpen in metalen dozen met behulp van ELF/VLF-golven kunnen worden gebruikt om een verborgen wapenopslagplaats in een scheepscontainer te ontdekken.
In samenwerking met een onderzoeksgroep voor cyberbeveiliging aan het Georgia Institute of Technology (Georgia Tech) gebruiken collega’s en ik ELF/VLF-gegevens ook om de beveiliging van het elektriciteitsnet tegen cyberaanvallen te verbeteren, zoals de grote aanval in Oekraïne in december 2015, waarbij hackers meerdere elektrische onderstations uitschakelden. ELF/VLF-gegevens die door radio-ontvangers worden gedetecteerd, kunnen worden gebruikt om signalen van het elektriciteitsnet te controleren op onregelmatigheden. Deze gegevens zijn ook bezaaid met sferische signalen van bliksemflitsen over de hele wereld, die op quasi-willekeurige tijdstippen bij ontvangers aankomen wanneer de bliksem zich voordoet. De natuur levert dus een effectieve en detecteerbare willekeurige getallengenerator die, omdat bliksemflitsen niet van tevoren kunnen worden voorspeld, ons in staat stelt de integriteit van andere door de ontvangers gedetecteerde gegevens te valideren.
Ontwikkeling van WALDO
De WALDO-database – momenteel ongeveer 200 terabyte en dagelijks groeiend – bevat al gegevens of zal dat binnenkort doen, die het onderzoek naar alle bovengenoemde verschijnselen en toepassingen kunnen verrijken. Veel van de gegevens zijn verzameld door ELF/VLF-ontvangers van Stanford University en, meer recentelijk, door nieuwe sites van Georgia Tech en CU Denver.
.
.
WALDO bevat ook ELF/VLF-opnamen van experimenten die zijn uitgevoerd als onderdeel van het High-frequency Active Auroral Research Program (HAARP) in Alaska , dat sinds het midden van de jaren negentig experimenten uitvoert om de ionosfeer op grote hoogte te bestuderen. Het omvat vele jaren gegevens van Palmer Station op het Antarctisch schiereiland. En uiteindelijk zullen er veel gegevens in worden opgenomen van het beroemde Siple Station ELF-experiment, dat van 1973 tot 1988 liep om de versterking en triggering van ELF-signalen in de magnetosfeer te bestuderen met behulp van een 42 km lange antenne op Antarctica. Tegen het einde van het jaar verwachten we 500-1.000 terabytes aan gegevens beschikbaar te hebben.
De inspanning om deze ongelijksoortige gegevenssets te compileren in een enkele database begon in de herfst van 2018, toen de ruimte aan de Stanford University waar deze gegevens fysiek waren opgeslagen-ongeveer 80.000 dvd’s en cd’s en op één zwaar beschadigde server-moest worden opgeruimd. De schijven, waarvan sommige beschadigd waren na tientallen jaren opslag, werden ingepakt en verscheept naar Georgia Tech of CU Denver, waar dvd-leesrobots die een stapel van 300 schijven tegelijk kunnen rippen, worden gebruikt om de gegevens naar harde schijven te verplaatsen. Ondertussen heeft John DeSilva in Stanford langzaam de inhoud van de oude server eruit gehaald en die gegevens in tijdelijke cloud-opslag geplaatst zodat wij ze kunnen ophalen.
Na het ophalen worden de gegevens door een digitaal sorteerschema gehaald dat de formattering bijwerkt zodat alles consistent is en dan de gegevens in gesorteerde mappen plaatst. Wij hebben een online interface ontwikkeld die gemakkelijk toegang geeft tot de gegevens, die op verzoek ook kunnen worden gedeeld met iedereen met een Google-account. Via de website kunnen gebruikers automatisch gegenereerde quick-look plots bekijken om gemakkelijk te weten te komen wat er beschikbaar is, bijvoorbeeld kaarten van ontvangstlocaties waarvan gegevens van een bepaalde dag beschikbaar zijn, jaarkalenders met de beschikbaarheid van gegevens en samenvattende grafieken van de gegevens op dagbasis.
De waarde van stoffige gegevens
Het werk om gegevens te bewaren is hard en tijdrovend, maar ook lonend. We hebben dit op veel gebieden gezien. Historische en langetermijngegevens zijn bijvoorbeeld van cruciaal belang geweest voor het onderzoek naar klimaat en ecosystemen, omdat zij niet alleen licht hebben geworpen op de omstandigheden in het verleden, maar ook op het heden en de toekomst. En dankzij conserveringsinspanningen hebben we het geluk zonnevlekgegevens te hebben die meer dan 400 jaar teruggaan – gegevens die ten grondslag liggen aan cruciale vroege ontdekkingen van de dynamiek van het ruimteweer.
Als junior op Stanford in januari 2002 benaderde ik een van mijn professoren, Umran Inan, met de vraag of ik bij het onderzoek betrokken kon worden. Ik vermoed dat hij niet veel verwachtte van een student die net een C had gehaald in zijn klas. Dagen later bevond ik me in een stoffig, bijna verlaten pakhuis in de buurt van het Stanford Dish, waar ik 15 jaar oude Betamax- en Ampex-magneetbanden doorzocht die vol zaten met ELF/VLF-radiogegevens. De banden zaten nog in hun originele kartonnen dozen en lagen op planken van 5 meter hoog in verschillende rijen, elk waarschijnlijk 30 meter lang. Waarom was ik daar?
In 1994 werden bij toeval vanuit de ruimte uitbarstingen van hoogenergetische gammastralen ontdekt, de zogeheten terrestrial gamma ray flashes (TGF’s). Het bleek dat TGF’s hun oorsprong vonden in bliksem, maar dat was zo’n beetje alles wat we erover wisten. ELF/VLF-gegevens kunnen worden gebruikt om de bliksem te karakteriseren die het verschijnsel heeft veroorzaakt, maar wetenschappers hadden slechts twee voorbeelden van TGF’s die via ELF/VLF-gegevens direct met bliksem in verband konden worden gebracht. Mijn taak was om meer voorbeelden te vinden die verborgen waren in de gegevens op al die banden.
Terwijl ik de spinnenwebben weghoestte, dacht ik aan alle moeite die mensen hadden gedaan om deze Betamax-banden (toen al een verouderd formaat) te laten lopen. De gegevens die ik aan het bekijken was, waren opgenomen in Palmer Station, Antarctica, door een ontvanger die op een schuivende gletsjer was gemonteerd, zorgvuldig in de gaten werd gehouden door een voltijds wetenschapstechnicus en elk jaar door een student van de groep werd onderhouden. Bij elke boottocht vanaf het station werden de banden in grote dozen verscheept, dan gestapeld en opgeslagen in deze door knaagdieren geteisterde ruimte – allemaal gefinancierd door Amerikaanse belastingbetalers via de National Science Foundation. En dit soort gegevensverzameling was al tientallen jaren aan de gang op locaties over de hele wereld, onderhouden door deze onderzoeksgroep.
Living Data Sets
“Was het het waard?” Dacht ik terwijl ik ploeterde in dat pakhuis. Het antwoord, zo kwam ik te weten, is een ondubbelzinnig ja (en niet alleen omdat deze gegevens leidden tot mijn eerste peer-reviewed onderzoekspapers en me hielpen mijn voet tussen de deur van het onderzoek te krijgen). Ik heb geleerd dat geofysische datasets levend zijn en dat hun intellectuele waarde verschuift naarmate onze wetenschappelijke prioriteiten dat doen.
Toen de metingen op die Betamax-banden werden verkregen, had niemand in gedachten dat we ze uiteindelijk nodig zouden hebben om TGFs te bestuderen; de metingen werden oorspronkelijk om andere redenen verzameld. Het zou gemakkelijk zijn geweest de gegevens weg te gooien voordat zij nuttig bleken te zijn voor het bestuderen van TGF’s – of zelfs daarna. Na het gebruik van Betamax-banden zijn we overgestapt op het opnemen van digitale gegevens op CD’s, vervolgens op DVD’s, vervolgens op externe harde schijven, vervolgens op een grote dataserver, en nu zijn we bezig ze naar de cloud te verplaatsen. Bij elke stap moesten we alle verzamelde gegevens van oude media naar het heden slepen. Maar omdat deze gegevens niet zijn weggegooid, zijn ze vandaag de dag nog steeds beschikbaar voor het bestuderen van talloze natuurverschijnselen en -processen.
De vraag is gerechtvaardigd of het de moeite waard is, gezien de kosten en moeite. Ik denk het wel. Je weet nooit hoe deze gegevens gebruikt kunnen worden. Ik had bijvoorbeeld nooit verwacht dat geofysische bliksemgegevens van invloed zouden zijn in de wereld van de cyberveiligheid. Tegenwoordig zien we dat high-performance computing en machine learning nieuwe inzichten opleveren uit oude gegevens, en dat interdisciplinaire projecten vaak verrassende toepassingen vinden voor historische datasets. Ik vermoed dat in de niet al te verre toekomst iemand een nieuwe manier zal bedenken om naar ELF/VLF-gegevens te kijken die tien jaar geleden zijn verzameld. Maar zullen die gegevens nog wel beschikbaar zijn?
We zijn het aan toekomstige wetenschappers verplicht – en aan de Amerikaanse belastingbetalers, die veel van dit werk hebben gefinancierd – ervoor te zorgen dat ze beschikbaar zijn. Sinds de aankondiging van WALDO in december, hebben we verschillende vragen en meldingen gekregen van mensen die de database gebruiken. Onze hoop is dat door het bewaren van deze gegevens in WALDO, we deuren zullen openen voor verrassende en onverwachte ontdekkingen.