
Image by Bernard Goldbach, from Flickr
Digitális Levéltárosok Dolgoznak a Nyilvános Adatok Megmentésén, Hogy Ne Tűnjenek El
Több mint 30 éve az Internet Archive Wayback Machine-je megőrizte a kutatás szempontjából kritikus kormányzati weboldalakat és adatbázisokat, mint azt a Spectrum új jelentése részletesen bemutatja.
Siet? Itt vannak a fontos tények:
- A Wayback Machine elengedhetetlen kormányzati adatokat tart fenn, amelyek létfontosságú anyagként szolgálnak a tudományos és mérnöki kutatások számára.
- Trump második elnöki ciklusa alatt több mint 8,000 kormányzati weboldal és adatbázis tűnt el a nyilvános hozzáférésből.
- A Harvard Egyetem Library Innovation Labja sikeresen megőrizte a Data.gov gyűjtemény részét képező 311,000 adatkészletet.
Ezek a rekordok, olyan ügynökségektől mint a NASA és a National Science Foundation, alapvető adatokat szolgáltatnak tudósoknak és mérnököknek. Ha eltűnnek, a kutatások érvényessége és a történelmi pontosság veszélybe kerül, ahogy azt a Spectrum is megjegyezte.
A kormányzati adatok eltávolítása nem új jelenség. A 9/11 után a Bush-adminisztráció biztonsági okokból törlött milliókat byte információt. Az Obama-adminisztráció más utat választott, 2009-ben elindította a Data.gov-ot a nyilvános hozzáférés bővítése érdekében, ahogy a Spectrum is beszámolt róla.
Trump első ciklusa alatt az Environmental Data & Governance Initiative kutatói felfedezték, hogy néhány kormányzati weboldal nem volt hozzáférhető, és a “klímaváltozás” kifejezést több oldalról is eltávolították, írja a Spectrum.
Trump második ciklusa alatt adataink megőrzésével kapcsolatos aggodalmak fokozódtak. Februárban a New York Times arról számolt be, hogy több mint 8000 kormányzati weboldalt és adatbázist távolítottak el.
Néhányuk azóta visszakerült, de a Grist változásokat talált, beleértve olyan kifejezések eltávolítását, mint a “klímaváltozás” és a “tiszta energia”. Február 11-én jogi kihívások következtek, egy szövetségi bíró elrendelte bizonyos CDC és FDA adatsorok visszaállítását, ahogy a Spectrum is beszámolt róla.
A veszteség ellen küzdve a digitális archiválók lépéseket tettek. A Harvard Jogtudományi Karának Könyvtár-Innovációs Laboratórium lemásolta a Data.gov teljes 16-terabájtos archívumát – amely több mint 311 000 adatkészletet tartalmaz. Automatizált lekérdezéseket használnak API-kon keresztül, hogy naprakészen tartsák.
Az archiválók létfontosságú szerepet játszanak a tudás megőrzésében azzal, hogy fenntartják a történelmi rekordokat a jövő nemzedékei számára. Hiányuk által okozott létfontosságú információveszteség újraírt közfeljegyzésekhez vezetne, ami korlátozná a jövőbeli kutatási lehetőségeket.
Írj hozzászólást
Mégse