
Image by Bernard Goldbach, from Flickr
Дигитални архивисти работят за запазване на публични данни от изчезване
В продължение на повече от 30 години, Интернет архивът на Wayback Machine съхранява правителствени уебсайтове и бази данни, от съществено значение за изследванията, както е подробно описано в нов доклад от Spectrum.
Нямате много време? Ето някои бързи факти:
- Машина на времето (Wayback Machine) поддържа съществена правителствена информация, която служи като ключов материал за научни и инженерни изследвания.
- По време на втория президентски мандат на Тръмп повече от 8,000 правителствени уеб страници и бази данни изчезнаха от публичния достъп.
- Иновационната библиотека в Харвардския университет успешно запази 311,000 набора от данни, които бяха част от колекцията Data.gov.
Тези записи, от агенции като NASA и Националната научна фондация, предоставят съществена информация за учените и инженерите. Ако изчезнат, валидността на изследванията и историческата точност са застрашени, както е отбелязано от Spectrum.
Премахването на данни от страна на правителството не е ново явление. След 9/11, администрацията на Буш изтри милиони байтове информация поради съображения за сигурност. Администрацията на Обама избра друг подход, стартирайки Data.gov през 2009 година, за да разшири обществения достъп, както е докладвано от Spectrum.
По време на първия мандат на Тръмп, изследователи от Инициативата за управление на околната среда и данни установиха, че някои правителствени уебсайтове са недостъпни, а позоваванията към „климатичните промени“ бяха изтрити от множество страници, казва Spectrum.
По време на втория мандат на Тръмп, тревогите относно запазването на данни се ескалираха. През февруари, New York Times съобщи, че повече от 8,000 правителствени уеб страници и бази данни бяха свалени.
Някои от тях оттогава са се появили отново, но Grist откри промени, включително премахването на термини като „климатични промени“ и „чиста енергия“. На 11 февруари последваха правни спорове, федерален съдия нареди възстановяването на определени набори от данни на CDC и FDA, както бе съобщено от Spectrum.
За да противодействат на тази загуба, дигиталните архивисти предприемат действия. Лабораторията за иновации в библиотеката при Харвардския юридически факултет е копирала целия архив на Data.gov – обемът на данните е 16 терабайта и съдържа над 311,000 набора от данни. Те използват автоматизирани заявки чрез API, за да го актуализират ежедневно.
Архивистите играят жизненоважна роля в опазването на знанието, като поддържат историческите записи за бъдещи поколения. Загубата на съществена информация поради тяхното отсъствие би довела до преписване на обществените записи, което би ограничило възможностите за бъдещи изследвания.
Оставете коментар
Прекрати