Исследователи из Гарварда получили интересные количественные оценки того, насколько быстро протухают ссылки в интернете — т.е. насколько в сети реально все сохраняется навсегда, как некоторые наивно думают.
Оказалось, что процент протухших ссылок в полумиллионе статей New York Times растёт почти линейно со временем; в материалах 2018 года лишь 6% ссылок сейчас мертвы, а вот в статьях 1998 — уже 72%, то делает невозможной саму идею проверить первоисточники материала.
И, признают авторы, проекты архивирования интернета типа Wayback Machine не сильно помогают: они и близко не покрывают весь массив исчезнувших страниц. И это все ещё без учета соцмедиа, где жизнь постов ещё неконтролируемей.
Конечно, массово растиражированные материалы имеют более высокие шансы на долгую сохранность, но вот как раз редкие и уникальные материалы исчезают в цифровом мире быстро и безвозвратно.
https://www.theverge.com/2021/5/21/22447690/link-rot-research-new-york-times-domain-hijacking