Erro 404: quase 40% de páginas da internet desapareceram em 10 anos

Eric Mclean/Unsplash

Existem milhares de páginas na internet, desde fóruns e redes sociais até sites de compras e bibliotecas online. Contudo, essas páginas podem não durar para sempre — o “erro 404” ilustra esse cenário

Eric Mclean/Unsplash

Uma pesquisa recente sugere que quase 40% de todo o conteúdo já hospedado na internet não existe mais — pelo menos até o final de 2023. Ou seja, esse material não está mais disponível pelos meios oficiais

KATRIN BOLOVTSOVA/Pexels

Segundo uma pesquisa do Pew Research Center, aproximadamente 38% de todo o conteúdo que existia na internet entre 2013 e 2023 não pode mais ser acessado. Se você tentar abrir um desses links, receberá a clássica mensagem de erro 404

Freepick

Esse código indica que o servidor não conseguiu encontrar a página no endereço solicitado, seja porque ela foi removida, alterada sem redirecionamento ou o link está desatualizado

Mizuno K/Pexels

“Se uma biblioteca queima é uma tragédia, mas a maioria dos livros sobrevive em outros lugares. Mas o mundo digital é inerentemente frágil e potencialmente efêmero”, explica Mark Graham, diretor do projeto que cataloga sites da web WayBack Machine, ao site Business Insider

Vlada Karpovich/Pexels

Apesar de não estarem mais acessíveis em seus sites originais, cerca de dois terços dos 38% de páginas da web que desapareceram na última década ainda podem ser encontrados na Wayback Machine. Graham explica que o projeto arquiva mais de 1 bilhão de URLs todos os dias

Darina Belonogova/Pexels

Além da Wayback Machine, que pertence ao Internet Archive, iniciativas como o Common Crawl também estão catalogando bilhões de páginas da web. Dessa forma, mesmo que as iniciativas não consigam registrar todo o histórico da internet, uma parte continuará acessível para consulta

William Fortunato/Pexels