Eric Mclean/Unsplash
Existem milhares de páginas na internet, desde fóruns e redes sociais até sites de compras e bibliotecas online. Contudo, essas páginas podem não durar para sempre — o “erro 404” ilustra esse cenário
Eric Mclean/Unsplash
Uma pesquisa recente sugere que quase 40% de todo o conteúdo já hospedado na internet não existe mais — pelo menos até o final de 2023. Ou seja, esse material não está mais disponível pelos meios oficiais
KATRIN BOLOVTSOVA/Pexels
Segundo uma pesquisa do Pew Research Center, aproximadamente 38% de todo o conteúdo que existia na internet entre 2013 e 2023 não pode mais ser acessado. Se você tentar abrir um desses links, receberá a clássica mensagem de erro 404
Freepick
Esse código indica que o servidor não conseguiu encontrar a página no endereço solicitado, seja porque ela foi removida, alterada sem redirecionamento ou o link está desatualizado
Mizuno K/Pexels
“Se uma biblioteca queima é uma tragédia, mas a maioria dos livros sobrevive em outros lugares. Mas o mundo digital é inerentemente frágil e potencialmente efêmero”, explica Mark Graham, diretor do projeto que cataloga sites da web WayBack Machine, ao site Business Insider
Vlada Karpovich/Pexels
Apesar de não estarem mais acessíveis em seus sites originais, cerca de dois terços dos 38% de páginas da web que desapareceram na última década ainda podem ser encontrados na Wayback Machine. Graham explica que o projeto arquiva mais de 1 bilhão de URLs todos os dias
Darina Belonogova/Pexels
Além da Wayback Machine, que pertence ao Internet Archive, iniciativas como o Common Crawl também estão catalogando bilhões de páginas da web. Dessa forma, mesmo que as iniciativas não consigam registrar todo o histórico da internet, uma parte continuará acessível para consulta
William Fortunato/Pexels