DescriçãoWayback Machine – Arquivo da Internet
Às vezes, pode ser útil descobrir como era um site no passado ou revisar o conteúdo de uma página da web antiga que não está disponível no momento.
Wayback Machine é um serviço online oferecido pelo Internet Archive que permite que você volte através de arquivos da Internet e acesse instantâneos anteriores de sites.
Mais de 729 bilhões de páginas da web já foram rastreadas e arquivadas pela Wayback Machine do Internet Archive. Para acessá-lo, basta digitar o nome de domínio do site que você está procurando ou uma palavra-chave correspondente.
O que é Wayback Machine?
Wayback Machine é um dos serviços oferecidos pelo Internet Archive. Foi lançado em 2001 e é o serviço da organização mais utilizado entre os internautas.
É uma ferramenta que permite “voltar no tempo” para saber como era um site em um momento no passado.
Atualmente, a Wayback Machine continua sendo um dos arquivos digitais mais ricos, com bilhões de páginas da web arquivadas desde 1996.
O objetivo da organização (Internet Archive) é ajudar a preservar artefatos digitais e fornecer uma biblioteca de acesso público na Internet para estudiosos, historiadores e pesquisadores.
Para isso, a ferramenta oferece um recurso de adicionar páginas para permitir que os proprietários de sites façam o autoarquivamento de suas páginas na plataforma.
No entanto, as páginas podem levar entre 6 e 24 meses para aparecer na Wayback Machine após serem coletadas.
Além disso, o Internet Archive não arquiva:
- As páginas cujo acesso requer uma senha
- Páginas designadas por seu proprietário como “excluídas dos robôs”
- Páginas que só são acessíveis quando o usuário precisa preencher um formulário
- E páginas hospedadas em servidores seguros.
Além das páginas que podem ser adicionadas pelos próprios donos dos sites, o Internet Archive também trabalha com instituições para disponibilizar todas as informações disponíveis em seu banco de dados.
Wayback Machine: Como usar a ferramenta para encontrar instantâneos históricos de um site?
Wayback Machine é uma ferramenta acessível a todos e muito fácil de usar.
- Para utilizá-lo, basta acessar a página inicial doArchive.org
- Se você souber o URL completo do site que está procurando, poderá digitá-lo na barra de pesquisa do site.
Caso contrário, o Wayback Machine também oferece um recurso de pesquisa por palavra-chave.
- Basta inserir uma palavra-chave relacionada à página inicial do site que você está procurando e clicar em iniciar sua consulta.
- A plataforma deve mostrar uma lista de resultados que correspondem à sua pesquisa. Clique em um resultado para acessar as fotos do site correspondente.
Por padrão, o Wayback Machine exibe o instantâneo do ano atual, mas também oferece um sistema de navegação que permite voltar no tempo e ver rapidamente como o site era nos últimos anos.
Mas para melhor visualização, você tem um link para exibir a lista de todas as capturas arquivadas do site com um calendário para acessar mais facilmente a renderização do site em uma data passada específica.
Ao passar o mouse sobre uma determinada data, o Wayback Machine oferece automaticamente uma lista de horários do dia nos quais você pode clicar para acessar o instantâneo do site exatamente naquele horário específico.
Wayback Machine: recursos avançados
Wayback Machine é a priori adequado para pesquisadores com uma série de recursos que podem passar despercebidos por usuários casuais:
Referência a uma página arquivada : Com o Wayback Machine, é possível fazer referência facilmente a instantâneos de páginas da Web arquivadas em seu próprio conteúdo, inserindo seus URLs.
Salve suas páginas nos arquivos da Wayback Machine:Com o recurso “Salvar página agora”, Wayback Machine também permite que proprietários de sites salvem algumas de suas páginas no arquivo deArquivo da Internet.
Aqui está o procedimento a seguir para registrar suas páginas da Web no Wayback Machine:
- Ir para a página inicial deWayback Machine
- Na parte inferior da página, você tem um campo chamado “Salvar página agora”. Digite o endereço URL da página que deseja salvar e clique no botão “Salvar página”.
Sua página acaba de ser adicionada ao arquivo Wayback Machine.
Use um operador de pesquisa para encontrar rapidamente uma página na Wayback Machine:Com o Wayback Machine, você pode pesquisar conteúdo específico sem ter que visitar o site todas as vezes.
A ferramenta oferece um operador de busca no formato “ https://web.archive.org/*/www.votresite.com/* » que você pode inserir diretamente em seu navegador e acessar instantâneos arquivados de um site.
Por exemplo, para ver as páginas de Twaino salvas na Wayback Machine, basta pesquisar no Googlehttps://web.archive.org/*/www.twaino.com/*
Wayback Machine: API e versões de aplicativos móveis e extensões de navegador
A Wayback Machine não é apenas uma ferramenta da web. Você também pode obtê-lo em versão móvel em seu telefoneiOS ou Android.
Wayback Machine também existe como uma extensão que você pode instalar e usar em navegadorescromada,Raposa de fogo,Ópera E Safári.
Para desenvolvedores, a ferramenta também oferece diferentesAPI para acessar seu banco de dados.
Simplificando, o Wayback Machine é a plataforma perfeita para revisitar as aparições anteriores de seus sites favoritos em praticamente qualquer mídia.
É também uma ferramenta que pode ser útil para estudantes e profissionais que buscam informações sobre a história de um site.
Wayback Machine: Como excluir suas páginas da web do arquivo Wayback Machine?
1. Medida Preventiva: Bloquear o Acesso à Wayback Machine
É possível remover suas informações do Wayback Machine para que as páginas do seu site que estão arquivadas não sejam mais acessíveis no Internet Archive.
No entanto, é um processo complicado que pode levar muito tempo. É por isso que, se você tiver páginas confidenciais que não deseja que sejam arquivadas pelo Wayback Machine, poderá tomar medidas agora para impedir que a ferramenta acesse seu site.
Para evitar que o Wayback Machine acesse seu domínio, será necessário modificar o conteúdo do arquivorobots.txt do seu site.
A função do arquivo robots.txt é controlar como programas externos podem acessar seu site.
https://www.twaino.com/seo/robots-txt/
Sendo também um programa de terceiros, o Wayback Machine também deve respeitar as indicações que você fornecer em seu arquivo robots.txt.
- Acesse o arquivo robots.txt do seu site e, usando um editor de texto, adicione completamente as seguintes linhas ao final do arquivo:
Agente de usuário: ia_archiver
Não permitir: /
- Em seguida, verifique se você salvou suas alterações (Ctrl + S) antesfeche o arquivo.
Uma vez feito isso, seu site agora deve estar protegido contra archive.org e seu Wayback Machine.
No entanto, lembre-se que esta é uma medida preventiva. Todas as suas páginas que o Wayback Machine teria arquivado ainda estarão disponíveis na plataforma.
Se você deseja remover especificamente essas páginas do Archive.org, aqui estão suas opções:
2. Envie uma solicitação de remoção ao DMCA
Uma maneira de remover suas páginas dos arquivos Wayback Machine é enviar uma solicitação de exclusão ao DMCA.
Independentemente do seu nicho e do conteúdo do seu site, o Internet Archive é obrigado a cumprir os regulamentos federais relacionados à proteção da propriedade intelectual.
O Digital Millennium Copyright Act (DMCA) é uma das medidas propostas pelo governo dos EUA para proteger sua propriedade intelectual.
No entanto, se você não estiver em campo, seria melhor que um advogado o acompanhasse para redigir e encaminhar adequadamente o pedido de submissão ao DCMA.
Para excluir uma página arquivada no Archive.org, o melhor método recomendado pela plataforma é enviar um e-mail para o endereçoinfo@archive.org.
No entanto, quando o e-mail é enviado, o Internet Archive não responde imediatamente. Isso pode ser devido ao número de solicitações de exclusão pendentes que a equipe do Archive.org recebe. Mas depois de alguns dias você deve obter uma resposta.