Historique d’un Nom de Domaine | Wayback Machine

Historique d’un Nom de Domaine | Wayback Machine

Présentation rapide de l'outils : Historique d'un Nom de Domaine

Wayback Machine vous permet de voir à quoi ressemblaient les sites web dans le passé. Il compte plus de 729 milliards de pages archivées depuis 1996.

Présentation détaillée de l'outil​ : Historique d'un Nom de Domaine

Description Wayback Machine – Internet Archive

Parfois il peut être utile de découvrir à quoi ressemblait un site web dans le passé ou de revoir le contenu d’une ancienne page web actuellement indisponible.

Wayback Machine est un service en ligne proposé par Internet Archive qui vous permet de remonter dans les archives d’Internet et d’accéder à des clichés passés de sites web. 

Plus de 729 milliards de pages web ont été déjà explorés et archivés par la Wayback Machine d’Internet Archive. Pour y accéder, vous aurez juste à entrer le nom de domaine du site recherché ou un mot clé correspondant.  

Qu’est-ce que Wayback Machine ? 

Wayback Machine est l’un des services proposés par le site Internet Archive. Il a été lancé depuis 2001 et représente le service le plus utilisé de l’organisme auprès des internautes. 

C’est un outil qui vous permet de “remonter le temps” pour découvrir à quoi ressemblait un site web à un moment du passé.  

Actuellement, la Wayback Machine reste l’une des archives numériques les plus riches avec  des milliards de pages web archivées depuis 1996. 

L’objectif de l’organisme (Internet Archive) est d’aider à préserver les artefacts numériques et de fournir une bibliothèque Internet accessible au public pour les universitaires, les historiens et les chercheurs.

Pour cela, l’outil offre une fonctionnalité d’ajout de pages pour permettre aux propriétaires de sites web d’archiver eux-mêmes leurs pages sur la plateforme. 

Toutefois, les pages peuvent prendre entre 6 et 24 mois avant d’apparaître dans la Wayback Machine après avoir été collectées.

De plus, Internet Archive n’archive pas : 

  • Les pages dont l’accès nécessite un mot de passe
  • Les pages désignées par leur propriétaire comme étant « exclues des robots » 
  • Les pages qui ne sont accessibles que lorsque l’utilisateur doit remplir un formulaire 
  • Et les pages hébergées sur des serveurs sécurisés. 

En plus des pages qui peuvent être ajoutées par les propriétaires de sites web eux-mêmes, Internet Archive collabore également avec des institutions pour fournir toutes les informations disponibles dans sa base de données.  

Wayback Machine : Comment utiliser l’outil pour retrouver les instantanés historiques d’un site ? 

Wayback Machine est un outil accessible à tout le monde et très facile à prendre en main. 

  • Pour l’utiliser, rendez-vous simplement sur la page d’accueil de Archive.org
  • Si vous connaissez l’adresse URL complète du site que vous recherchez, vous pouvez la taper dans la barre de recherche du site. 

Dans le cas contraire, Wayback Machine offre aussi une fonctionnalité de recherche par mot-clé. 

  • Entrez donc simplement un mot clé lié à la page d’accueil du site que vous recherchez puis cliquez sur lancez votre requête. 
  • La plateforme devrait vous afficher une liste de résultats correspondants à votre recherche. Cliquez sur un résultat pour accéder aux clichés du site web correspondant. 

Par défaut, Wayback Machine affiche la capture de l’année en cours, mais offre aussi un système de navigation qui vous permet de remonter le temps et de voir rapidement l’apparence du site pendant les années passées. 

Mais pour un meilleur visionnage, vous disposez d’un lien pour afficher la liste de toutes les captures archivées du site avec un calendrier pour accéder plus facilement au rendu du site à une date passée précise. 

En passant la souris sur une date donnée, Wayback Machine propose automatiquement une liste d’heures de la journée sur lesquelles vous pouvez cliquer pour accéder au cliché du site exactement à cette heure précise.

Wayback Machine : Les fonctionnalités avancées

Wayback Machine est a priori adaptée aux chercheurs avec un certain nombre de fonctionnalités qui peuvent passer inaperçues pour les utilisateurs occasionnels : 

Référencer une page archivée : Avec Wayback Machine, il est possible de référencer facilement les clichés de pages web archivées dans vos propres contenus en insérant leurs URL. 

Enregistrer vos pages dans les archives de Wayback Machine : Grâce à sa fonctionnalité « Enregistrer la page maintenant », Wayback Machine permet également aux propriétaires de sites d’enregistrer certaines de leurs pages dans les archives d’Internet archive. 

Voici la procédure à suivre pour enregistrer vos pages web sur Wayback Machine : 

  • Accédez à la page d’accueil de Wayback Machine 
  • En pied de page, vous avez un champ intitulé « Save Page Now ». Entrez-y l’adresse URL de la page que vous désirez sauvegarder puis cliquez sur le bouton « Save Page ». 

Votre page vient ainsi d’être ajoutée dans l’archive de Wayback Machine. 

Utiliser un opérateur de recherche pour trouver rapidement une page sur Wayback Machine : Avec la Wayback Machine, vous pouvez rechercher un contenu spécifique sans avoir à visiter le site à chaque fois. 

L’outil propose un opérateur de recherche qui se présente sous le format « https://web.archive.org/*/www.votresite.com/* » que vous pouvez entrer directement dans votre navigateur et accéder aux clichés archivés d’un site web. 

Par exemple, pour voir les pages de Twaino enregistrées sur la Wayback Machine, recherchez simplement sur Google https://web.archive.org/*/www.twaino.com/* 

Wayback Machine : API et versions applications mobiles et extensions de navigateur

La Wayback Machine n’est pas seulement un outil web. Vous pouvez  aussi l’obtenir en version mobile sur votre téléphone iOS ou Android.

 

Wayback Machine existe également sous forme d’extension que vous pouvez installer et utiliser sur les navigateurs Chrome, Firefox, Opera et Safari

Pour les développeurs, l’outil propose aussi différentes API pour accéder à sa base de données. 

En clair, la Wayback Machine est la plateforme idéale pour revisiter les apparences passées de vos sites web préférés sur presque tous les supports.  

C’est également un outil qui peut être utile pour les étudiants et les professionnels qui cherchent des informations sur l’histoire d’un site web.

Wayback Machine : Comment supprimer vos pages web de l’archive Wayback Machine ? 

1. Mesure préventive : Bloquer l’accès à Wayback Machine 

Il est possible de retirer vos informations de Wayback Machine de sorte que les pages de votre site web qui sont archivées ne soient plus accessibles sur Internet Archive. 

Cependant, c’est un processus compliqué qui peut prendre beaucoup de temps. C’est pourquoi si vous avez des pages sensibles que vous ne souhaiterez pas voir archivées par la Wayback Machine, vous pouvez prendre vos dispositions dès maintenant pour empêcher l’outil d’accéder à votre site web. 

Pour empêcher la Wayback Machine d’accéder à votre domaine, il sera nécessaire de modifier le contenu du fichier robots.txt de votre site web. 

Le rôle du fichier robots.txt est de contrôler la manière dont des programmes extérieurs peuvent accéder à votre site web. 

https://www.twaino.com/seo/robots-txt/ 

Étant aussi un tiers programme, la Wayback Machine se doit également de respecter les indications que vous renseignez dans votre fichier robots.txt. 

  • Accédez au fichier robots.txt de votre site web puis à l’aide d’un éditeur de texte, ajoutez complètement à la fin du fichier, les lignes suivantes : 

User-agent: ia_archiver

Disallow: /

  • Assurez-vous ensuite d’avoir enregistrer vos modifications (Ctrl + S) avant de fermer le fichier. 

Une fois que c’est fait, votre site devrait maintenant être protégé contre archive.org et sa Wayback Machine.

Toutefois, rappelons qu’il s’agit d’une mesure préventive. Toutes vos pages que la Wayback Machine aurait archivées seront toujours disponibles sur la plateforme. 

Si vous tenez particulièrement à supprimer ces pages de Archive.org, voici les possibilités dont vous disposez : 

2. Soumettre une demande de suppression auprès du DMCA

L’une des possibilités pour retirer vos pages des archives de la Wayback Machine est d’envoyer une demande de suppression au DMCA. 

Qu’importe votre niche et le contenu de votre site web, Internet Archive est tenu de respecter les réglementations fédérales liées à la protection de la propriété intellectuelle. 

Le Digital Millennium Copyright Act (DMCA) est l’une des mesures proposées par le gouvernement américain pour protéger votre propriété intellectuelle. 

Cependant, si vous n’êtes pas du domaine, il serait plus judicieux de se faire accompagner par un avocat pour rédiger et soumettre correctement la demande de soumission au DCMA. 

3. Envoyer un mail à info@archive.org

Pour supprimer une page archivée sur Archive.org, la meilleure méthode que recommande la plateforme est d’envoyer un courrier électronique à l’adresse info@archive.org

Toutefois, lorsque le courriel est envoyé, Internet Archive ne répond pas tout de suite. Cela peut être dû au nombre de demandes de suppression en attente que reçoit l’équipe de Archive.org. Mais au bout de quelques jours, vous devez obtenir une réponse.

Vidéos de l'outils​ : Historique d'un Nom de Domaine

Gallerie de l'outils​ : Historique d'un Nom de Domaine

Présentation de l'entreprise​ : Historique d'un Nom de Domaine

The Internet Archive n’est pas en soi une entreprise, mais une organisation à but non lucratif qui intervient dans le domaine de l’information et de l’Internet. Il s’agit en réalité d’une bibliothèque numérique de sites web.

À l’instar des bibliothèques traditionnelles, The Internet Archive offre un accès illimité d’informations aux chercheurs, universitaires, historiens et aux grands publics. Leur mission est de donner un accès gratuit  aux diverses connaissances mondiales.

The Internet Archive a débuté l’archivage en 1996 en archivant Internet lui-même qui n’avait pas vraiment un centre de sauvegarde des informations. Mais actuellement, avec plus de 25 ans d’historique web, vous pouvez accéder à toutes les informations à travers l’outil Wayback Machine de The Internet Archive.

Cette dernière travaille également avec plus de 950 bibliothèques et d’autres partenaires à travers son programme Archive-It. C ‘est un programme qui permet en effet de détecter les pages web importantes des différents sites internet.

Retrouver l'entreprise​ : Historique d'un Nom de Domaine

Historique d'un Nom de Domaine sur les réseaux sociaux

Les autres outils associés : Historique d'un Nom de Domaine

Laisser un commentaire

Alexandre MAROTEL

Fondateur de l’agence SEO Twaino, Alexandre Marotel est passionné par le SEO et la génération de trafic sur internet. Il est l’auteur de nombreuses publications, et détient une chaine Youtube qui a pour but d’aider les entrepreneurs à créer leurs sites web et à être mieux référencés dans Google.