Définition du terme Soft 404

Pas envie de lire ? Lancez l'audio pour écouter l'article !
Voiced by Amazon Polly

 Soft 404 est une erreur qui survient lorsque la page web recherchée par un internaute est supprimée ou introuvable, mais pour lequel le serveur, à défaut d’indiquer aux moteurs de recherche le code d’erreur 404 qui prouve que la page recherchée est invalide, indique un code de succès qui suppose l’existence de contenus sur cette page. Ce qui n’est pas le cas.

Nous sommes nombreux à atterrir sur des pages qui affichent immédiatement un message d’erreur (404), désignant que celles-ci n’existent plus ou qu’elles n’ont pas été retrouvées. 

Il est important de noter que ces erreurs peuvent signifier beaucoup plus que ce que nous nous imaginons. 

Mais une chose  est certaine, les webmasters doivent immédiatement prendre en compte le soft 404, car c’est une catégorie d’erreur qui peut porter un grave préjudice au référencement SEO de leurs sites internet.

Alors : 

  • Qu’est-ce qu’une erreur Soft 404 ?
  • Comment trouver les erreurs Soft 404 ?
  • Comment les corriger pour perfectionner votre SEO ?

Ce sont toutes des questions auxquelles j’aurai à vous répondre dans la suite de ce contenu.

Chapitre 1 : Soft 404, de quoi s’agit-il ?

Dans ce chapitre, je vous explique ce que sait qu’une erreur soft 404 et ce qui peut en être la source.

1.1. Qu’est ce qu’une erreur Soft 404 ?

Pour mieux la comprendre, rappelons-nous le déroulement d’une requête sur le web. Lorsqu’un utilisateur fait une recherche, le moteur de recherche demande instantanément à avoir accès au contenu présenté dans l’URL concerné.

Pour s’y prendre, le navigateur va premièrement demander au serveur de lui donner des informations concernant l’URL ou la page. 

Ces infos se présentent comme un code HTTP nommé Code d’État, qui va renseigner le navigateur sur l’état de la page. Il existe diverses catégories de code d’État dont les plus récurrents sont les suivantes :

  • Le 200 : qui désigne la réussite de la requête ou simplement qu’il existe de contenu sur la page ;
  • Le 301 et le 302 : qui désigne respectivement une redirection permanente et une redirection temporaire ;
  • Le 401 : qui veut dire que l’utilisateur n’est pas autorisé ;
  • Le 403 : synonyme d’accès refusé de la page ;
  • Le 404 : celui qui nous concerne actuellement et qui signifie Page non retrouver ou Not  Found ;
  • Le 500 et le 503 qui représentent Erreur de serveur ;
  • Le 504 : qui veut dire que le serveur n’a pas répondu.

guide-des-codes-d'etat-HTTP-pour-les-SEO

Ainsi, dans le cadre d’une erreur Soft 404, le robot ou le moteur de recherche demande au serveur le code auquel il doit se référer. Le serveur lui envoie donc un code 200 qui stipule l’existence de contenu sur la page tandis que l’URL de la page montre clairement qu’il n’y a pas de contenu évident sur celle-ci, d’où le 404. 

Cependant, il n’est pas rare de voir certaines personnes mélanger le sens des termes erreur Soft 404 et erreur 404 simple. 

Il est donc capitale de pouvoir faire la différence entre :

  • Une page 404 et un soft 404 ;
  • Une page semble être un soft 404 et une erreur Soft 404 elle-même.

Soft 404 (2)

1.1.1. Différence entre une erreur 404 simple et une erreur Soft 404 

La nuance entre l’erreur 404 simple, dit erreur 404 douce, et l’erreur Soft 404, encore appelée erreur logicielle 404, se trouve sur deux niveaux.

Premièrement, dans le cas d’une erreur 404 douce, les pages sont introuvables et le code Http correspondant envoyé par le serveur signale très bien un 404 Not found (page Non trouvée). 

Tandis que dans le cas d’une erreur Soft 404, les pages sont toujours introuvables, mais le code d’état ou Http que le serveur envoie est le 200 Réussite de page au lieu du 404, ce qui porte à confusion. 

Pour faire simple, le code d’état qui devrait être attribué par le serveur dans chacun des cas est le 404, mais la règle n’est pas suivi pour l’erreur Soft 404.

Deuxièmement, en cas d’erreur 404 simple, les pages ne sont pas indexées par les moteurs de recherche et ne figurent donc pas dans le SERP (Search engine results page ; page de résultats des moteurs de recherche), alors que les pages provenant d’une erreur Soft 404 sont explorées, indexées par les moteurs de recherche et figurent ainsi dans le SERP. 

 1.1.2. Différence entre “une page semble être un Soft 404” et “un Soft 404”

Avant que Google ne définisse une page web en tant qu’erreur soft 404, il doit d’abord la considérer en tant qu’une page qui “semble être un soft 404”. 

En effet, les erreurs Soft 404 sont provisoires et temporaires. Pour ce fait, avant que Google ne porte un dernier jugement, il définit préalablement l’erreur comme “semble être un 404” et si l’erreur perdure, elle est classée officiellement comme un Soft 404.

Il est bon de savoir que si la mention “la page semble être un Soft 404” apparaît dans l’onglet ERREUR, cela voudrait dire que Google explorera à nouveau cette page et pourra modifier son état s’il le faut. 

Par contre, si cette même mention apparaît dans l’onglet EXCLUS, cela voudrait signifier que Google arrête l’indexation de la page parce qu’elle reste introuvable.

1.2. Les causes évidentes des erreurs Soft 404

Plusieurs facteurs peuvent être à la base d’une erreur logicielle 404. Les plus réguliers sont :

  • Ceux liés à une page quasi vide ;
  • Ceux liés à une page d’erreur personnalisé ;
  • Ceux liés à beaucoup de redirections.

1.2.1. Les facteurs liés à une page quasi vide

L’erreur Soft 404 la plus souvent commise par les webmasters est le fait d’accepter l’indexation des pages n’ayant pas assez de contenus. Considérons l’exemple d’une page de catégorie avec des contenus de site E-commerce ou de page de diffusion d’annonce qui ne disposent d’aucun élément ou produit à présenter, à part quelques phrases inutiles. 

Dans ce cas d’espèce, il est évident que Google considère votre page comme une page introuvable. Pour en avoir la certitude, je vous suggère d’utiliser l’outil Google search console qui pourra explorer et examiner votre site afin de vous signaler les pages dont les contenus sont dorénavant de faible qualité.

1.2.2. Les facteurs liés à une page d’erreur personnalisée

La seconde cause probante d’une erreur Soft 404 est le fait d’effectuer un mauvais paramétrage en incluant des codes de fichier htaccess erronés lors de la création d’une page 404 personnalisée

Page 404 personnalisee

Supposons un instant que le nom de votre page est “404.HJP”, c’est un nom pris au hasard. L’erreur qu’il ne faut absolument pas faire dans le code du fichier est la suivante :

ErrorDocument 404 https://example.com/404.HJP  

Ici, nous pouvons remarquer que l’URL de la page commence par https ce qui ne devrait pas être le cas. Le bon code dans ce cas précis est :

ErrorDocument 404 /404.HJP

Dans tous les cas, le seul conseil que je peux vous donner est de régulièrement vous assurer que votre serveur donne réellement un code 404 et non un autre code pour désigner une page ou URL introuvable.

1.2.3. Les facteurs liés à beaucoup de redirections

La dernière cause d’erreur Soft 404 que je désire mentionner concerne les redirections. Lorsque vous effectuez la redirection d’une quantité importante de pages vers une autre page de contenu différent, Google ne verra que du feu, car il suppose que l’action effectuée est inappropriée.
Il peut alors déclarer cette page comme une erreur Soft 404, peu importe si vos redirections sont permanentes ou si meilleures qu’elles soient.

Facteurs lies a beaucoup de redirections

Je vous conseille aussi de controler le nombre de vos redirections et d’en faire vers des pages qui contiennent des contenus similaires que celles de base (pages supprimées ou introuvables). 

Maintenant, que nous savons ce que sait qu’un Soft 404 et ce qui pourrait en être la cause, découvrons sans plus tarder comment détecter cette erreur et la réparer.

Chapitre 2 : Comment détecter et réparer les erreurs Soft 404 d’un site web ?

Dans ce chapitre, je vous donne des outils pour détecter une erreur Soft 404 ainsi que des méthodes pour y remédier. 

Mais tout d’abord, nous allons vous présenter les raisons pour lesquelles il est nécessaire de réparer les erreurs de logicielle 404. Voici donc les problèmes qui peuvent découler d’une erreur Soft 404.

2.1. Les problèmes du soft 404

Lorsqu’un site internet émet un code d’état différent du 404 pour désigner une page supprimée ou introuvable, cela peut dangereusement influencer le budget crawl ainsi que le référencement naturel de vos sites Internet. 

2.1.1. Conséquence du soft 404 sur le budget crawl

Pour rappel, dans un Soft 404, votre site internet indique aux moteurs de recherche qu’il existe de vrai contenu sur l’URL auquel ils essayent d’avoir accès, ce qui n’est pas le cas. 

Par conséquent, la page supprimée sera explorée et indexée à tort par les moteurs de recherche en dilapidant, de ce fait, une partie de votre budget d’exploration, couramment appelé budget crawl, sur des pages inutiles.

Crawl-Budget

Un budget crawl peut être défini comme la quantité d’URL que les robots de Google (spider) peuvent ou souhaitent explorer. Il est subdivisé en deux parties que sont :

  • Le Taux d’exploration : Qui permet à Google de réguler la fréquence à laquelle il explore les pages, pour ne pas les explorer trop régulièrement ou rapidement ;
  • La Demande d’exploration : Désigne les critères selon lesquels Google voudra explorer vos pages. Nous pouvons avoir comme critère le taux de trafic sur vos pages, etc ;

Ainsi, Google ne veut pas passer tout son temps à explorer les mêmes sites indéfiniment, raison pour laquelle il a prévu un budget à leurs explorations. 

En tenant compte du budget crawl, si un site contient un nombre important d’erreurs soft 404, ces pages seront bien évidemment explorées. Ce mécanisme d’exploration, soutire inutilement une portion importante du montant du budget crawl consacré au site.

2.1.2. Conséquence sur le référencement

Si je considère le temps que le robot de Google ou Bingbot dépense dans l’exploration des erreurs logicielles 404, je peux conclure que les URL avec un réel contenu auront du mal à être explorées. Ainsi, elles ne pourront pas être régulièrement indexées,lof ce qui diminue la performance de votre stratégie SEO.

5 étapes pour réussir votre Stratégie SEO

Finalement, lorsque vous avez une proportion élevée de soft 404, cela signifie que vous dépensez inutilement votre budget crawl, en plus de cela, vous perdez la visibilité sur les pages qui vous sont importantes. 

crawiling

Il est donc normal de voir la performance d’un site s’améliorer dans les recherches organiques, lorsque les erreurs Soft 404 sont détectées et résolues.

2.2. Que faire pour trouver les erreurs Soft 404 ?

La méthode la plus efficace pour identifier les erreurs Soft 404 ainsi que les erreurs 404 simples n’est rien d’autre que l’utilisation de Google search console, plus précisément de l’outil rapport de couverture et l’outil d’Inspection d’URL.

Je vous demande déjà d’inscrire Google Search Console sur votre site internet, si vous ne l’avez pas encore fait. Cela vous permettra d’accéder à différentes fonctionnalités qui peuvent vous aider à perfectionner votre référencement.

2.2.1. Outil rapport de couverture

La procédure pour trouver une erreur soft 404 avec le rapport de couverture de Google search console est la suivante : 

Il faut :

  • Se connecter à Google search console ;
  • Puis, faire un click sur couverture dans INDEX pour ouvrir le Rapport de couverture ;

Rapport de couverture

Soyez sûre d’avoir sélectionné l’onglet ERREUR, ensuite faites la recherche des éléments ci-après :

  • L’URL recherché à l’air d’un Soft 404 ;
  • Doux 404 (pour trouver les pages 404 simple) ;
  • Non trouvé.

Lorsque vous allez voir apparaître l’erreur, cliquez là-dessus et vous obtiendrez donc des informations sur les pages impliquées.

2.2.2. Outil d’inspection d’URL 

L’autre méthode utilisée pour trouver les erreurs Soft 404 est l’outil d’inspection d’URL de Google search. Cette méthode consiste à trouver le code d’état Http.

Inspection d URL

Il vous suffit :

  • D’intégrer un URL dans l’outil d’inspection d’URL ;
  • De cliquer sur Entrer ;
  • Puis, de cliquer sur Voir la Page Arrivée ;
  • Enfin, cliquez sur Plus d’Information.

C’est alors que vous allez voir apparaître l’erreur dont il s’agit.

Passons aux solutions.

2.3. Cinq solutions pour réparer les erreurs Soft 404 

Dans cette section, je vous présente les cinq astuces que vous pouvez utiliser pour en finir avec les erreurs logicielles 404.

2.3.1. Contrôlez si la page est réellement un soft 404 ou une fausse alerte

Il n’est pas rare de remarquer que Google search console désigne injustement une page comme étant un soft 404. Par conséquent, il faut vérifier si les pronostics de Google sont exacts.

Il va falloir donc :

  • Aller dans le rapport de couverture et cliquer sur “l’URL soumis semble être un soft 404” afin de présenter la liste des pages concernées ;
  • Aller sur un URL et cliquez sur “Ouvrir dans un nouvel onglet”.

Si la page que vous recherchez est une page valide de votre site, et que vous désirez la voir s’afficher dans les résultats de page, cliquez sur “VALIDER LE CORRECTIF”.

Ce faisant, vous forcerez Google à refaire l’exploration de la page et à rétablir son code d’état.

Il existe une autre méthode qui consiste à tester l’URL de la page.

  • Allez sur un URL ;
  • Cliquez sur “Inspecter URL”.

Cette action vous permettra d’obtenir des détails sur la page. Vous pouvez aussi obliger Google à actualiser le rapport de couverture en cliquant sur “ TESTEZ L’URL EN DIRECT”.

2.3.2. Paramétrez votre serveur pour renvoyer le bon code

Lorsqu’un serveur ne renvoie pas réellement le bon code pour une page, la prochaine solution est de configurer votre serveur. 

Cette procédure permet d’envoyer la bonne réponse de code d’état, c’est-à-dire le 404. Après, vous retournez la page à Google en cliquant sur le bouton DEMANDE D’INDEXATION qui se trouve dans l’outil d’inspection d’URL.

Fonctionnement-du-serveur-dhébergement

La méthode la plus facile pour qu’un serveur affiche une erreur 404 pour une page invalide lorsqu’elle est demandée est de supprimer cette page de votre site web.

2.3.3. Optimisez la page 

Lorsque votre page est bien valide, mais que Google veut absolument la marquer comme un soft 404, la meilleure solution est de revoir le contenu de la page et de l’améliorer. 

strategie de contenu axee sur les donnees

Après ça, soumettez à nouveau la page à Google en cliquant sur le bouton DEMANDE D’indexation dans l’outil d’inspection d’URL ou en passant par VALIDATE FIX. C’est une procédure généralement utilisée lorsqu’une page possède moins de contenu et que Google ne veut plus la conserver dans son index.

En produisant des contenus de qualité, vous allez démontrer aux navigateurs que votre page est optimisée, ce qui fera disparaître le soft 404. 

L’article sur les 10 astuces pour créer un contenu viral vous sera très bénéfique. 

2.3.4. Utilisez la redirection 301

La solution que je vous présente ici pour réparer vos erreurs Soft 404 consiste à rediriger les pages concernées vers des pages existantes ou valides. 

Les redirections 301

Pour le faire, il vous suffit de joindre une redirection 301 au fichier .htaccess pour montrer aux navigateurs que la page a été déplacée à un nouvel endroit.

Vous pouvez aussi utiliser Plugin Yoast SEO pour ajouter une redirection 301.

2.3.5. Désindexer la page et conservez la sur votre site web

La dernière option que nous vous proposons pour corriger un soft 404, est de désindexer la page concernée en ajoutant sur l’en-tête une directive Noindex, mais toutefois garder la page sur votre site.

Desindexation-1

Voici comment ajouter la directive noindex sur l’en-tête de la page sans utiliser Yoast SEO :

<meta name= »robots » content= »noindex,follow »/> 

Ce faisant, Google ne présentera plus votre page sous le rapport ERREUR. Mais cette page n’apparaîtra pas dans les SERP puisqu’elle ne sera pas indexée.

En résumé

Une erreur Soft 404 peut être très nuisible pour un site qui désire performer dans les SERP. La réparation d’un soft 404 représente donc une technique de référencement naturelle qui peut aider à améliorer la visibilité de vos pages.

Mais d’abord, il faut savoir l’identifier, c’est pour cette raison que je vous ai présenté, dans ce contenu, un outil que vous pouvez utiliser pour dénicher rapidement vos erreurs logicielles 404. 

S’il y a des erreurs, il faut aussi des corrections, c’est dans cette optique que j’ai décidé de vous présenter quelques astuces que vous pouvez pratiquer pour corriger vos Soft 404 afin de bien référencer votre site web. 

A bientôt !

Fondateur de l'agence SEO Twaino, Alexandre Marotel est passionné par le SEO et la génération de trafic sur internet. Il est l'auteur de nombreuses publications, et détient une chaine Youtube qui a pour but d'aider les entrepreneurs à créer leurs sites web et à être mieux référencés dans Google.

Laisser un commentaire