Comment faire pour résoudre les problèmes d’indexation de Google ?

Les erreurs d’indexation sont l’un des pires problèmes que nous puissions rencontrer. Certaines n’affectent que la capacité d’exploration et d’indexation de votre site Web, ce qui est déjà assez grave.

Mais d’autres, comme les boucles de redirection, sont des problèmes qui peuvent bloquer l’accès à n’importe qui, utilisateur ou robot.

Il existe une multitude de facteurs qui influencent la façon dont les moteurs de recherche explorent et indexent votre site web. La casuistique énorme et complexe des erreurs d’indexation suffirait à un livre entier plutôt qu’à un article.

C’est pourquoi, dans cet article, nous avons exposer les erreurs d’indexation les plus fréquentes qui affectent un site web, quelle en est la cause la plus probable et comment les corriger.

Les erreurs d’indexation les plus fréquentes

Blocage involontaire d’URL

Cette erreur d’indexation est plus fréquente que vous ne le pensez. Et bien souvent, c’est dû à une pure étourderie. Parfois, vous n’êtes même pas conscient que vous bloquez une ou des URL.

Il peut arriver que, sans vous en rendre compte, vous bloquiez une URL dans votre fichier robots.txt parce qu’elle se trouve dans un répertoire restreint avec une directive disallow. Par exemple, imaginez que vous avez l’instruction suivante dans votre fichier robots :

Disallow : /category/
Si la structure de vos pages est /category/page-name, vous dites aux moteurs de recherche de ne pas explorer la catégorie en question, mais aussi les pages de cette catégorie, ce qui serait une erreur.

Si vous ne voulez pas modifier la structure de vos liens, vous pouvez supprimer la barre oblique à la fin de la ligne pour indiquer que vous voulez bloquer uniquement l’URL de la catégorie et non l’ensemble du répertoire.

Oublier de supprimer un disallow

C’est une autre erreur d’indexation que vous pouvez faire si vous ne vous en rendez pas compte. Peut-être qu’à un moment donné, vous ne vouliez pas que Google explore une page que vous étiez en train de modifier et vous l’avez bloquée dans le fichier robots.txt.

Mais maintenant que vous l’avez préparé, vous voulez qu’il apparaisse dans les résultats de recherche. Et pour que les robots puissent l’explorer, vous avez oublié la balise disallow qui bloque les robots d’exploration.

Le problème passera complètement inaperçu.

Code générateur d’erreurs

Le code de votre site Web doit être facilement accessible à Google et maintenir une cohérence dans son HTML brut et son rendu.

Les erreurs de script peuvent causer des problèmes de rendu d’un site web. Ces erreurs se traduisent par un arrière-plan qui ne se charge pas, une barre de navigation qui ne fonctionne pas correctement ou un code incorrect qui s’affiche en haut ou en bas de votre site.

Si l’erreur JavaScript n’empêche pas le chargement complet du site, elle ne bloquera pas l’indexation, mais elle pourrait nuire à votre classement si elle empêche le contenu le plus important de s’afficher correctement.

Boucle de redirection

Les boucles de redirection constituent l’un des pires problèmes de l’indexation. Parfois, lorsque vous essayez d’accéder à une page, le serveur vous redirige vers une autre, puis une autre, et ainsi de suite à l’infini.

Après avoir dépassé un certain nombre de tentatives, les navigateurs affichent un message du type “Trop de redirections”.

Ce n’est évidemment pas une bonne chose, car les robots qui passent par là et entrent dans une boucle finiront par partir sans explorer votre page, et vous risquez d’être pénalisé pour cela. Les utilisateurs ne seront pas non plus heureux de voir un message d’erreur.

Les boucles de redirection peuvent être corrigées, même si c’est parfois un véritable casse-tête de trouver la solution, car elles peuvent être causées par de nombreux facteurs. Tout d’abord, nous vous recommandons de vider tous les caches (ceux du navigateur et du serveur) et de désactiver les plugins ou les outils de mise en cache que vous utilisez.

Un site nouvellement crée

Si vous venez de créer votre site, il faut un certain temps pour que les crawlers viennent explorer votre site. Il n’y a pas de délai précis pour savoir à quel moment les robots vont venir explorer vos pages.

Soyez patients et soyez en veille pour voir les premières visites des crawlers.

Comment forcer l’indexation des pages du site web ?

Forcer l’indexation avec l’API Google

Une façon très simple de forcer l’indexation est d’utiliser l’API de Google.

Avec l’API Google, vous pouvez le faire dans WordPress ou dans n’importe quel CMS, à condition d’inclure le code. C’est-à-dire qu’avec WordPress c’est beaucoup plus facile parce qu’il y a un plugin, mais vous pouvez aussi le faire par code.

La première chose est que vous avez besoin d’un plugin WordPress SEO appelé IInstant Indexing for Google de Rank Math. Une fois installé, l’étape suivante consiste à télécharger une extension du site Web appelée Google Indexing API Plugin. Dès que nous l’aurons chargé, nous verrons apparaître une nouvelle option API d’indexation dans le menu de navigation du plugin.

La prochaine chose que nous devons faire est d’obtenir une clé d’API nécessaire pour le projet. Pour ce faire, vous devez vous inscrire et créer une API dans le service Google Apis en vous rendant dans la section API d’indexation de Google Cloud Platform.

L’étape suivante consiste à créer la clé à intégrer dans le plugin WordPress. La clé doit être de type JSON.

Lorsqu’il est téléchargé, il crée un fichier au format JSON. Gardez-la à portée de main car vous pouvez faire beaucoup de choses avec cette clé L’étape suivante consiste à aller dans la Google Search Console et à aller dans l’onglet du domaine où vous voulez appliquer l’indexation forcée.

Dans la section Paramètres, vous disposez d’une zone Utilisateurs et autorisations, à laquelle vous devez accéder. Vous y verrez les paramètres du propriétaire du compte.

Lorsque vous êtes sur l’écran avec la liste des propriétaires et leurs vérifications, vous pouvez en ajouter un nouveau.

Vous indiquez ainsi à Google Search Console que ce compte de messagerie, qui a pour mot de passe le fichier JSON que vous avez téléchargé, est autorisé à accéder à Google Search Console et donc à interagir avec votre site Web.

Vous pouvez maintenant vous rendre sur WordPress pour paramétrer le plugin

Utilisez l’inspecteur d’URL de Google Search Console

Incluez l’url du nouvel article (ou de la page que vous avez mise à jour) dans la barre supérieure de Search Console et demandez l’indexation. Google recherchera l’URL dans son index (si elle est nouvelle, il vous indiquera que “l’URL n’est pas dans Google” et essaiera de l’indexer. Cette vérification peut prendre plusieurs minutes. S’il ne vous avertit pas qu’il y a des erreurs, vous dites oui à tout.

Le processus d’indexation peut prendre des minutes, des heures, des jours… cela dépend de chaque site Web et du travail en attente que Google doit effectuer.

Mettez à jour et soumettez le Sitemap de votre site web à Google

Votre plan Sitemap se trouve probablement dans le chemin www.site.fr/sitemap_index.xml (ou /sitemap.xml).

Il est généralement généré et mis à jour automatiquement par le plugin que vous avez installé pour améliorer le référencement de votre site WordPress (Yoast, All in One SEO Pack, SEOPress…).

Pour accélérer le processus d’indexation, vous téléchargez votre Sitemap dans la Search Console.

Les liens internes

La création de liens internes est une bonne stratégie pour forcer l’indexation de vos pages, elles sont également bonnes pour l’expérience utilisateur.

Si vous avez un site web, les utilisateurs resteront plus longtemps sur votre site si vous les emmenez sur un chemin utile pour leur intention de recherche.

Avoir des backlinks

L’acquisition de backlinks permet de mieux classer vos pages mais également de découvrir vos pages par la même occasion si ce sont de nouveaux contenus.

Un petit clic pour évaluer l'article