Comment fonctionne le moteur de recherche Google ?
Ce processus comporte les étapes suivantes :
- L’exploration du Web : suivre les liens pour découvrir les pages les plus importantes du Web.
- Indexation du Web : stockage des informations de toutes les pages consultées en vue d’une recherche ultérieure.
- Le classement des sites web : il s’agit de déterminer le contenu de chaque page et la manière dont elle doit être classée pour les requêtes pertinentes.
Crawl du site web
Les moteurs de recherche ont des robots qui “explorent” le World Wide Web pour découvrir les pages existantes, afin d’aider à identifier les meilleures pages Web à évaluer en cas de requête.
Les robots d’exploration du Web parcourent les liens des sites Web qu’ils trouvent.
Ces liens de sites Web relient les pages d’un même site Web et de l’ensemble du Web, créant ainsi un chemin permettant aux robots d’exploration d’atteindre les milliards de pages Web interconnectées qui existent.
Chaque fois que les robots d’exploration regardent une page Web, ils parcourent le “Document Object Model” (ou “DOM”) de la page pour voir ce qu’elle contient.
Le DOM est la représentation du code HTML et Javascript de la page que les crawlers parcourent pour trouver des liens vers d’autres pages.
Cela permet au moteur de recherche de découvrir de nouvelles pages sur le web et chaque nouveau lien qu’il trouve est ajouté à une file d’attente que le crawler visitera plus tard.
L’exploration quotidienne d’un site web entier représenterait une charge de travail importante. C’est pourquoi Google répartit normalement son exploration sur plusieurs semaines. En outre, le moteur de recherche de Google n’explore pas tous les sites Web existants.
Les robots d’exploration du Web commencent par les sites Web qui sont sûrs et qui serviront de référence pour comparer d’autres sites. Les crawlers étendent leur exploration du web en suivant les liens qu’ils trouvent sur les pages qu’ils visitent.
Indexation du site web par Google
L’indexation consiste à ajouter des informations sur une page web à l’index d’un moteur de recherche.
L’index est une collection de pages web, une base de données, qui comprend des informations sur les pages explorées par les moteurs de recherche.
L’index catalogue et organise, entre autres :
- Données détaillées sur la nature du contenu et la pertinence de chaque page web.
- Une carte de toutes les pages vers lesquelles chaque page est liée.
- L’hyperlien (liens d’ancrage) de tout lien.
- Autres informations sur les liens : s’il s’agit ou non de publicités, où ils se trouvent sur la page, aspects du contexte du lien et ce que cela implique sur la page qui reçoit le lien.
- La table des matières est la base de données avec laquelle les moteurs de recherche tels que Google stockent et récupèrent les données lorsqu’un utilisateur interroge le moteur de recherche.
Avant de décider quelles pages web afficher dans l’index et dans quel ordre, Google applique des algorithmes pour aider à classer ces pages web.
Comment Google fait le classement des sites ?
Afin de fournir des résultats à l’utilisateur, Google doit effectuer trois étapes essentielles :
- Interpréter l’intention de la requête de l’utilisateur.
- Identifier les pages web de l’index en rapport avec la requête.
- Classez et renvoyez ces pages Web par ordre de pertinence et d’importance.
C’est l’un des principaux domaines dans lesquels intervient l’optimisation des moteurs de recherche.
Un référencement efficace permet de déterminer la pertinence et l’importance de ces pages web pour les requêtes qui y sont liées.
Que signifient donc la pertinence et l’importance ?
- Pertinence : la mesure dans laquelle le contenu d’une page web correspond à l’intention du chercheur (l’intention est ce que les internautes essaient d’atteindre avec cette recherche, ce qui est une tâche complexe à résoudre pour Google ou les référenceurs).
- Importance : les pages web sont considérées comme d’autant plus importantes qu’elles sont citées ailleurs. Traditionnellement, ils apparaissent sous la forme de liens d’autres sites web vers cette page web.
Pour accomplir la tâche d’attribuer la pertinence et l’importance, Google a des algorithmes complexes conçus pour prendre en compte des paramètres qui aident à déterminer la pertinence et l’importance d’une page web donnée.
Ces algorithmes changent souvent, car Google s’efforce d’améliorer ses méthodes et de fournir de meilleurs résultats aux utilisateurs.
Bien qu’ils soient en constante évolution, certains des éléments fondamentaux de ce que recherche le moteur de recherche sont assez bien connus.
Google a révélé certains éléments de base grâce au partage des connaissances mais également par les nombreuses interventions de John Mueller, le webmaster Trends Analyst de Google..
Quels sont les facteurs de classement les plus importants ?
Contenu de qualité
Les visiteurs lisent et apprécient le contenu de bonne qualité sur un site et peuvent même cliquer sur les liens internes pour en savoir plus.
Google examine la qualité du contenu d’un site Web à travers différents paramètres comme :
- la balise Title,
- l’architecture de la page
- la façon dont le sujet est traité
- le texte répond bien à l’intention de l’utilisateur
Les backlinks
Les backlinks sont des liens retours, des liens pointant vers votre site web.
Ils doivent provenir de pages déjà indexées, en lien avec la thématique de la page ciblée.
Google aime les liens provenant de domaines de haute qualité dans votre niche. Ils permettent à Google de mieux vous classer car d’autres sites parlent de vous en faisant référence aux pages de votre site web.