moteur google

Un moteur de recherche (Search Engine) est un service en ligne permettant de trouver une page dont le contenu, est lié à l’expression recherchée. Afin de proposer des résultats pertinents pour les utilisateurs, le fonctionnement d’un moteur de recherche se décompose en 4 étapes : la découverte de nouvelles pages web, l’identification des pages web, le classement des résultats et la restitution des résultats. Ce fonctionnement concerne uniquement les liens naturels.

Découverte et actualisation des pages web

Dans un premier temps le moteur de recherche va collecter toutes les informations accessibles (étape appelé « crawl ») à l’aide de « robots » également appelés spiders, crawlers ou bots.

Le fonctionnement d’un robot est comparable à une personne ouvrant une page web et cliquant sur l’ensemble des liens hypertextes s’y trouvant. Puis cliquant à nouveau sur les liens hypertextes des nouvelles pages ouvertes reproduisant ce schéma indéfiniment.

Pour chaque nouvelle page ouverte, le moteur de recherche vérifie si la page existe et si le code HTML correspond à la page qu’il a en mémoire. Si la page web est nouvelle il va alors l’ajouter à son index, si le code HTML est différent de la version en mémoire le robot va mettre à jour la version de la page web.

Votre site ne doit pas contenir de facteurs bloquants l’indexation et surtout l’accessibilité sinon le référencement sera impossible. Le fichier « robots.txt » peut bloquer l’accès de vos pages aux différents moteurs de recherche par exemple.
L’audit de référencement permet de vérifier l’accessibilité et l’indexabilité de votre site web tout en remédiant aux problèmes pouvant survenir.

Vous pouvez néanmoins suggérer aux moteurs de recherche quels pages vous souhaitez indexer à l’aide d’un « Sitemap » (plan de votre site web), libre à eux ensuite de vous indexer ou non.

Sans « crawlers », les moteurs de recherche ne pourraient pas découvrir les nouvelles pages web et les mettre à jour. Les pages trouvées par le « crawler » vont constituer une base de données appelée « index ».

Identification et constitution de deux index

Les moteurs de recherche vont identifier à partir du code HTML, le texte visible par les internautes. Ensuite, les moteurs de recherches procèdent à une analyse méticuleuse du nombre de mots visibles, de leur position au sein de la page web, du nombre de répétition, etc.

A l’issue de cette analyse votre page web et plus généralement votre site web va être placé dans une catégorie. C’est à partir de ce mécanisme que les moteurs de recherche vont constitués l’index principal.

Le second index correspond à l’index inversé crée à partir de l’index principal contenant tous les mots clés associés aux pages web.

Pour une requête tapée, le nombre de résultats affichés correspond aux nombres de résultats retournés par l’index principal. L’index inversé comprend uniquement les mots clés potentiels de recherche en liaison avec l’index principal.

La qualité d’un index se caractérise par la fréquence d’actualisation des pages web.

Classement selon les critères de pertinence

es pages les plus pertinentes vont apparaître dans les premières positions des résultats. Pour préserver une qualité de résultats, les moteurs de recherche développent des algorithmes permettant de prendre en compte leurs critères de pertinence. Selon les moteurs de recherche, l’importance des critères de pertinence varient. Certains moteurs de recherche peuvent même prendre en compte des critères que d’autres n’ont pas. Comme critère de pertinence essentiel au référencement, les moteurs de recherche exploitent les données de leurs index. Les critères internes de pages web, comme la localisation d’un mot dans votre page web, son nombre de répétition, la mise en gras de mots clés, la proximité des mots clés,etc. Les critères externes de pages web, la popularité de votre page web, site web, le pagerank de moins en moins pris en compte, les réseaux sociaux (nombre de partages, j’aime, etc). Les critères liés au comportement de vos visiteurs, le taux de rebond (internaute quittant votre page directement) est un critère essentiel pour vérifier la qualité de votre site web, mais il n’est pas le seul. Nous avons également le nombre de pages visités, le temps passés sur les pages, etc. Ces données sont obtenus à partir des sites ayant recours à google analytics mais également aux internautes utilisant google Chrome comme navigateur.

Il existe plus d’une centaine de critères de pertinence retenus par les moteurs de recherches. Mais leur poids, leur influence n’est jamais révélé ou presque. Cependant, avec une approche empirique (expérience, tests de référencement, etc) nous pouvons déterminer quels critères sont favorables ou défavorables pour votre référencement.

La restitution des résultats

Le formulaire de recherche donne aux internautes une liberté d’action infinie. L’internaute peut procéder à une recherche avancée en choisissant de trier les résultats selon la date de découverte des moteurs de recherche, l’inclusion de certains mots clés, etc.

Google limite ses résultats naturels à 10 par page volontairement pour ne pas nuire à son business model, autrement dit, qu’il y ai moins d’internautes cliquant sur les publicités adwords.

La complexité des moteurs de recherche est sans appel, de nombreux points n’ont pas été développés volontairement pour vous proposer un condensé d’informations pertinentes.

Les 5 étapes incontournables pour générer de la croissance sur internet


Exploseo

Guide gratuit pragmatique écrit par des experts du digital.
Découvrez comment Créer, Optimiser et Rentabiliser.