Newsletter

Fonctionnement de moteur de recherche

février 14th, 2007 Par Hailong

Tout à bord, nous devons comprendre la notion « robot » de moteur de recherche. Un robot, s’appelle aussi spiders ou crawlers en anglais. Il est simplement un logiciel qui est utilisé pour collecter des données sur internet automatiquement et à une super vitesse . Il parcourt presque tous les sites régulièrement et de façon automatique (sans intervention humaine, ce qui les distingue des annuaires) pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes (qui relient les pages les unes aux autres) rencontrés sur chaque page atteinte. Un robot accéder à une page comme un navigateur, par contre, il ne lit pas la page comme un internaut. Il lit la ‘code source’ d’une page sous la forme texte. Un robot ne voit pas image, audio, vidéo ou flash. Et puis il apporte des ‘citations’ de textes et des liens qui sont importants pour ‘indexer’ une page.

Après que le robot ‘visite’ une page web et apporte des données, c’est la moteur d’indexation qui commence son travail. Il a comme tâche d’associer à chaque page trouvé par le robot les mots fréquemment utilisés, ainsi que les termes du titre ou d’autres parties significatives de la page. Ils analyse aussi des relations entre différentes pages et différents sites. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internauts à partir de mots-clés.

La troisième partie de moteur de recherche est l’interface d’utilisation et la plate forme d’enquêtes qui peut lire des données depuis les bases de données et sortir les résultats qui correspondent les mots clés par les internauts. (En fait, presque tous les plate formes de moteur de recherche dispose aussi de la fonction d’enregistrer les profils de recherche. La capacité d’enregistrer et d’analyser profondément ces données précieuses sont aussi important que indexer des pages web.) Les processus de fonctionnement de cette plate forme sont :
1. Accepter les mots clé saisi par les internauts, vérifier s’il correspond certain syntaxe avancé, s’il comprend des erreurs d’orthographe pour recommander des termes plus populaire ou des corrections.
2. Vérifier si l’enquête correspond à une recherche verticale (comme recherche d’actualité ou recherche d’image) pour mieux trouver le résultat.
3. Générer une liste de pages correspondantes comme le résultat de recherche organique. Ces résultat sont ranger selon beaucoup de formules comme le contenu de pages, les données de link etc. Chaque moteur de recherche dispose leur propres formules qui sont des tops secrets.
4. Vérifier la base de donnée de publicités pour voir s’il y a des pubs correspondants à la recherche pour diffuser.
5. Mise en place des résultats de recherche en générant des pages de résultats de recherches.

Source :
Fonctionnement des moteurs de recherche et annuaires ; http://addanurl.online.fr/fonctionnement.php3
Moteur de recherche, http://fr.wikipedia.org/wiki/Moteur_de_recherche
History of Search Engines: From 1945 to Google 2007, http://www.search-marketing.info/search-engine-history/#search-work

Posted in moteur de recherche, ABC de Moteur de recherche |

2 Responses

  1. Allez118, Votre Guide de Recherche » Blog Archive » Catégorie de Moteur de recherche Says:

    […] Un annuaire (directory) est un outil de recherche qui recense des sites Web et les classe par catégories (on parle également de rubriques). Les plus connus sont Yahoo! et DMOZ (Open directory project). Google dispose aussi son annuaire “Google Annuaire“. La plus grande caractéristique d’annuaire qui le distingue avec un moteur de recherche au sens étroit, est que les sites web sont collectés à la main, par humain, par rapport au des “moteurs” super automatisés par un “robot“. Dans le monde les annuaires connus sont Virtual Library , EINet Galaxy, Yahoo! Directory, Open Directory Project, Librarians’ Internet Index, Business.com, Looksmart etc. […]

  2. Catégories de Moteur de recherche « Les meilleurs moteurs de recherche Says:

    […] Un annuaire (directory) est un outil de recherche qui recense des sites Web et les classe par catégories (on parle également de rubriques). Les plus connus sont Yahoo! et DMOZ (Open directory project). Google dispose aussi son annuaire “Google Annuaire“. La plus grande caractéristique d’annuaire qui le distingue avec un moteur de recherche au sens étroit, est que les sites web sont collectés à la main, par humain, par rapport au des “moteurs” super automatisés par un “robot“. Dans le monde les annuaires connus sont Virtual Library , EINet Galaxy, Yahoo! Directory, Open Directory Project, Librarians’ Internet Index, Business.com, Looksmart etc. […]

Leave a Comment

Please note: Comment moderation is enabled and may delay your comment. There is no need to resubmit your comment.