Un moteur de recherche est un système logiciel qui collecte des informations à partir du World Wide Web et qui les présente aux utilisateurs qui recherchent des informations spécifiques.
Un moteur de recherche dirige les processus suivants :
- Robot d'indexation : Recherche de sites web par le parcours des Hyperliens contenus sur les pages web, à la fois à l'intérieur d'un site, mais aussi d'un site vers un autre site. Le propriétaire d'un site web peut empêcher les robots d'indexation (ou araignées) des moteurs de recherche d'accéder à des zones du site en spécifiant l'information "robot exclusion" dans un fichier nommé
robots.txt
pour les exclure. - Indexation : Association de mots-clés et d'autres informations avec des pages web spécifiques qui ont été parcourues. Cela permet aux utilisateurs de trouver des pages pertinentes le plus rapidement possible.
- Recherche : Recherche de pages web pertinentes basée sur des requêtes constituées de mots-clés et d'autres commandes adressées au moteur de recherche. Ce dernier trouve les URLs des pages qui correspondent à la requête et les classe en fonction de leur pertinence. Il présente ensuite les résultats à l'utilisateur dans l'ordre d'importance.
Le moteur de recherche le plus populaire est Google. Parmi d'autres moteurs de recherche populaires figurent Yahoo!, Bing, Baidu et AOL.
Pour approfondir
- Moteur de recherche sur Wikipédia
- Moteur de recherche sur Webopedia (en anglais)
- Comment fonctionnent les moteurs de recherche Internet sur How Stuff Works (en anglais)