Les moteurs de recherche

 

Etude du moteur de recherche Google 

http://www.google.fr

1. Recherche simple

Dès sa page d'accueil, Google propose une barre de requête permettant d'effectuer des recherches. Vous pouvez y inscrire des mots-clés simplement séparés par des espaces.

Dans Google, un simple espace entre deux mots-clés est considéré comme un ET par le moteur.

En procédant de cette manière, intuitive mais limitée, vous perdez des possibilités de recherche plus fines. Pour accéder à ces possibilités, cliquez à droite de la barre de requête sur la commande « Recherche avancée ».

2. Recherche avancée

Interface de recherche avancée de Google

Interface de recherche avancée de Google

La recherche avancée permet de combiner les mots-clés et d'utiliser des filtres pour paramétrer les recherches.

Combiner des mots-clés :

La rubrique « Pages contenant » permet de combiner les mots-clés :

·         avec les opérateurs ET (tous les mots suivants),

·         OU (au moins un des mots suivants),

·         SAUF (aucun des mots suivants),

·         « ... » (cette expression exacte).

Il suffit de placer les mots-clés voulus dans les espaces prévus...et Google saura retranscrire la bonne syntaxe.

Utiliser les filtres :

·         Limiter la recherche aux pages rédigées dans une langue donnée (Langue),

·         Limiter la recherche des résultats à un pays (Région).

·         Exclure ou au contraire privilégier un format de fichier spécifique : .doc, .xls, .pdf, .ppt (Format de fichier).

·         Limiter la recherche à une date (Date).

Remarque : la date prise en compte est celle de l'entrée de la page dans l'index de Google et non sa date de réalisation.

·         Préciser le champ de la recherche : n'importe où dans la page, dans les titres, dans les URLs, dans le corps de la page ou les liens de la page (Emplacement).

·         Exclure ou au contraire privilégier une extension de Nom de Domaine (Domaines).

·         Rechercher des pages similaires (Similaires). Rechercher des pages liées à une page (Liens).

·         Effectuer des recherches sur un sujet précis (Recherche de code source public).

3. Quelques idées à avoir en tête lors de la création d'une requête sur Google

En pratique, il est préférable d'avoir entre trois et six mots dans une requête. Google favorise dans son classement les pages dans lesquelles les mots-clés sont à proximité les uns des autres.

·         Être précis et utiliser plusieurs mots pour affiner la requête.

Utiliser « Java Indonesia », « java coffee », ou « langage de programmation java » plutôt que « Java »

·         Utiliser l'ordre du langage naturel. Ne pas utiliser de mots vides (le, la, un, du, etc...).

Utiliser « programme abandon cigarette » plutôt que « programme pour abandonner l'addiction à la cigarette »

·         Savoir que Google renvoie des pages qui contiennent exactement les mots-clés cherchés.

Si l'on entre le terme "cheval", Google ne fait pas porter la recherche sur "chevaux", "chevaline" ou "chevalerie", mais uniquement sur le terme "cheval".

·         Savoir que Google peut faire des propositions orthographiques

Si on tape : « Anna Kornikova tennis », Google répond : « vous voulez dire : Anna Kournikova tennis ? »

·         Savoir que Google peut proposer parfois d'autres mots-clés pour une requête. Les mots-clés proposés sont indiqués en bas de la première page de résultats.

A la requête « développement durable », les propositions de mots-clés sont indiquées en bas d'écran des résultats, sous les mots « recherches apparentées à » :

Proposition de mots-clés par Google

Proposition de mots-clés par Google

MAJUSCULES, minuscules et accents

Savoir que les recherches Google ne tiennent pas compte de la "casse" des lettres (MAJUSCULES/minuscules).

Par défaut, les recherches Google ne tiennent pas compte des accents ou autres signes diacritiques (cédille, tilde espagnol, umlaut allemand, etc.).

4. L'affichage des résultats de Google

Il y a deux étapes :

·         La sélection des pages en fonction des mots-clés de la requête.

·         Le classement des pages de manière à avoir les meilleures pages en tête.

Google tient compte des mots-clés et de leur placement les uns par rapport aux autres dans la page sélectionnée.

Google tient aussi compte de la popularité de chaque page (la popularité d'une page est mesurée par le nombre de pages du Web qui ont un lien vers elle).

Google a mis en place un algorithme dit de PageRanking qui mesure cette popularité. Cet algorithme contribue à placer en tête des résultats, non pas les pages les plus pertinentes, mais les pages les plus appréciées, les plus "populaires".

Attention également aux résultats donnés dès les premières lignes de résultats (sur fond coloré) et à droite de la page (dans une colonne). Il s'agit de liens commerciaux : les résultats ne sont pas issus d'un tri de pertinence ou de popularité (voir chapitre IV).

Liens commerciaux pour le mot-clé vacances

Liens commerciaux pour le mot-clé vacances

5. Quelques caractéristiques globales de Google

Actuellement Google est le moteur le plus utilisé par les internautes.

·         Google est entré en bourse en 2004 et a racheté Youtube en 2006.

·         Son interface est toujours aussi simple.

·         En 2005, Google a indexé plus de 8 milliards de pages. Depuis cette date Google n'indique plus la taille de son index.

·         Le temps de réponse moyen à une requête est de 0,5 seconde.

·         Google propose aussi une recherche dans l'annuaire Open Directory, des images, des vidéos, des cartes, des actualités, des blogs, des livres, etc.

Pour aller plus loin :

Le laboratoire de Google

http://labs.google.fr/

Le blog officiel de Google

http://googleblog.blogspot.com/

 


 

Etude du moteur Exalead

http://www.exalead.fr

Créé en 2006, Exalead se veut une alternative à Google. Multidisciplinaire et multilingue, il possède une base de plus de 8 milliards de pages. Exalead permet une recherche dans le web, les images, Wikipedia, les vidéos.

1. Recherche simple

Dès qu'une page de résultats s'affiche, l'internaute dispose de plusieurs types d'informations :

·         A gauche, des vignettes de prévisualisation des pages des résultats affichés au centre de l'écran.

·         A droite, un espace permettant d'affiner la recherche.

·         Le bouton « Plus de choix » augmente la liste des critères.

Page de résultats du moteur Exalead

Page de résultats du moteur Exalead

Vous pouvez affiner votre recherche en utilisant différents filtres :

·         annuaire (une des caractéristiques d'Exalead est de combiner les pages récupérées par son robot avec les résultats de l'Open Directory),

·         termes associés,

·         langues,

·         zone géographique,

·         types de fichiers,

·         types de sites (blog, forum),

·         multimédia (audio, vidéo, RSS).

2. Recherche avancée

Interface de recherche avancée du moteur Exalead

Interface de recherche avancée du moteur Exalead

La recherche avancée ouvre une fenêtre présentant des fonctionnalités absentes des grands moteurs de recherche concurrents.

En effet, Exalead permet le repérage automatique des expressions et des fautes d'orthographe. Il retrouve également les singuliers/pluriels même irréguliers.

L'équation “spellslike : myopathy country : tn language : uk” permet de trouver des documents sur la myopathie, publiés en Tunisie et écrits en anglais.

Exalead permet le ET implicite, la recherche d'expression avec des guillemets, l'opérateur de proximité NEAR, la troncature droite illimitée (*) et les parenthèses.

Les moteurs de recherche n'offrent pas tous les mêmes possibilités. Il est donc important de consulter les modules d'aide pour s'assurer d'effectuer les recherches de la façon la plus efficace (opérateurs autorisés, recherche sur des champs spécifiques...).

Ces modules d'aide se trouvent le plus souvent en page d'accueil et sont nommés différemment selon les outils (aide, help, tips, about, tout sur...).


 

Les métamoteurs ou métaindex

Introduction

Outils créés plus récemment que les précédents, les métamoteurs interrogent plusieurs outils de recherche simultanément.

Les métamoteurs peuvent être consultés et utilisés directement sur le web ou installés en client sur votre poste.

Les métamoteurs logiciels permettent d'envisager un travail de veille avec la gestion de profils et l'établissement de calendriers d'exploration.

Utilisation

Ces outils n'ont pas d'index en propre mais utilisent les index d'autres outils de recherche (annuaires, moteurs de recherche, métamoteurs, encyclopédies, bases de données). Ils éliminent les doublons et affichent les résultats selon des critères de pertinence.

Avantages

Inconvénients 


 

Etude du métamoteur Ixquick

Ixquick transforme la question posée dans la syntaxe de chaque outil interrogé. Ixquick élimine les doublons et donne les « top 10 » résultant de chaque outil utilisé.

Page de résultats d'Ixquick pour le mot-clé développement durable

Page de résultats d'Ixquick pour le mot-clé développement durable

Vous pouvez choisir de faire votre requête avec certains outils seulement. La liste des outils est cliquable : laisser ou enlever.

Les outils de recherche associés à Ixquick

Les outils de recherche associés à Ixquick

Les résultats sont affichés selon un critère de pertinence propre à Ixquick. Tous les outils de recherche ayant servi à localiser une référence sont indiqués en fin de chaque résultat. Le chiffre entre parenthèse indique le rang de la référence trouvée sur l'outil utilisé.

Zoom sur une des références trouvée avec Ixquick. Dans ce cas, la référence a été trouvée par Yahoo, GlobeTrotter, AlltheWeb et MSN

Zoom sur une des références trouvée avec Ixquick. Dans ce cas, la référence a été trouvée par Yahoo, GlobeTrotter, AlltheWeb et MSN

Les résultats trouvés sur chacun des outils peuvent être visualisés. Il suffit de cliquer sur le nom de l'outil.

Exemple avec clic sur Yahoo

Vous pouvez constater que le résultat Sommaire-Echos du développement durable est bien le premier de la liste des résultats de Yahoo. Vous accédez également aux autres résultats fournis par Yahoo.

Vue de l'intégralité des résultats trouvés sur Yahoo, accessibles en cliquant sur le nom de l'outil

Vue de l'intégralité des résultats trouvés sur Yahoo, accessibles en cliquant sur le nom de l'outil

Ixquick permet l'utilisation du « ET », du « SAUF », des guillemets, de la troncature, des parenthèses ainsi que de nombreux filtres : titre, domaine, hôte, url, liens.

Ixquick permet une recherche simple et avancée.

Les recherches avancées sont possibles sur la plupart des métamoteurs. Mais peu d'entre eux proposent des interfaces spécifiques de recherche avancée. Pour les utiliser, il faut alors savoir écrire la syntaxe des requêtes (en consultant l'aide du métamoteur).