Typologie des outils de recherche sur l'internet

Un livre de Wikilivres.
Cette page doit être wikifiée.link={{{link}}}

Le texte ne correspond pas à la mise en forme Wikibooks (style de Wikibooks, typographie, liens internes, lien entre les wikis, mise en page, organisation des sous-pages, etc.). Participez !

Les outils de recherche sur l'internet, ou plus exactement sur le "web", sont classés selon leur logique de fonctionnement.


- Les annuaires :

Les annuaires ou répertoires (directory) sont des sites qui recensent les adresses (http) de sites web et les classent par catégories. Le plus souvent le recensement est effectué par des humains. L'annuaire le plus connu est Dmoz, [[dmoz:.]]

Les listes de signets, par exemple http://signets.bnf.fr/, ainsi que les sélections d'adresses et les listes spécialisées sont aussi des annuaires.

On trouve aussi des annuaires d'annuaires, des annuaires de bibliothèques, etc.

Les annuaires permettent de trouver rapidement des références avant d'approfondir une recherche.


- Les moteurs de recherche:

Les moteurs de recherche (search engine) sont des logiciels qui explorent les pages web et les indexent par mots clés. Le plus connu est Google qui prétend avoir indexé 1000 milliards de pages web, les principaux autres sont Bing, Yahoo, Exalead, Ask. Il existe des centaines de moteurs, soit généralistes, soit spécialisés par domaines.

Les moteurs de recherche offrent sur leur site une interface qui permet de retrouver les pages web à partir de mots clés et d'opérateurs de recherche.

Les moteurs de recherche permettent d'effectuer une recherche approfondie dans le "web", mais il est nécessaire d'avoir bien étudié leur mode d'emploi.

Chaque moteur a des critères de classement et des opérateurs spécifiques et il fonctionne selon sa logique propre.

Une recherche approfondie nécessite l'utilisation de plusieurs moteurs, car chaque moteur produit des résultats différents.


- les métamoteurs :

Les métamoteurs sont des outils qui effectuent une recherche par mots clés dans plusieurs moteurs de recherche puis effectuent un tri des résultats.

Il existe des dizaines de métamoteurs, par exemple www.search.com, www.dogpile.com, www.yippy.com

Les métamoteurs sont différents des multimoteurs qui sont des pages qui utilisent plusieurs moteurs séparément.

On fait entrer dans la catégorie des métamoteurs les logiciels de recherche (agents), tels que Copernic.

Les résultats d'une recherche par métamoteur sont peu précis, car le métamoteur ne respecte pas les différentes logiques des moteurs utilisés.

Les métamoteurs permettent de dégrossir rapidement un sujet avant d'effectuer une recherche approfondie.

- les multi-moteurs On désigne par « multi-moteurs » (ou plus rarement, « super moteur »<ref>(XLSearch ou Hooseek se désignent comme des supermoteurs et Supermoteur était le nom d'un multi-moteur<) une page web proposant un ou plusieurs formulaires permettant d'interroger plusieurs moteurs. Il peut également (mais plus rarement) s'agir d'un logiciel, d'une fonction ou d'un plugin de navigateur web, ou d'une barre d'outils…

Le choix d'un des moteurs peut se faire par bouton, bouton radio, onglet, liste déroulante ou autre.

Les premières pages de ce type recopiaient le code des formulaires de plusieurs moteurs. Avec l'apparition du JavaScript il est devenu possible de n'avoir plus qu'un seul formulaire.
On peut citer par exemple Creative Commons Search, Ecosia, Disconnect, le moteur de recherche de Maxthon, HooSeek (fermé en 2012).


- les catalogues de livres :

Les catalogues recensent les livres, monographies, thèses, et autres documents à publication unique. On peut distinguer:

- les catalogues de bibliothèques (OPAC) qui recensent la totalité des livres d'une bibliothèque, voire même de dizaines de bibliothèques (catalogues collectifs).

L'utilisation efficace d'un catalogue de bibliothèque nécessite de savoir utiliser une liste d'autorité, de vedettes matières ou un thésaurus.

- les catalogues de librairies, les plus connus étant Electre (payant) ou Amazon (consultation gratuite).

- les catalogues open access : http://www.worldcat.org/

Les catalogues permettent de repérer le document qui contient l'information recherchée. L'accès au document lui même se fait en consultant le livre en bibliothèque ou en l'achetant.

Pour les livres libres de droits Il existe aussi des catalogues de livres numériques disponibles gratuitement sur le web, par exemple Gutenberg http://www.gutenberg.org/ ou Gallica (bnf) http://gallica.bnf.fr/


- les bases de données d'articles de revues :

Les bases de données d'articles sont appelées aussi base de sommaires, car elles recensent les articles publiés dans les revues et publications périodiques.

Ce sont des entreprises privées qui s'abonnent à des dizaines de milliers de revues et qui classent et indexent leurs articles, souvent accompagné d'un résumé (abstract)

Les plus connues sont INIST http://www.refdoc.fr/ Thomson http://wokinfo.com/ Factiva

Ces services sont payants mais recouvrent une immense quantité d’informations.

Les outils open archives comme http://doaj.org/ http://hal.archives-ouvertes.fr/ sont très utiles. Également les bases de données d'article de presse, c'est à dire les archives des quotidiens, magazines, hebdos, sont une source d'informations utiles. Par exemple http://www.europresse.com/. Ou encore la base de données de l'agence de presse AFP http://afp.pressedd.com/qui contient 190 millions de dépêches de presse.


- les outils humains

Il existe des sites qui permettent de poser des questions à des humains et de recevoir une réponse correcte. On peut distinguer:

- les services de renseignement des bibliothèques : des bibliothécaires ou documentalistes professionnels font gratuitement une recherche documentaire, leur travail consiste à procurer les références de documents dont la consultation qui permettront d'effectuer une recherche d'information. cf BNF, BPI

- les sites de questions - réponses : dans lesquels les internautes posent des questions auxquels d'autres internautes répondent, par exemple http://fr.answers.yahoo.com/

- newsgroups et forums: googlegroups, forums publics ou semi publics, ... ce sont des sites d'échanges d'informations spécialisées.

Étonnamment une recherche d’information difficile, peut parfois se résoudre ainsi, à condition d'examiner les réponses avec circonspection.


- les outils spécialisés selon la nature du document

- cartographie (google maps, geoportail, cadastre ...)

- images

- sons

- audiovisuel (youtube, ina)

- pdf ou ppt


- les outils de recherche spécialises dans la recherche sur domaine particulier

entreprises (insee infogreffe kompass bd entreprises brevets ...) juridiques gouvernementaux politiques sites officiels

Ces outils ont des spécificités qui justifient une étude séparée.


- conclusion. (hors sujet ?)

Il faut noter que l'utilisation des outils de recherche impose que l'on fasse une double recherche: d'abord on doit rechercher les outils de recherche pertinents, puis à l'aide des ces outils on effectue la recherche d'informations. Méthodologiquement, il peut même être intéressant de séparer la recherche des sources d'information et la recherche des outils permettant d'exploiter ces sources.

On parle parfois du "cycle de la recherche", qui se déroule en quatre étapes:

1 - définir complètement l'information à trouver

2 - définir les outils de recherche à utiliser

3 - collecter l'information

4 - évaluer le résultat et revenir en 1 s'il est insuffisant

La recherche d'information ne s'improvise pas, c'est une technique à acquérir, et cela demande méthode et organisation.