Recherche d'information sur l'internet/Web profond
Définition
[modifier | modifier le wikicode]Un obstacle à une bonne recherche d'information sur l'internet est qu'un très grand nombre de pages web ne sont pas ou sont mal repérées par les moteurs de recherche - on parle alors de "web invisible" ou "web profond" - il s'agit notamment de :
- sites exploitant des bases de données (les pages d'interrogation sont repérées mais pas le contenu des bases de données)
Exemples :
- certaines librairies en ligne, les catalogues de bibliothèques (par ex. catalogues des bibliothèques des nations-unies http://www.unsystem.org/en/libraries/index.html), ...
- pour le cinéma : http://www.IMDB.com
- pour les CD : http://FreeDB.org (ou CDDB sur http://www.Gracenote.com)
- sites protégés par mot de passe
- et tous les sites mal référencés... (cf la théorie du "nœud papillon")
Mais les progrès des moteurs permettent de diminuer la part de ce "web invisible", par exemple, Google et HotBot indexent désormais le contenu des documents pdf et Microsoft Office (doc, xls, ppt) et Alltheweb les pages en "Flash"© On trouve également des "métamoteurs" (ou "métaportails") spécialisés :
Moteurs spécialisés : recherche dans plusieurs bases de données
[modifier | modifier le wikicode]Certains "metaportails" offrent la possibilité de recherche simultanée dans plusieurs bases de données.
Des outils en ligne, comme Turbo 10 (http://www.turbo10.com), ou téléchargeables, comme Copernic (http://www.copernic.com) ou Strategic finder (http://www.digimind.fr), peuvent lancer une requête simultanément dans plusieurs bases de données (notamment dans celles des librairies en ligne).
C'est également le principe des comparateurs de prix.
Ouvrages en ligne
[modifier | modifier le wikicode]Internet public library (reading room) http://www.ipl.org/div/reading
Presse
[modifier | modifier le wikicode]Les métamoteurs de recherche d'articles
[modifier | modifier le wikicode]World News http://www.wn.com ; Rocket News www.rocketnews.com ; Worldpress Review http://worldpress.org/search
interrogent simultanément les journaux en ligne du monde entier.
Google news http://news.google.fr compose automatiquement sa "une" en fonction des sujets les plus traités par les sources qu'il recense.
DeepIndex actualités http://www.news.deepindex.com/ recherche sur la presse en ligne francophone.
Les bases de données d'articles
[modifier | modifier le wikicode]FindArticles http://www.findarticles.com possède sa propre base de données d'articles - ceux-ci n'étant pas tous accessibles en ligne par ailleurs.
Worldpress http://worldpress.org/search offre également accès à sa propre base de données de fiches pays et de documents "exclusifs"
Répertoires spécialisés
[modifier | modifier le wikicode]Il est aussi utile de connaître des répertoires spécialisés dans les domaines qui vous intéressent.