« La documentation » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
Ligne 42 : Ligne 42 :
== Notions de documentation et de document ==
== Notions de documentation et de document ==


Le moment est venu de définir avec précision les différents termes et concepts utilisés dans le vaste domaine de la documentation.
=== Définitions ===


{{T|[[/Notions de documentation et de document|notions de documentation et de document]]}}
Le terme '''documentation''', dont l'origine remonte aux environs de 1870, avait alors le sens de « recherche de documents pour faire une étude ou une thèse ». Vers 1930 il est devenu « exploitation méthodique de l'information ». Aujourd'hui on parle de la
« fonction documentation » d'un organisme, fonction qui est destinée, selon M. Guillot (1973), « à l'établissement d'un réseau organisé de collecte et de diffusion de l'information venant renforcer et compléter les réseaux d'information propres à chacun des agents de l'organisme considéré ».

On appelle '''document''' tout objet qui peut apporter de la connaissance, enseigner, renseigner...

Pour que l'on puisse parler de document, il faut à la fois un '''contenu''' et un '''support''' : un discours, pas exemple, ne peut être cité comme document que si l'on dispose du texte écrit ou d'un enregistrement. En outre, un document ne peut jouer son rôle que grâce aux canaux de diffusion ou '''media'''.


[[File:Notion de document.svg|150px|center]]


Il convient d'ajouter immédiatement qu'une information n'est utile à son destinataire que si celui-ci possède les connaissances adéquates pour la déchiffrer, la comprendre ou même seulement la pressentir.

=== Types de documents ===

Les documents peuvent être de types très divers :

* '''documents visuels''' :
:- textes imprimés de toutes sortes,
:- graphiques, cartes, schémas, diagrammes, plans,
:- travaux iconographiques, dessins avec ou sans texte, tableaux, photographies sur papier, diapositives, films fixes et muets...

* '''documents sonores''' :
:- disques,
:- bandes magnétiques...

* '''documents audio- visuels''' :
:- films,
:- bandes magnétiques,
:- vidéodisques,
:- mémoires informatiques,
:- montages audio- visuels...

* '''objets''' :
:- pièces de musée,
:- échantillons industriels ou commerciaux...

Les supports autres que le papier sont de plus en plus utilisés.

=== Critères de classement ===

Les documents peuvent être classés en fonction de multiples critères, tels que :

* la nature de l'information :
:- numérique,
:- sonore,
:- textuelle,
:- iconique,
:- graphique...

* le mode de diffusion des documents :
:- interne,
:- public,
:- confidentiel,
:- souterrain (littérature grise)...

=== Changement de support ===

Chaque type de support peut contenir des informations très diverses. Le papier peut supporter du texte, des images, un disque compact numérique ou une mémoire informatique peut contenir des textes, des images, des sons, etc. De même, une information peut changer de support sans changer de nature : un même texte peut être gravé dans la pierre, imprimé sur du papier, enregistré sous forme d'une image photographique ou scanné pour créer un fichier numérique. En réalisant une microcopie d'un document, on ne fait que créer, à partir de l'original, un '''document de substitution''', de même qu'en scannant les pages d'un livre. L'usage de documents de substitution est la règle pour tous les documents précieux que l'on souhaite mettre à disposition du public tout en préservant l'original.


== Chaîne documentaire et rôle des documentalistes ==
== Chaîne documentaire et rôle des documentalistes ==

Version du 12 février 2010 à 17:59

LA DOCUMENTATION


CDU:0

  1. Introduction
  2. La documentation et l'enseignement
  3. Notions de documentation et de document
  4. Chaîne documentaire et fonctions des documentalistes
  5. Performances d'un système documentaire
  6. Langages documentaires à structure hiérarchique, classifications
  7. Langages documentaires à structure combinatoire, thésaurus
  8. Informatique documentaire
  9. Rédaction technique
  10. Durées de conservation
  11. Gestion d'un centre de documentation et d'information
  12. Essai : les catégories dans Wikibooks
  13. Bibliographie


Introduction

Un développement exponentiel de l'information

Au développement spectaculaire des sciences et des techniques correspond un accroissement sans précédent des connaissances humaines. Il n'est pas exagéré de parler d'un « règne de l'information ». Cette dernière, sous toutes ses formes, est plus que jamais à la base de toute activité humaine. L'apparition récente de systèmes d'information libres tels que Wikipédia ou Wikilivres accompagne depuis quelques années ce mouvement général.

Les spécialistes disent que le nombre des données disponibles double tous les dix ans. Cela correspond à une multiplication par mille en un siècle et par seize, ce qui n'est déjà pas si mal, au cours des quelques quarante années d'une vie professionnelle. Naturellement, il ne s'agit là que d'une moyenne, certains domaines de la connaissance sont « en léthargie », on ne fait plus guère de recherches sur la machine à vapeur, tandis que d'autres connaissent au contraire un développement quasi explosif.

Chaque découverte suscitant plusieurs nouvelles questions, disait un humoriste, il s'ensuit que la quantité d'ignorance croît beaucoup plus vite que la quantité de savoir ! On peut s'en amuser mais c'est un vrai sujet de préoccupation. Chaque cerveau ne peut emmagasiner qu'une partie de plus en plus faible des connaissances humaines, celles-ci sont donc de plus en plus dispersées chez des spécialistes dont le niveau est très élevé dans quelques domaines très restreints mais de plus en plus faible en valeur relative dans la quasi totalité des autres domaines, même quand ceux-ci sont relativement proches de leur domaine d'excellence.

Le problème n'est pas nouveau

Les « Observations sur la physique », créées en 1771 par l'abbé Rozier, sont particulièrement intéressantes. Leur fondateur présente ainsi les caractéristiques et les fonctions du périodique scientifique spécialisé, et s'alarme par la même occasion des délais de publication par les académies :

« Ces motifs ont fait désirer qu'un ouvrage périodique, d'un débit sûr et animé, annonçât les découvertes qui se font chaque jour dans les différentes parties des Sciences, soit par des notices abrégées, soit par des mémoires très étendus, qui continssent le développement de toutes les preuves de ces découvertes, en traçant même la marche de l'esprit inventeur ».

La forme des publications et la démarche scientifique sont bien définies dans son esprit. L'auteur précise encore quelques critères de choix des travaux à publier :

« Nous rejetterons (ce qui) ne seroit que compilation indigeste et dénuée de vues neuves et utiles. L'importance des matières, la manière dont elles sont présentées, nous décideront sur le choix des morceaux qui doivent être insérés dans ce recueil ».

Et il ajoute :

« Les vrais savans n'ont pas la manie de faire des secrets de leurs découvertes ; amis de l'humanité, leur gloire est de lui être utile ; aussi c'est à eux que nous offrons ce Recueil, comme un dépôt où ils ont droit de prendre acte de leur découverte ».

Transmission des connaissances, enrichissement et appauvrissement

L'information n'est pas une « marchandise » comme les autres. Lorsqu'une information est communiquée d'un « émetteur » à un « récepteur », le second est normalement enrichi sans que le premier s'en trouve appauvri. C'est que le savoir, au contraire des biens matériels, se multiplie par transmission. Sa possession et sa diffusion au sein d'une communauté humaine sont deux préalables au rêve d'une Société à la fois plus riche et plus juste.

La concurrence effrénée, au contraire, engendre la rétention d'information, le secret, voire la falsification, qui sont autant de facteurs d'appauvrissement collectif. Elle a finalement les mêmes effets pervers que la soif du pouvoir, dont elle n'est au fond qu'un autre aspect. Nous en reparlerons sans doute un peu plus loin, à propos du financement de la recherche par des sociétés privées et de ses conséquences sur la publication des résultats.

Reste que voir dans l'information une simple marchandise serait absurde mais pas autant que minimiser l'aspect de valeur économique et humaine qu'elle prend chaque jour davantage.

La documentation et l'enseignement

Quelle est la place des techniques documentaires dans l'enseignement français, de l'école primaire à l'université ? Quelle est la qualification des personnels qui interviennent dans les centres de documentation et dans l'enseignement ?

pour en savoir plus : la documentation et l'enseignement

Notions de documentation et de document

Le moment est venu de définir avec précision les différents termes et concepts utilisés dans le vaste domaine de la documentation.

pour en savoir plus : notions de documentation et de document

Chaîne documentaire et rôle des documentalistes

Les systèmes d'information vont du simple stockage des documents, sans service associé, à une exploitation systématique et optimisée du contenu informatif. Un service de documentation a généralement deux missions fondamentales :

  • répondre aux requêtes, c'est-à-dire aux questions concrètes posées par les utilisateurs en fournissant autant que possible à ces derniers TOUS les documents pertinents (pas de silence) et SEULEMENT les documents pertinents (pas de bruit).
  • précéder la demande en informant directement les usagers potentiels de toutes les données nouvelles susceptibles de les intéresser.


Dans les deux cas, il est clair que le service de documentation doit être lui- même parfaitement informé des activités et des besoins de ses utilisateurs. A ce niveau se situent les premières sources de conflits. D'abord, le documentaliste doit choisir les documents dignes d'intérêt et se débarrasser des autres. Hélas, il y aura toujours quelqu'un pour ressentir l'impérieux besoin de cette notice qui a été mise au panier avant-hier après une longue hésitation. Bien des utilisateurs vous diront que ces incapables de documentalistes n'ont jamais le document voulu. De leur côté, les documentalistes vous parlerons de ces c... d'utilisateurs qui ne savent même pas ce qu'ils cherchent. Il est heureusement possible de trouver quelques contre-exemples !

On compare parfois le travail du documentaliste à un iceberg : neuf dixièmes faits d'opérations aussi invisibles que fastidieuses et un dixième d'opérations apparentes de réponse et de diffusion. Il faut ajouter que lorsque le traitement de l'information a été bien fait, les recherches deviennent complètes et rapides et cela contribue à accréditer l'idée que le travail des documentalistes est facile et pourrait être fait par n'importe qui.

Le travail des documentalistes comporte plusieurs phases, ou tâches fondamentales :

  • analyse des besoins : on ne se documente pas pour faire joli mais par besoin, un bon documentaliste doit non seulement satisfaire les demandes, mais aussi les prévoir.
  • recherche des sources  : elle n'est pas toujours simple, surtout si le demandeur n'a pas une idée claire de ce qu'il cherche ! Par exemple : où faut-il s'adresser si l'on recherche « un truc pour entraîner simultanément 50 paires de rouleaux de petit diamètre formant une chaîne à géométrie variable qui transporte des feuilles molles de différents formats pour en assurer le traitement dans divers bains chimiques plus ou moins agressifs » ? On vous souhaite ... bon courage !
  • acquisition des documents : par achat, prêt, échange, don ... ne riez pas, cela existe, c'est même assez fréquent et parfois à la fois embarrassant et encombrant.
  • sélection des documents à conserver dans les collections et choix des documents à supprimer : pas de droit à l'erreur !
  • enregistrement des documents : opération administrative de type « inventaire ».
  • catalogage : opération qui consiste à définir les références d'un document afin de pouvoir l'identifier et le retrouver.
  • analyse : c'est une opération purement intellectuelle, très coûteuse. mais fondamentale car elle conditionne la qualité du service documentaire. Nous en reparlerons !
  • stockage physique du document (classement) et stockage des données issues du catalogage (description du contenu) ; le stockage sous forme de dossiers documentaires réalise d'un seul coup l'ensemble de ces opérations mais il n'est pas toujours possible ni souhaitable.
  • diffusion des informations sous forme de services (prêts, recherches rétrospectives, consultation) et de produits (bulletins signalétiques, diffusion sélective de l'information).
  • contrôle.

Tout cela n'inclut pas le temps passer à prêcher dans le désert, à s'auto-persuader que l'on n'est pas encore gâteux et à pousser un bon coup de gueule de temps a autres, histoire de faire savoir que décidément, trop c'est trop. On ne peut être documentaliste sans posséder ce que les autres appellent un mauvais caractère, mais dont on peut avoir la faiblesse de penser qu'il s'agit de caractère tout court. Que les plaignants se fassent une raison, on n'a pas encore trouvé le moyen de robotiser intégralement les chaînes documentaires. Malgré l'informatisation et l'interrogation en ligne, qui du reste ne favorisent guère les contacts humains, on ne peut pas encore se passer totalement des documentalistes :-) !

Ces différents travaux peuvent être rattachés à l'une ou l'autre des trois étapes fondamentales des processus documentaires, qui correspondent à :

  • une fonction entrée (collecte des documents)
  • une fonction traitement (indexation et catalogage)
  • une fonction sortie (produits documentaires et diffusion)

Il s'agit là des trois maillons de ce qu'il est convenu d'appeler la « chaîne documentaire ».

La fonction entrée

Il n'y a pas grand chose à en dire si l'on reste comme ici au niveau des généralités, si ce n'est que les acquisitions dépendent étroitement, en quantité comme en qualité, des besoins spécifiques au système documentaire considéré. Elles sont donc d'une nature et d'un niveau extrêmement variables.

La fonction traitement

On désigne par « fonction traitement » l'ensemble des opérations de mise en forme, de mise en mémoire et de restitution des informations contenues dans les collections disponibles.

Le détail de ces opérations dépend bien sûr de la nature des entrées, mais encore plus de la phase suivante, c'est-à-dire des modalités de la recherche documentaire.

Le traitement documentaire comporte essentiellement deux aspects :

  • la condensation,
  • l'indexation.

Condensation

Le travail de condensation a pour but de résumer le document d'origine, ce qui exige préalablement une analyse approfondie aboutissant à la compréhension de la pensée de l'auteur, puis la rédaction d'un texte adapté aux besoins. Il existe différents types de résumés, classés ici dans l'ordre des longueurs croissantes.

  • Le titre peut parfois suffire, s'il reflète vraiment l'essentiel du contenu,
  • Le résumé signalétique, qui comporte de 10 à 30 mots, est un travail hautement élaboré,
  • Le résumé indicatif, plus large, peut contenir de 50 à 200 mots,
  • Le résumé informatif, qui va de 100 à 300 mots, développe les thèmes, met en valeur les idées, l'argumentation et les conclusions de l'auteur,
  • L'extrait (en anglais, abstract) comporte des éléments d'origine du texte de l'auteur et des raccords pour le bon enchaînement des idées,
  • Le condensé ou abrégé (en anglais, digest), agencé par l'analyste à partir de l'original, représente de 10 à 50 % de ce dernier.

L'auteur est apparemment mieux placé qu'un analyste extérieur pour condenser son propre travail, surtout en raison de sa connaissance (en principe) du sujet traité. Pourtant, le résumé d'un analyste compètent se révèle très souvent meilleur que le résumé d'auteur par la méthode, l'exhaustivité, l'objectivité, la cohérence. Un résumé d'analyste, faut-il le préciser, est aussi bien plus coûteux qu'un résumé d'auteur.

On ne fait pas le même genre de résumé pour tous les documents, ni pour tous les types de « clientèle » ; par ailleurs, le but du résumé peut être la diffusion immédiate d'une information condensée ou la préparation du travail d'indexation qui permettra de mémoriser l'information à exploiter ultérieurement.

Indexation

Il est généralement impossible de faire coïncider l'analyse documentaire et la recherche documentaire sans avoir recours à un outil de travail fondamental que l'on appelle un langage documentaire.

Selon l'Association Française de Normalisation (AFNOR), l'indexation est « un procédé destiné à représenter par les éléments d'un langage documentaire ou naturel des données résultant de l'analyse du contenu d'un document ou d'une question ».

L'United Nations International Scientific Information System (UNISIST), programme des Nations Unies destiné à faciliter la publication des données scientifiques au niveau mondial, donne une définition voisine : l'indexation est « l'opération qui consiste à décrire et à caractériser un document à l'aide de représentations des concepts contenus dans ce document, c'est-à-dire à transcrire ces concepts en langage documentaire, après les avoir extraits du document par une analyse. La transcription en langage documentaire se fait grâce à des utils d'indexation tels que thésaurus, classifications, etc. »

L'indexation se déroule normalement en trois étapes : prise de connaissance du contenu, choix des concepts à représenter, traduction de ces concepts en langage documentaire.

Les langages documentaires se répartissent en deux grandes catégories :

  • Les classifications sont des langages à structure hiérarchique, elles constituent historiquement les premiers langages documentaires ayant été largement utilisés. Une classification, ou « plan de classement » établit a priori des subdivisions dans un ensemble de concepts traités de manière hiérarchique. La Classification de Dewey et la Classification Décimale Universelle (CDU), sont les plus connues, mais on peut aussi trouver des classifications spécialisées dans un domaine très restreint.
  • Les thésaurus sont des langages analytiques, ou langages à structure combinatoire. En pratique, un thésaurus est un dictionnaire de termes normalisés ou descripteurs, organisés en fonction des concepts qu'ils représentent et reliés entre eux par des relations sémantiques.


Quel que soit le langage documentaire utilisé, c'est de la qualité de 1'indexation que dépend le bon fonctionnement du système documentaire. Une mauvaise indexation engendre des quantités de bruit et de silence qui diminuent le confort et le rendement d'une recherche rétrospective.


Les concepts retenus pour l'indexation dépendent de multiples facteurs : objectifs du centre de documentation, besoins des utilisateurs, indexations précédentes, système documentaire, qualification du personnel...

L'exhaustivité ou profondeur d'indexation dépend du nombre moyen de descripteurs utilisés pour les documents. Elle augmente avec la richesse du langage documentaire et la connaissance de ce dernier par les analystes.

La spécificité de l'analyse est relative à la nécessité du choix entre des concepts généraux (traitements thermiques, produits chimiques, usinage, animaux, physique fondamentale...) ou plus spécialisés (durcissement superficiel par laser, pyralène, taillage des engrenages coniques, Pyronia tithonus, neutrino solaire...).

Les mêmes concepts ne sont pas forcément adéquats pour une diffusion a priori de l'information et pour une recherche rétrospective.

Performances d'un système documentaire

Comme nous l'avons signalé, ces performances dépendent étroitement de la qualité de l'analyse et de l'indexation. Il est intéressant de les chiffrer, ne serait-ce que pour en tirer les renseignements nécessaires à l'amélioration du service.

Notion de cohérence

Si deux indexations d'un même document ont fourni deux ensembles A et B de descripteurs, le taux de cohérence s'écrit :

Le taux de cohérence peut être externe, A et B provenant de deux analystes différents, ou interne, les deux indexations étant l'œuvre du même analyste à des dates différentes. Une baisse du taux de cohérence est le signe d'une indexation de mauvaise qualité et qu'il convient de corriger.

Efficacité de la recherche

Une recherche documentaire idéale dans l'ensemble N comportant tous les documents d'une certaine collection conduirait à en extraire le sous-ensemble des documents pertinents et lui seul. En pratique une telle recherche aboutit en fait à extraire un autre sous-ensemble généralement distinct du précédent.



On peut ainsi répartir les N documents de la collection en quatre catégories :

  • P : nombre de documents pertinents extraits, le résultat
  • S : nombre de documents pertinents non extraits, ou silence,
  • B : nombre de documents non pertinents extraits, ou bruit,
  • R : nombre de documents non pertinents non extraits, ce qui reste.


naturellement

On définit à partir de ces nombres divers critères :

  • le taux de rappel :
  • le taux de pertinence :
  • le taux de bruit :
  • le taux de chute :
  • le facteur de généralité :

Amélioration des performances

Diverses techniques permettent d'affiner les résultats des recherches effectuées en combinant divers descripteurs.

  • l'autopostage consiste à adopter simultanément des descripteurs situés à divers niveaux de généralité et/ou de spécificité. Par exemple, le terme « trempe » peut être trop général pour la recherche en cours, on adoptera alors les descripteurs qui permettront de le préciser, comme « traitement thermique » ou « trempe superficielle ».
  • la pondération : on affectera chaque descripteur d'un « poids » différent, 1, 2 ou 3 par exemple.
  • le lien permet d'éviter les fausses combinaisons. par exemple, une recherche simultanée sur un ensemble de descripteurs tel que (bateau, transport, bois, FRANCE) peut permettre de retrouver des documents sont les titres pourraient être :
(1) Transport du bois français par bateau,
(2) Transport des bateaux français en bois,
(3) Bateaux en bois français pour le transport,
(4) Transport du bois vers la France en bateau,
(5) etc.

La combinaison (1) sera notée [transport (A) - bateau (A) - bois (B) - FRANCE (B)].

Antidictionnaire

« Du », « par », « des », « en », « pour », « faire », « je », ... sont des mots vides utiles pour construire des phrases mais dénués de toute référence à un véritable contenu informatif. On les consigne dans un antidictionnaire. Les mots vides sont grosso modo ceux que l'on supprimait en écrivant un télégramme, d'où l'expression « style télégraphique » ; ils ne doivent en aucun cas être utilisés comme descripteurs, d'où la nécessité d'en dresser la liste.

Bibliographie

  • GABLOT, Ginette .- Qu'est-ce qu'un périodique scientifique ?. In : Bulletin des Bibliothèques de France, 1984, n° 5, pp. 384-387 [en ligne]. Disponible sur l'internet : http://bbf.enssib.fr/. [Consulté le 10 février 2010].
  • GUILLOT, M. .- Pourquoi un service de documentation d'entreprise .- Paris, Management France, juillet 1973.