Aller au contenu

La documentation/Langages documentaires à structure hiérarchique, classifications

Un livre de Wikilivres.

LA DOCUMENTATION


CDU:0

  1. Introduction
  2. La documentation et l'enseignement
  3. Notions de documentation et de document
  4. Chaîne documentaire et fonctions des documentalistes
  5. Performances d'un système documentaire
  6. Langages documentaires à structure hiérarchique, classifications
  7. Langages documentaires à structure combinatoire, thésaurus
  8. Informatique documentaire
  9. Rédaction technique
  10. Durées de conservation
  11. Gestion d'un centre de documentation et d'information
  12. Essai : les catégories dans Wikibooks
  13. Bibliographie


Généralités

[modifier | modifier le wikicode]

De tous temps, l'administration des bibliothèques a fait apparaître le besoin de plans de classement. Les siècles passés ont vu naître de multiples tentatives d'organisation allant dans ce sens ; on peut citer par exemple les travaux du Français Lacroix du Maine (1584) ou de l'Américain Nathaniel B. Shurtleff (1856).

L'idée de remplacer les systèmes d'indexation à base de lettres et de chiffres romains a fait petit à petit son chemin. On doit au physicien André-Marie Ampère (1834) et au mathématicien hongrois Tarkas von Bolyai (1835) des classements décimaux destinés aux différents domaines scientifiques.

Cette notion de classement décimal est importante, car la numération à base 10 est l'un des rares éléments culturels communs à la quasi totalité des peuples du monde, ce qui n'est évidemment pas le cas pour les alphabets.

Les classifications ont donc été, historiquement, les premiers langages documentaires disponibles.

Caractéristiques et conception des classifications

[modifier | modifier le wikicode]

Précisons tout d'abord qu'il ne faut en aucun cas confondre classement et classification. Pour faire simple, le classement se réfère au matériel permettant de ranger les objets en fonction de leur nature (livres, films, diapositives, disquettes, échantillons industriels, etc.) tandis que la classification est un outil permettant d'organiser ces objets de façon logique. Comparaison n'est pas raison, mais on pourrait trouver une analogie dans le domaine informatique en considérant la distinction évidente entre matériel et logiciel.

Diverses sortes de classifications

[modifier | modifier le wikicode]

Une classification ou plan de classement est un système organisé et hiérarchisé de classification d' « objets », ces derniers n'étant pas forcément des documents. Parmi les « objets » concernés par les classifications, on peut trouver par exemple les roches, les espèces animales et végétales vivantes, les maladies, les professions, les produits manufacturés, les étoiles, les brevets d'invention, etc. La diversité des « objets » pouvant être très grande, on imagine facilement qu'elle entraîne une diversité non moins grande des systèmes de classification.

Les classifications peuvent être générales ou encyclopédiques, comme la Classification de Dewey ou la Classification Décimale Universelle, qui recouvrent par définition tous les domaines de la connaissance ; d'autres se cantonnent à un domaine plus restreint, comme le Plan de Classement de l'Institut National de la Statistique et des Sciences Économiques (INSEE), la classification binominale des espèces vivantes ou encore la Classification Internationale des Maladies publiée par l'organisation Mondiale de la Santé (OMS) pour l'enregistrement des causes de morbidité et de mortalité touchant les êtres humains à travers le monde. L'appellation complète de cette dernière est « Classification statistique internationale des maladies et des problèmes de santé connexes » ou en anglais International Statistical Classification of Diseases and Related Health Problems ; en français on abrège souvent en CIM et en anglais, en ISC.

Les classifications « à champ étroit » sont généralement établies par les spécialistes du domaine concerné et sont généralement acceptées sans difficulté. En revanche les classifications à vocation universelle font l'objet d'un certain nombre de critiques : l'importance donnée à certains domaines est arbitraire, les spécialistes n'en utilisent qu'une partie très restreinte et par ailleurs elles se prêtent assez mal à l'informatisation.

En pratique les classifications sont très importantes pour organiser la vie et le travail de chacun d'entre nous et nous les pratiquons souvent à la façon de Monsieur Jourdain, sans même nous en rendre vraiment compte.

Création d'une classification

[modifier | modifier le wikicode]

Dans une classification, les objets ou les concepts sont représentés par des codes, ou indices, qui peuvent être numériques ou alphabétiques. Ces indices sont imbriqués, généralement par subdivision, chaque rubrique étant divisée en sous-rubriques, aussi loin qu'il le faut pour obtenir une description d'une finesse suffisante. De cette manière, un indice court représentera logiquement une notion générale, et un indice long une notion beaucoup plus spécifique. L'ensemble des classes et des sous-classes ainsi établies constitue un arbre hiérarchique.

D'après Vickery, l'établissement d'une classification passe par 7 étapes successives :

  • analyse du domaine à couvrir, définition de ses limites, détermination des « choses » dont il s'agit de fixer l'ordre, établissement d'une liste de groupes de termes associés aux « choses » concernées,
  • détermination des domaines spécifiés en premier par les « choses » et des catégories qui se retrouvent dans plus d'un domaine,
  • groupement des termes de chaque catégorie dans un ordre utile qui facilitera les recherches ultérieures, examen de la ou des suite(s) hiérarchique(s),
  • établissement des relations entre catégories, fixant l'ordre des combinaisons des catégories dans les sujets composés,
  • recherche d'un moyen efficace et simple pour exprimer les relations entre les concepts, groupement des termes à utiliser selon ce que Ranganathan appelle des « facettes », ou sous-classes précisant les divers aspects des « choses ». Cela peut correspondre, par exemple, aux aspects théorique, pratique, économique... ; dans le domaine de l'aéronautique, on s'intéressera par exemple aux moteurs d'avions, aux infrastructures au sol, aux types d'appareils, à la sécurité, au pilotage... On distinguera ensuite des « sous-facettes », qui dans le dernier exemple choisi pourront être des distinctions entre les divers types d'avions, ceux destinés aux passagers, à l'armée, ceux qui sont propulsés par des hélices, etc.
  • étude des relations des divers domaines entre eux et, autant que faire se peut, unification de l'ordre des termes,
  • expression des relations des domaines envisagés avec les disciplines traditionnelles.


Comme l'écrit René Dubuc : « On voit la complexité de ce travail théorique et son ampleur ». C'est pourquoi... « il ne doit être entrepris qu'à bon escient et lorsqu'il n'existe aucune classification existante ou valable dans le domaine faisant l'objet des documents à classer. »

Critères de choix d'une classification

[modifier | modifier le wikicode]

Les classifications bien étudiées présentent un cadre logique pour l'indexation des documents à traiter et une grande simplicité d'emploi pour les utilisateurs, ainsi que la possibilité, par simple modification de la longueur des codes, d'augmenter ou de restreindre le caractère général des concepts.

Les classifications présentent cependant quelques inconvénients, dont le plus Important est la rigidité qui rend difficiles les mises à jour. Il ne saurait en effet être question de modifier les indices tous les matins, surtout lorsque l'on travaille dans une bibliothèque de quelque importance regroupant plusieurs millions de références. Par ailleurs l'un des intérêts des classifications est qu'elles permettent une communication facile entre les organismes qui les utilisent en commun, de sorte que les modifications effectuées par l'un de ces organismes doivent impérativement être répercutées à tous les autres.

Signalons aussi que bon nombre d'arguments avancés contre les classifications en général, et en particulier contre les classifications encyclopédiques, n'ont guère de justification et ne s'expliquent que par une opposition irréductible et/ou un manque de pratique.

Le choix ou l'élaboration d'une classification dépend de la collection à traiter : si l'on a affaire à un ensemble de type « bibliothèque générale » de quelques centaines ou milliers de documents, on pourra utiliser assez facilement un classement de type encyclopédique, en choisissant bien les subdivisions et avec des indices assez courts. En revanche, dans un organisme spécialisé, on risque en appliquant une classification encyclopédique de devoir utiliser un nombre restreint d'indices qui seront alors généralement très longs et commenceront, pour la plupart d'entre eux, par les mêmes symboles. La tentation d'utiliser un système spécifique est alors assez grande mais les tentatives faites dans ce sens ne donnent pas toujours, tant s'en faut, le succès escompté.

Lorsqu'une collection comporte une partie générale et une partie spécialisée, ce qui est fréquent, seul un système encyclopédique convient. C'est encore le cas dans une entreprise où se développent de manière explosive certains secteurs d'activité, tandis que d'autres régressent. Seule une classification préexistante permet de faire face à ce genre de problème. Il faut aussi considérer la nature des documents : on n'accède pas de la même manière, par exemple, à un livre, à une diapositive, à une bande magnétique ou à une collection d'échantillons minéralogiques.

La Classification Décimale de Dewey (CDD)

[modifier | modifier le wikicode]

L'Américain Melvil Dewey (1851-1931) était en 1872 étudiant et assistant bibliothécaire à l'Amherst College (Massachussets). Le classement des ouvrages qu'il devait mettre à la disposition des lecteurs présentait de tels inconvénients qu'il entreprit de le réformer fondamentalement. Il devait par la suite consacrer l'ensemble de sa vie aux problèmes de bibliothéconomie. S'inspirant de travaux antérieurs, mais en les modifiant considérablement, Dewey imagina un nouveau découpage des connaissances humaines en dix grands domaines, chacun d'eux étant à son tour divisé en dix parties, et ainsi de suite.

La première table publiée en 1876 par Dewey, sous le titre A classification and subjects index for cataloguing the books and pamphlets of a library, comportait 42 pages seulement. Elle connut un succès immédiat par son caractère international et sa facilité d'utilisation. Ce succès amena Dewey à publier en 1885 la « Decimal classification and relative index », une seconde édition considérablement augmentée, de 314 pages. Les subdivisions étaient développées au-delà du 3e chiffre.

La classification de Dewey est toujours largement utilisée dans les bibliothèques états-uniennes, bien que les choix de Dewey aient été critiqués dès l'origine. Ils reflètent en tous cas la conception d'ensemble des connaissances humaines que l'on pouvait avoir outre-Atlantique à la fin du XIXe siècle.

Pour plus de détails sur cette classification, le lecteur pourra se reporter à l'article de Wikipédia : Classification décimale de Dewey.

La Classification Décimale Universelle (CDU)

[modifier | modifier le wikicode]

C'est elle qui sert actuellement à l'inventaire des wikilivres français, voir les tables sur Wikilivres:CDU.

Deux avocats belges, Paul Otlet (1868 - 1944) et Henry La Fontaine (1853 - 1943), fondateurs de l’Institut International de Bibliographie en 1895, prirent l'initiative d'adapter et d'assouplir la classification de Dewey, avec son autorisation. Les éditions de leur œuvre, la Classification Décimale Universelle, se sont succédé à partir de 1927, elles contiennent actuellement environ 150 000 sujets et sont traduites dans une vingtaine de langues différentes.

Otlet publia en 1934 un « Traité de documentation » qui reste, malgré certains passages maintenant dépassés, un ouvrage fondamental à bien des égards. Infatigable travailleur de la coopération internationale, il élabora de multiples projets d 'organismes mondiaux aboutissant à la création en 1937 de la Fédération Internationale de Documentation (FID), qui a poursuivi ses travaux jusqu'en 2002, date de sa dissolution. La Fontaine, Président du Bureau International de la Paix en 1907, fut en 1913 lauréat du Prix Nobel de la Paix.

La Classification Décimale Universelle ( C.D.U. ) offre actuellement des possibilités d'utilisation bien plus étendues que la Classification de DEWEY. Elle n'est toutefois pas exempte de défauts qui tiennent en grande partie, comme pour cette dernière, au choix des divisions principales dans lesquelles on peut voir le reflet de l'époque où elles ont été définies.

Une classification décimale est un schéma systématique de classement utilisant une notation à forme décimale. On ne considère pas ici les nombres comme des entiers, mais comme des nombres décimaux dont on aurait enlevé le zéro et la virgule initiaux. Nous verrons plus loin pourquoi. Chaque nombre, ou plutôt chaque indice, pourra donc toujours être divisé en un maximum de dix indices de rang immédiatement inférieur. Il n'est d'ailleurs pas absolument obligatoire d'utiliser les dix divisions disponibles.

Comme la Classification de Dewey, la Classification Décimale Universelle utilise trois principes de base :

  • on classe toujours en partant de l'idée contenue dans le document, de sorte que toutes les notions relatives à un même ensemble de concepts vont se trouver automatiquement rapprochées dans les tables,
  • on classe tout, à l'aide d'indices simples pour les documents relatifs à un domaine bien défini ou à l'aide d'indices composés si le document traite de plusieurs sujets présentant des rapports entre eux, ou encore s'il s'agit de préciser des notions de forme, de langue, de temps, de lieu... On remarquera facilement que dans la CDU il ne peut exister aucune rubrique « divers ».
  • on classe toujours en allant du général au particulier en utilisant les divisions successives en dixièmes, centièmes, millièmes... et ainsi de suite jusqu'au degré de précision nécessaire.


Les classifications généralistes telles que la Classification de Dewey ou la Classification Décimale Universelle couvrent l'ensemble des activités et des connaissances humaines, mais d'autres classifications ne concernent qu'une partie plus restreinte, comme par exemple la faune, la flore, etc.

Une subdivision est entièrement englobée dans la division de niveau supérieur qui la précède, et elle englobe entièrement toutes les subdivisions de niveau inférieur qui la suivent. On constitue ainsi une arborescence, dans laquelle un concept donné ne peut occuper qu'une place et une seule, bien déterminée.

Structure générale

[modifier | modifier le wikicode]

L'ensemble des connaissances humaines est considéré comme l'unité, que l'on divise en dix classes principales définies comme les nombres décimaux suivants :

0,0 Généralités, documentation, écritures,...
0,1 Philosophie, psychologie
0,2 Théologie
0,3 ...

Arrêtons ici : il est clair que tous les indices vont avoir pour premiers symboles : « 0, ». Or, il est non moins clair que l'on cherche à écrire des indices dont chacun représente une notion distincte. Les deux caractères « 0, », communs à tous les indices, n'apportent aucune information intéressante et en conséquence on ne les écrira donc pas, mais ils existent et il faut se le rappeler. Reprenons :


0 Généralités « en général », documentation, écritures...
1 Philosophie, psychologie
2 Théologie
3 Sciences sociales, économie, droit
4 n'est plus attribué pour l'instant
5 Mathématiques, sciences physiques, chimie, sciences naturelles
6 Sciences appliquées, techniques
7 Beaux - Arts
8 Littérature, linguistique
9 Histoire et géographie


On continue de subdiviser, en utilisant toujours la subdivision 0 pour des généralités : par exemple, pour la partie 6 :

60 Généralités sur les sciences appliquées
61 Médecine, pharmacie
62 Art de l'ingénieur
63 Agriculture...


Et ainsi de suite, la partie 62 donnera selon le même principe :

620 Généralités, essais des matériaux, énergie
621 Électrotechnique, mécanique industrielle
622 Mines
623 Génie militaire
624 Génie civil


Au-delà, malgré certaines irrégularités dues pour l'essentiel à des problèmes de mises à jour, il est d'usage de couper les indices trop longs par tranches de trois chiffres séparés par des points. Pour les étourdis, rappelons que les chiffres sont comptés à partir de la virgule, donc de la gauche...

621.32 Lampes électriques
621.321 Lampes à arc
621.326 Lampes à incandescence
621.313.13 Moteurs électriques
621.313.130 Généralités sur les moteurs électriques

etc.

Attention au piège des nombres décimaux. Quel est le plus petit des trois indices suivants ?

73, 221, 637 ???

C'est évidemment (?) 221

Et le plus grand ? C'est 73

Vous en doutez ? Alors remettez en place le zéro et la virgule qui ont été enlevés :


0,221 < 0,637 < 0,73

... CQFD

Signes et symboles

[modifier | modifier le wikicode]

Si l'on doit classer un document dont le contenu peut être caractérisé par un concept simple, il suffit d'employer l'indice CDU correspondant. En pratique ce cas est assez rare. Le plus souvent, les documents à classer font référence à plusieurs concepts étudiés les uns par rapport aux autres. Il a donc fallu choisir un signe de relation, qui est conventionnellement « : » (deux points) ; voici par exemple deux indices :

621.78 traitement thermique des métaux
669.15 aciers alliés

qui peuvent donner deux combinaisons :

621.78:669.15 traitement thermique des aciers alliés
669.15:621.78 aciers alliés pour traitements thermiques

La première combinaison se rapporterait plutôt à un document théorique concernant le traitement thermique des aciers, la seconde au catalogue d'un fournisseur d'aciers spécialement destinés au traitement thermique.

En principe l'ordre dans lequel on écrit les indices correspond à leur importance relative. Le nombre des notions qui peuvent être reliées n'est pas limité :

621.9.02 outils de coupe
621.78:669.15:621.9.02 traitement thermique des aciers alliés pour outils de coupe

Les documentalistes ont inventé diverses méthodes simples pour l'indexation des notions complexes.

  • Addition : Lorsque l'on trouve dans un document deux concepts seulement juxtaposés, et non en relation l'un avec l'autre, alors on peut utiliser le signe « + » comme signe d'addition :
54 + 66 chimie théorique et appliquée
  • Extension : Lorsqu'un document contient un ensemble de concepts dont les indices se suivent dans la table, on utilise la barre oblique « / » comme signe d'extension :
621.56/.59 technique du froid
À noter que l'on doit répéter le dernier point et tous les signes qui le suivent.
  • Intercalation : Les crochets « [...] » constituent le signe d'intercalation qui contient plusieurs notions juxtaposées mais en relation avec une autre qui se trouve en quelque sorte mise en facteur :
621.315.2:[629.113 + 629.135.21] câbles électriques pour automobiles et avions
  • Synthèse : l'apostrophe « ' » est le signe de synthèse, dont l'emploi est autorisé seulement dans un certain nombre de sections particulières :
546.41 calcium et 546.226 sulfate

donnent

546.41'226 sulfate de calcium

Divisions auxiliaires

[modifier | modifier le wikicode]
  • Divisions analytiques : ces divisions existent dans un grand nombre de sections de la table principale, en vue d'une plus grande précision dans la description du sujet traité. On les note avec un tiret « - » ou un point et un zéro « .0 ». Par exemple :
54-325 ortho-acides
66.047 séchage (industriel)
62-72 , dispositifs de graissage, est applicable à tous les indices qui commencent par 62/69 ...
621.614-72 dispositifs de graissage pour souffleries à pistons rotatifs
648.23-72 dispositifs de graissage pour machines à laver
693.542.52-72 dispositifs de graissage pour malaxeurs à béton
  • Divisions communes de langue : elles symbolisent la langue dans laquelle est rédigé le document et sont formées à partir de la classe principale 8 et caractérisées par le signe « égal ».
=00 polyglotte
=20 anglais
=30 allemand
=40 français
=50 italien
=60 espagnol
=82russe
=916.9 basque
=927 arabe
=951 chinois
=956 japonais
etc.
860=20 littérature espagnole (en anglais)
  • Divisions communes de forme : ces divisions se rapportent à la forme des documents écrits mais également à beaucoup d'autres objets. Elles sont placées entre parenthèses et commencent par zéro ; quelques exemples :
(02) exposé systématique sous forme de livre
(03) encyclopédies, dictionnaires, ...
(04) brochures, exposés, conférences, lettres, articles,
(05) publications périodiques, revues
(07) enseignement, étude
(08) polygraphies, collections
(09) sources historiques et juridiques
72(021) manuel d'architecture
621.914.4(083.96) instructions pour l'emploi des machines à fraiser
  • Divisions communes de lieu : elles sont incluses dans des parenthèses et commencent par un chiffre de 1 à 9 :

voici quelques exemples :

326.1(37) le commerce des esclaves dans la Rome ancienne
336.711(410) la Banque d'Angleterre
676(480) l'industrie du papier en Finlande

On peut en cas de besoin ajouter des précisions de lieu en plaçant celui-ci en toutes lettres à la fin de l'indice :

746.2(493.2 Bruxelles) les dentelles de Bruxelles
  • Divisions communes de races et de peuples : elles sont formées à partir des divisions de langue mises entre parenthèses :
299.9(=995) religion des Papous
393.9(=916)coutumes funéraires des Basques
  • Divisions communes de temps : elles sont mises entre guillemets :
341.382"1648" la conclusion de la paix de Westphalie en 1648
551.213(324.41 Vésuve)"0079" l'éruption du Vésuve en l'an 79
631.548.2"324" couverture des plantes en hiver
  • Divisions communes de point de vue : elles rendent possible une subdivision poussée lorsqu'il n'existe pas de division analytique appropriée. Elles sont formées à l'aide d'un point suivi de deux zéros : .00
.001 point de vue théorique
.002 point de vue de la réalisation
.003 point de vue économique et financier
.004 point de vue de l'utilisation et du fonctionnement
.005 point de vue de l'aménagement et de l'équipement
.006 point de vue des locaux et des emplacements
.007 point de vue du personnel
.008 point de vue de l'organisation
.009 point de vue social et moral
621.831.001 théorie des engrenages
674.004.8 utilisation des déchets dans l'industrie du bois
  • Utilisation de lettres ou de noms : La précision d'un nom peut être considérée comme une forme particulière de subdivision :
235.3 Paul Saint Paul
634.11 Golden pommes de la variété Golden
737.1 Trajan monnaie à l'effigie de l'empereur Trajan
  • Notations personnelles : si, après avoir épuisé toutes les possibilités offertes par les tables le classificateur se trouve dans l'obligation de subdiviser encore plus loin, le seul expédient consiste à utiliser des subdivisions personnelles. Il faut alors séparer clairement la notation CDU de l'autre, ce qui se fait le plus souvent en utilisant la lettre « p » :
621.882.215p60 vis à tête ronde de 60 mm de long

La CDU comme thésaurus

[modifier | modifier le wikicode]

Cette utilisation sera envisagée dans le chapitre consacré aux thésaurus.

Utilisation dans le monde

[modifier | modifier le wikicode]

En France, la classification décimale universelle a été utilisée dans la plupart des bibliothèques universitaires mais elle régresse depuis la fin des années 1980, au profit de la classification décimale de Dewey. Elle reste encore en usage dans les centres de documentation et d'information des établissements scolaires du secondaire (essentiellement dans les lycées) et dans de nombreuses bibliothèques publiques ou privées.

En Belgique francophone, l'utilisation de la CDU est requise pour toute bibliothèque souhaitant être reconnue - et donc subventionnée - par la Communauté française de Belgique.

Un aperçu des pays utilisant la CDU (en 2004) est accessible sur le site de l'UDC Consortium : http://www.udcc.org/countries.htm Countries with UDC users.

Éditions de la CDU

[modifier | modifier le wikicode]

La CDU complète n'est disponible que sous forme informatisée auprès de l'UDC Consortium (sous licence). Il s'agit du Master Reference File (MRF). Il existe deux versions francophones ayant pour but de proposer une CDU plus compacte et plus utilisable: une "moyenne" (3 volumes) et une "abrégée" (1 volume). Les éditions du Céfal (Liège, Belgique) possèdent le monopole de l'édition de la CDU en français.

  • Classification décimale universelle : édition abrégée .- Liège, Éditions du Céfal, 2001, 292 p. (ISBN 2-87130-100-X)
  • Classification décimale universelle : édition moyenne internationale - Tables auxiliaires, classes 0 à 5 .- Liège, Éditions du Céfal, 2004, 421 p. (ISBN 2-87130-151-4)
  • Classification décimale universelle : édition moyenne internationale - Classes 6 à 9 .- Liège, Éditions du Céfal, 2004, 495 p. (ISBN 2-87130-152-2)
  • Classification décimale universelle : édition moyenne internationale - Index .- Liège, Éditions du Céfal, 2004, 319 p. (ISBN 2-87130-153-0)

Liens externes

[modifier | modifier le wikicode]