« La documentation/Langages documentaires à structure combinatoire, thésaurus » : différence entre les versions
Ligne 68 : | Ligne 68 : | ||
| BT (''broader term'') |
| BT (''broader term'') |
||
|- |
|- |
||
| TERME SPÉCIFIQUE |
|||
⚫ | |||
⚫ | |||
|- |
|||
⚫ | |||
| |
|||
| |
|||
|- |
|||
⚫ | |||
⚫ | |||
⚫ | |||
|- |
|||
⚫ | |||
| |
|||
| |
|||
|- |
|||
⚫ | |||
⚫ | |||
⚫ | |||
|- |
|||
|} |
|||
⚫ | |||
TERME SPECIFIQUE |
|||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
⚫ | |||
Version du 6 avril 2010 à 01:10
Définition
Par sa fonction, un thésaurus transpose en langage documentaire standardisé le langage naturel utilisé dans les documents. Par sa structure, c'est un dictionnaire de termes dotés de relations sémantiques, génériques ou hiérarchiques relevant d'un domaine particulier de la connaissance (sémantique : relatif à la signification, au sens).
Généralement, l'indexeur et l'interrogateur ne parlent pas le même langage. Le thésaurus fournit la liaison indispensable entre leurs vocabulaires. On élimine en particulier la synonymie (plusieurs termes pour un même concept, par exemple chose = machin = truc = objet = bidule = engin = fourbi = zinzin...!) et la polysémie (plusieurs sens pour un même mot, par exemple « fraise » : outil rotatif - fruit - collerette plissée et empesée du 16e siècle - membrane qui enveloppe les intestins du veau ou de l'agneau - couleur rouge - angiome - chair rouge et plissée sous le bec du dindon - pieu protégeant les piles des ponts - élément de fortification - ... ou encore trombine de celui qui la ramène quand il ferait mieux de la boucler !).
Ne pas confondre la polysémie avec l'homonymie, qui concerne des mots de même prononciation mais de sens différents (par exemple : ceint, sein, saint, sain, seing). On connaît le gag classique du sot qui, sur son cheval, portait le sceau du roi dans un seau. Lorsque le cheval, effrayé, fit un saut tous les ??? se retrouvèrent par terre !
Règles de choix des descripteurs
L'idéal serait de parvenir à une correspondance biunivoque entre descripteurs et concepts, c'est-à-dire un seul concept par descripteur et un seul descripteur par concept. Ce n'est pas si simple !
Les descripteurs sont choisis en observant des règles d'écriture précises :
- forme substantive : on utilise AGRICULTURE et non AGRICOLE,
- masculin quand les deux formes sont possibles : PHOTOCOPIEUR et non PHOTOCOPIEUSE,
- singulier, sauf quand seul le pluriel est utilisé, par exemple COORDONNÉES CARTÉSIENNES, ACIERS SPÉCIAUX, MATÉRIAUX COMPOSITES, ou quand le sens est différent au singulier et au pluriel : CISEAU et CISEAUX, OUÏE et OUÏES, RELIEF et RELIEFS,
- forme développée et non abréviations : INSTITUT UNIVERSITAIRE DE TECHNOLOGIE et non IUT, SOCIÉTÉ D'INVESTISSEMENT À CAPITAL VARIABLE et non SICAV, sauf pour les sigles passés dans le langage courant : RADAR = Radio Detection And Ranging, LASER = Light Amplifier by Stimulated Emission of Radiations (l'équivalent français serait Amplificateur de Lumière par Émission Stimulée de Radiations = ALESR, à peu près imprononçable) ; qui peut traduire : CEDEX, ZAC, SIGDU, MEN, SEU, PTFE ? L'acronyme IAO peut être traduit, selon les documents où on le rencontre, par Ingénierie Assistée par Ordinateur ou Intégration (des circuits) Assistée par Ordinateur ; d'aucuns prétendent même qu'il s'agit de l'Informatique Assistée par Ordinateur...
- graphie la plus courante : CLÉ et non CLEF, TÉLÉPHÉRIQUE et non TÉLÉFÉRIQUE, mais il faut tirer au sort entre GRANIT et GRANITE !
- mot le plus courant : ORDINATEUR et non CALCULATEUR(TRICE), TUNGSTÈNE et non WOLFRAM, BÉRYLLIUM et non GLUCINIUM. Attention aux divers sabirs professionnels : TERRE = MISE À LA TERRE, VOLTAGE ( anglicisme) = TENSION ÉLECTRIQUE, SOFTWARE (anglais) = LOGICIEL. Attention aussi aux déviations du langage : ne pas employer TECHNOLOGIE, étude des techniques, des machines, à la place de TECHNIQUE, procédé méthodique pour faire une chose, ni NON-VOYANT pour AVEUGLE. Méfiance aussi avec les mots tombés plus ou moins en désuétude : un PULL-OVER A COL ROULÉ est tout simplement un CHANDAIL, le BROUILLARD GIVRANT des FRIMAS, etc. Il arrive que les mots changent de sens et les sens, de mots, disait Eddie Constantine dans le film Alphaville de Jean-Luc GODARD (1965). Du coup, bien des spectateurs friands des aventures de Lemmy Caution se sont posé de graves questions existentielles !
- élimination de la polysémie en précisant le terme utilisé : RÉSISTANCE (guerre) et RÉSISTANCE (électricité), SINUS (trigonométrie) et SINUS (anatomie), JOINT d'étanchéité, JOINT de transmission, ANALYSE chimique, ANALYSE des contraintes...
- dédoublement et utilisation de mots- outils : DESSALEMENT ou DÉSALINISATION ou encore DÉSALINATION peuvent se voir préférer ÉLIMINATION + SEL (deux mots). Élimination, comme gestion, évaluation, traitement... sont des mots-outils trop généraux pour être employés seuls. On les utilise en association avec un ou plusieurs autres descripteurs, par exemple :
- GESTION + STOCK
- ÉVALUATION + NIVEAU
- TRAITEMENT + SURFACE
- ...
- choix entre les variantes et les contraires : ceci concerne essentiellement les propriétés ou les états des choses : FLUIDITÉ et VISCOSITÉ. FRAGILITÉ et RÉSILIENCE. STABlLITÉ et INSTABILITÉ. JOIE et TRISTESSE, sont des couples de mots qui se rapportent aux mêmes concepts. C'est le problème bien connu du choix entre le caramel demi-mou et le caramel demi-dur.
Relations entre les descripteurs
Dans un thésaurus, pour mieux préciser les concepts, on utilise des relations entre les descripteurs :
norme AFNOR | norme ISO | |
équivalence : | ||
EMPLOYER | EM | USE |
EMPLOYER POUR | EP | UF (use for) |
hiérarchie : | ||
TERME GÉNÉRIQUE | TG | BT (broader term) |
TERME SPÉCIFIQUE | TS | NT (narrower term) |
association : | ||
TERME ASSOCIÉ (= « voir aussi ») | TA | RT (related term) |
définition : | ||
NOTE D'APPLICATION | NA | SN (scope note) |
L'ordre des abréviations EM, EP, TG, TS, TA, NA est normalisé. Par exemple, dans un thésaurus présenté sous forme de dictionnaire, on aurait autour du terme ORDINATEUR :