Chinois/Saisie du chinois en utilisant la méthode Cangjie

Un livre de Wikilivres.
Les caractères utilisés pour écrire « la méthode Cangjie » (倉頡輸入法, cāngxié shūrù fǎ) décomposés en utilisant la dite méthode.

Il existe différents types de méthodes pour saisir des sinogrammes sur un ordinateur :

  • méthodes phonétiques :
    • saisie du pinyin sur un clavier alphabétique ; il faut alors choisir le caractère correspondant dans une liste qui s'affiche
  • méthodes graphiques :
    • tracé du caractères à l'aide de la souris ou d'un pad tactile ; on peut être approximatif tant que le caractère est identifiable.
    • utilisation d'un code décomposant le caractère en éléments plus simples.

La méthode Cangjie (倉頡輸入法, cāngxié shūrù fǎ) est une des méthodes graphiques permettant de saisir des sinogrammes.

Racines[modifier | modifier le wikicode]

Clavier de la méthode Cangjie.

Les racines sont réparties sur 24 touches du clavier, complétées par 2 touches auxiliaires. Toutes les lettres de l'alphabet sont donc utilisées.

Groupe Touche Nom Formes associées Exemples
Philosophique A 日 soleil
B 月 lune
C 金 or
D 木 bois
E 水 eau
F 火 feu
G 土 terre
Traits H 竹 bambou
I 戈 arme
J 十 dix
K 大 grand
L 中 milieu
M 一 un
N 弓 arc
Anatomie O 人 personne
P 心 cœur
Q 手 main
R 口 bouche
Formes de caractères S 尸 cadavre
T 廿 vingt
U 山 montagne
V 女 femme
W 田 champ
Y 卜 divination

Règles de décomposition[modifier | modifier le wikicode]

Contrairement à l'ordre des traits dans les sinogrammes, la méthode Cangjie suit des règles proches mais légèrement différentes pour composer ses codes :

Direction de décomposition[modifier | modifier le wikicode]

  • de gauche à droite ;
  • de haut en bas ;
  • de l'extérieur vers l'intérieur.

Nombre de composants[modifier | modifier le wikicode]

  • pour les caractères composés d’1 élément où toutes les parties sont connectées, utiliser 4 codes (pas un de plus = omettre si nécessaire) : la première forme, la deuxième, la troisième et la dernière ;
  • pour les caractères composés de 2 sous-éléments, par exemple 你 :
    • utiliser le premier et le dernier code de la première forme ;
    • utiliser le premier, le deuxième et le dernier code de la seconde forme.
  • pour les caractères composés d’au moins 3 éléments, par exemple 謝 :
    • utiliser le premier et le dernier code de la première forme ;
    • utiliser le premier et le dernier code de la deuxième forme ;
    • utiliser le dernier code de la dernière forme.

La règle est appliquée même dans le cas où la première forme est plus compliquée que la seconde : 墜 弓人土 (NOG) et non 弓中人土 (NLOG)

Principes[modifier | modifier le wikicode]

Afin qu'il n'y ait qu'une décomposition possible pour chaque caractère, chaque code Cangjie est soumis à certains principes :

Concision (精簡)[modifier | modifier le wikicode]

Si deux décompositions sont possibles, la décomposition la plus courte est la bonne ;

Exhaustivité (完整)[modifier | modifier le wikicode]

Si deux décompositions de même longueur sont possibles, celle qui identifie des formes plus complexes est la décomposition correcte ;

Reflet de la forme des caractères (字型特徵)[modifier | modifier le wikicode]

Il faut éviter si possible d'utiliser le même code deux fois, et le caractère ne devrait pas être découpé au niveau des angles ;

Omission de codes (省略[modifier | modifier le wikicode]

  • Omission partielle (部分省略) : lorsque le nombre de codes de la décomposition complète dépasse le nombre autorisé de codes, les codes en trop sont ignorés ;
  • Omission des formes encloses (包含省略) : quand une partie du caractère à décomposer est incluse dans un autre, seule la forme extérieure est décomposée ; les formes encloses sont omises.

De même, le caractère 啇 (YCBR 卜金月口) donne les composés :

  • 摘 QYCB 手卜金月 et non QYCBR 手卜金月口
  • 滴 EYCB 水卜金月 et non EYCBR 水卜金月口
  • 謫 YRYCB 卜口卜金月 et non YRYCR 卜口卜金月口
  • 適 YYCB 卜手卜金月 et non YYCBR 卜手卜金月口

Le caractère 覽 est décomposé par 尸田月山山 (SWBUU).

Exceptions[modifier | modifier le wikicode]

Certains caractères sont considérés comme étant composé d'un « extérieur » et d'un « intérieur ».

Ainsi :

  • 巾 s'écrit avec LB (中月) et non BL (月中)
  • 末 s'écrit DJ (木十) et non JD (十木) qui est le code de 未

Mais pourtant : 吏 s'écrit JLK (十中乂) et non KKR (大大口)

 : 尸大口 (SKR) et non 尸手口.

 : 月尸木 (BSD) et non pas 月中弓.

 : 竹木廿 (HDT)

Sinogramme Schéma de la décomposition Décomposition figée et arbitraire
Version 2 Version 3 Version 5
日 弓 (AN)
月 山 (BU)
竹 戈 (HI) 竹 戈 (HI) or HUI
竹 山 (HU) 竹 弓 (HN)
Caractères similaires à 卜 口 月 . . (YRB..) 卜 弓 月 . . (YNB..)
卜 心 (YP)
卜 口 (YR) 卜 女 口 (YVR)
人 土 (OG)
人 山 (OU) 人 弓 (ON) 人 一 弓 (OMN)
女 戈 (VI)
中 弓 (LN)
弓 中 (NL)
口卜尸水 (RYSE) 口尸尸水 (RSSE)

Certaines formes ne peuvent pas être décomposées et sont représentées par X, représentant la racine 難 (difficile).

Sinogramme Forme Décomposition fixée (version 5)
HX
48px HXYC
48px HXBC
48px HXBT
Sous-élément de LXH
YX
TXC
鹿 IXP
HXH
RXU
NXU
IXF
IXE
𣶒 LXL
LX

À ne pas confondre[modifier | modifier le wikicode]

Point(s)[modifier | modifier le wikicode]

  •  : la partie centrale ressemble à 罒, ce qui donnerait DWL (木田中) ou DWT (木田廿), mais c'est DWF (木田火)
  •  : 弓戈 (NI)
  •  : ressemble à CD 金木 mais il s'agit de 火木 (FD)
  •  : 人戈弓 (OIN) bien que le 3e trait puisse ressembler à 一 dans certaines polices.
  •  : 人戈弓戈 (OINI) bien que le 4e trait puisse ressembler à 中 dans certaines polices.
  •  : 十廿金卜 (JTCY)
  •  : 中一山人 (LMUO)
  •  : 人一田日 (OMWA)
  •  : 尸戈月廿 (SIBT) ou 尸一月廿 (SMBT)
  •  : 尸戈一 (SIM)
  •  : 火月口田 (FBRW)

U (山) ou P (心)[modifier | modifier le wikicode]

  •  : 心木 (PD)
  •  : 心心 (PP)
  •  : 口山 (RU)
  •  : 尸山 (SU) bien que que l'on ait envie d'écrire 心尸 (PS)
  •  : 心山 (PU)
  •  : 十山 (JU)
  •  : 山竹 (UH)
  •  : 人心 (OP)

Angles : V (女) ou S (尸) ou D (木)[modifier | modifier le wikicode]

  •  : 口尸尸水 (RSSE)
  •  : 一女木竹 (MVDH)
  •  : 中中一中(LLML) ou 中中一弓 (LLMN)
  •  : 女中一 (VLM)
  •  : 竹竹十 (HHJ)
  •  : 一木一 (MDM)
  •  : 木一口手 (DMRQ)
  •  : 廿一一女 (TMMV)
  •  : Quand il y a 3 barres horizontales, il s'agit de QJ (手十).
  •  : 一中中一 (MLLM)
  •  : 口女心 (RVP)
  •  : 十廿金卜 (JTCY)
  •  : 中一卜卜卜 (LMYYY) 中一尸卜 (LMSY)
  •  : 月尸木 (BSD) et non pas 月手弓 (BQN)

Crochets : N (弓) ou S (尸) ou P (心)[modifier | modifier le wikicode]

  •  : 大尸 (KS)
  •  : 尸竹 (SH)
  •  : 尸中 (SL)
  • : 弓中 (NL)
  •  : 卜竹尸 (YHS)
  •  : 一尸竹人 (MSHO)
  •  : 廿心竹人 (TPHO) bien que les premiers traits soient parfois représentés comme 人 dans certaines polices et les textes anciens.
  •  : 尸戈一 (SIM)
  •  : 弓竹尸 (NHS)
  •  : 竹弓水 (HNE) bien que 几 apparaisse sans son crochet dans les composés.
  •  : 弓竹水 (NHE) bien qu'il puisse sembler disjoint dans certaines polices.
  •  : 心竹竹 (PHH) mais  : 日一尸竹 (AMSH)
  •  : 人弓一大 (ONMK)

Boîtes[modifier | modifier le wikicode]

  •  : 月廿 (BT)
  •  : 廿月金 (TBC)
  •  : 十一中金 (JMLC) même si on serait tenté de mettre W 田.
  •  : BU (月山)
  •  : 月一 (BM)

H (竹) ou O (人) ou K (大)[modifier | modifier le wikicode]

  •  : 人大 (OK)
  •  : 人大 (OK)
  •  : 竹十木 (HJD)
  •  : 人一 (OM)
  •  : 竹尸 (HS) ou 人尸 (OS) en 5e génération
  •  : 竹女戈人 (HVIO)
  •  : 廿人弓人 (TONO)
  •  : 水廿中人 (ETLO)

Les inclassables[modifier | modifier le wikicode]

  •  : 大心月中月 (KPBLB)
  •  : 廿人戈日女 (TOIAV)
  •  : 戈一尸中中 (IMSLL)
  •  : 金大一土金 (CKMGC)
  •  : 竹月廿人 (HBTO) en Cangjie 3
  •  : forme un bloc unique : 戈戈戈竹 (IIIH), et non pas 戈戈人竹竹 (IIOHH)
  •  : 一一月月心 (MMBBP)
  •  : 金尸竹金 (CSHC), et non pas 金竹月山金 (CHBUC)
  •  : 尸大 (SK), et non pas 中 (L)
  •  : 女戈竹戈 (VIHI)
  •  : 卜月中月 (YBLB)
  •  : 中月大 (LBK)

Éléments de tête[modifier | modifier le wikicode]

Radicaux problématiques[modifier | modifier le wikicode]

Ces radicaux présent dans de nombreux caractères constituent les deux premiers codes d'un grand nombre de caractères.

Radical Dans un sinogramme composé
VI quand il est isolé mais I (戈) dans des composés. Comme dans : = IB (戈月) ; LI (中戈)

 : 女女竹 (VVH)

OI (人戈)
KI (大戈) avec 戈 considéré comme à l'intérieur de K, parfois IK dans certains caractères.
ou IF (戈火)
L (中)
KH (大竹) mais 豕 = MSHO (一尸竹人)
BH (月竹)
M (一)
𧾷 RM (口一)
NO (弓人)
partie haute du caractère 祭 BO (月人)
FQ (火手)
𡗗 QK (手大)
MB (一月)
WL (田中)
MW (一田)
JK (十大)
KD (大木) mais parfois KC (大金) en Cangjie 3.
HY (竹卜)
SH (尸竹) mais étrangement NH (弓竹) dans 剪 (廿月弓竹) alors que dans d'autres composés, il reste SH (尸竹)
Même si le caractère isolé s'écrit 弓金 (NC), sa forme est représentée par 火 (F).
Même si le caractère isolé s'écrit 口尸尸水 (RSSE), dans les composés, il est écrit 口卜水 (RYE)
Même si le caractère isolé (麻) s'écrit 戈木木 (IDD), les composés comme 麾 commencent par 戈金 (IC) en Cangjie 5.

Attention aux modernisations[modifier | modifier le wikicode]

Certains caractères ont des formes alternatives que l'on retrouve dans certains ouvrages anciens. Le code associé à de tels caractères correspond à la forme moderne.

  • Ainsi, le caractère écrit est codifié par 心日戈山 (PAIU) qui est aussi celui du caractère .
  •  : clairement CR (金口), mais dans le caractère 船, il est représenté par 几 dans certains affichages.
  • , qui ressemble à BMM 月一一 mais il s'agit de A 日 :
  • , dont la partie basse ressemble à 王 (MG 一土) mais il s'écrit 壬 (HG 竹土)
  • , dont la partie basse ressemble à 火 (F) mais il s'écrit avec 木 (D)
  • , dont le centre ressemble à 中 (L) mais il s'écrit 月 (B)
  • , dont la partie supérieure est dérivée de 敖 (土尸人大 GSOK), d'où 土大火 (GKF)
  • , la partie de gauche peut ressembler à 一[尸]口 (M[S]O) mais il faut bien utiliser HROK (竹口人大)

Ponctuation[modifier | modifier le wikicode]

Version 3[modifier | modifier le wikicode]

ZXAA  (espace idéographique) ZXAB ZXAC
ZXAD ZXAE ZXAF
ZXAG ZXAH ZXAI
ZXAJ ZXAK ︰(deux-points « vertical ») ZXAL

Sources[modifier | modifier le wikicode]