Chinois/Saisie du chinois en utilisant la méthode Cangjie
Il existe différents types de méthodes pour saisir des sinogrammes sur un ordinateur :
- méthodes phonétiques :
- saisie du pinyin sur un clavier alphabétique ; il faut alors choisir le caractère correspondant dans une liste qui s'affiche
- méthodes graphiques :
- tracé du caractères à l'aide de la souris ou d'un pad tactile ; on peut être approximatif tant que le caractère est identifiable.
- utilisation d'un code décomposant le caractère en éléments plus simples.
La méthode Cangjie (倉頡輸入法, cāngxié shūrù fǎ) est une des méthodes graphiques permettant de saisir des sinogrammes.
Racines
[modifier | modifier le wikicode]Les racines sont réparties sur 24 touches du clavier, complétées par 2 touches auxiliaires. Toutes les lettres de l'alphabet sont donc utilisées.
Règles de décomposition
[modifier | modifier le wikicode]Contrairement à l'ordre des traits dans les sinogrammes, la méthode Cangjie suit des règles proches mais légèrement différentes pour composer ses codes :
Direction de décomposition
[modifier | modifier le wikicode]- de gauche à droite ;
- de haut en bas ;
- de l'extérieur vers l'intérieur.
-
De gauche à droite.
-
De haut en bas.
-
De l'extérieur vers l'intérieur.
-
La forme en L avant la forme qui la surmonte (même si c'est contraire à l'ordre des traits).
-
De même pour cette forme en L.
Nombre de composants
[modifier | modifier le wikicode]- pour les caractères composés d’1 élément où toutes les parties sont connectées, utiliser 4 codes (pas un de plus = omettre si nécessaire) : la première forme, la deuxième, la troisième et la dernière ;
- pour les caractères composés de 2 sous-éléments, par exemple 你 :
- utiliser le premier et le dernier code de la première forme ;
- utiliser le premier, le deuxième et le dernier code de la seconde forme.
- pour les caractères composés d’au moins 3 éléments, par exemple 謝 :
- utiliser le premier et le dernier code de la première forme ;
- utiliser le premier et le dernier code de la deuxième forme ;
- utiliser le dernier code de la dernière forme.
La règle est appliquée même dans le cas où la première forme est plus compliquée que la seconde : 墜 弓人土 (NOG) et non 弓中人土 (NLOG)
Principes
[modifier | modifier le wikicode]Afin qu'il n'y ait qu'une décomposition possible pour chaque caractère, chaque code Cangjie est soumis à certains principes :
Concision (精簡)
[modifier | modifier le wikicode]Si deux décompositions sont possibles, la décomposition la plus courte est la bonne ;
-
3 codes
-
2 codes, c'est correct
-
4 codes
-
3 codes, c'est correct
Exhaustivité (完整)
[modifier | modifier le wikicode]Si deux décompositions de même longueur sont possibles, celle qui identifie des formes plus complexes est la décomposition correcte ;
Reflet de la forme des caractères (字型特徵)
[modifier | modifier le wikicode]Il faut éviter si possible d'utiliser le même code deux fois, et le caractère ne devrait pas être découpé au niveau des angles ;
Omission de codes (省略
[modifier | modifier le wikicode]- Omission partielle (部分省略) : lorsque le nombre de codes de la décomposition complète dépasse le nombre autorisé de codes, les codes en trop sont ignorés ;
- Omission des formes encloses (包含省略) : quand une partie du caractère à décomposer est incluse dans un autre, seule la forme extérieure est décomposée ; les formes encloses sont omises.
-
Omission des codes en trop. On récupère le premier, parfois le deuxième, et le dernier. On omet les autres.
De même, le caractère 啇 (YCBR 卜金月口) donne les composés :
- 摘 QYCB 手卜金月 et non QYCBR 手卜金月口
- 滴 EYCB 水卜金月 et non EYCBR 水卜金月口
- 謫 YRYCB 卜口卜金月 et non YRYCR 卜口卜金月口
- 適 YYCB 卜手卜金月 et non YYCBR 卜手卜金月口
Le caractère 覽 est décomposé par 尸田月山山 (SWBUU).
Exceptions
[modifier | modifier le wikicode]Certains caractères sont considérés comme étant composé d'un « extérieur » et d'un « intérieur ».
-
Code commençant par D (木) comme 來.
-
Code commençant par F (火) comme 脊.
-
Code commençant par I (戈) comme 线.
-
Code commençant par K (大) comme 夾.
Ainsi :
- 巾 s'écrit avec LB (中月) et non BL (月中)
- 末 s'écrit DJ (木十) et non JD (十木) qui est le code de 未
Mais pourtant : 吏 s'écrit JLK (十中乂) et non KKR (大大口)
君 : 尸大口 (SKR) et non 尸手口.
爭 : 月尸木 (BSD) et non pas 月中弓.
乗 : 竹木廿 (HDT)
Certaines formes ne peuvent pas être décomposées et sont représentées par X, représentant la racine 難 (difficile).
Sinogramme | Forme | Décomposition fixée (version 5) |
---|---|---|
臼 | HX | |
與 | 48px | HXYC |
興 | 48px | HXBC |
盥 | 48px | HXBT |
Sous-élément de 姊 | LXH | |
齊 | YX | |
兼 | TXC | |
鹿 | IXP | |
身 | HXH | |
黽 | RXU | |
龜 | NXU | |
廌 | IXF | |
慶 | IXE | |
𣶒 | LXL | |
肅 | LX |
À ne pas confondre
[modifier | modifier le wikicode]-
Ressemble à 十 avec un crochet, mais c'est
D 木. -
Ressemble à 小, mais c'est
F 火. -
Ressemble à 手, mais c'est
L 中. -
Ressemble à 氵, mais c'est
Y 卜. -
Ressemble à 氵, mais c'est
I M 戈一. -
Ressemble à 大弓, mais c'est
K S 大尸. -
Ressemble à 夂 (H E 竹水), mais c'est
O K 人大.
Point(s)
[modifier | modifier le wikicode]- 柬 : la partie centrale ressemble à 罒, ce qui donnerait DWL (木田中) ou DWT (木田廿), mais c'est DWF (木田火)
- 夕 : 弓戈 (NI)
- 米 : ressemble à CD 金木 mais il s'agit de 火木 (FD)
- 今 : 人戈弓 (OIN) bien que le 3e trait puisse ressembler à 一 dans certaines polices.
- 令 : 人戈弓戈 (OINI) bien que le 4e trait puisse ressembler à 中 dans certaines polices.
- 寒 : 十廿金卜 (JTCY)
- 兆 : 中一山人 (LMUO)
- 會 : 人一田日 (OMWA)
- 監 : 尸戈月廿 (SIBT) ou 尸一月廿 (SMBT)
- 习 : 尸戈一 (SIM)
- 當 : 火月口田 (FBRW)
U (山) ou P (心)
[modifier | modifier le wikicode]- 也 : 心木 (PD)
- 比 : 心心 (PP)
- 巳 : 口山 (RU)
- 㔾 : 尸山 (SU) bien que que l'on ait envie d'écrire 心尸 (PS)
- 屯 : 心山 (PU)
- 七 : 十山 (JU)
- 匕 : 山竹 (UH)
- 化 : 人心 (OP)
Angles : V (女) ou S (尸) ou D (木)
[modifier | modifier le wikicode]- 叚 : 口尸尸水 (RSSE)
- 牙 : 一女木竹 (MVDH)
- 片 : 中中一中(LLML) ou 中中一弓 (LLMN)
- 爿 : 女中一 (VLM)
- 卑 : 竹竹十 (HHJ)
- 五 : 一木一 (MDM)
- 韋 : 木一口手 (DMRQ)
- 甚 : 廿一一女 (TMMV)
- 丰 : Quand il y a 3 barres horizontales, il s'agit de QJ (手十).
- 亞 : 一中中一 (MLLM)
- 民 : 口女心 (RVP)
- 寒 : 十廿金卜 (JTCY)
- 非 : 中一卜卜卜 (LMYYY) 中一尸卜 (LMSY)
- 爭 : 月尸木 (BSD) et non pas 月手弓 (BQN)
Crochets : N (弓) ou S (尸) ou P (心)
[modifier | modifier le wikicode]- 力 : 大尸 (KS)
- 刀 : 尸竹 (SH)
- 卩 : 尸中 (SL)
- 阝: 弓中 (NL)
- 方 : 卜竹尸 (YHS)
- 豕 : 一尸竹人 (MSHO)
- 㒸 : 廿心竹人 (TPHO) bien que les premiers traits soient parfois représentés comme 人 dans certaines polices et les textes anciens.
- 习 : 尸戈一 (SIM)
- 乃 : 弓竹尸 (NHS)
- 殳 : 竹弓水 (HNE) bien que 几 apparaisse sans son crochet dans les composés.
- 及 : 弓竹水 (NHE) bien qu'il puisse sembler disjoint dans certaines polices.
- 勿 : 心竹竹 (PHH) mais 昜 : 日一尸竹 (AMSH)
- 侯 : 人弓一大 (ONMK)
Boîtes
[modifier | modifier le wikicode]- 皿 : 月廿 (BT)
- 典 : 廿月金 (TBC)
- 寅 : 十一中金 (JMLC) même si on serait tenté de mettre W 田.
- 目 : BU (月山)
- 囗 : 月一 (BM)
H (竹) ou O (人) ou K (大)
[modifier | modifier le wikicode]- 矢 : 人大 (OK)
- 攵 : 人大 (OK)
- 朱 : 竹十木 (HJD)
- 丘 : 人一 (OM)
- 乍 : 竹尸 (HS) ou 人尸 (OS) en 5e génération
- 瓜 : 竹女戈人 (HVIO)
- 歎 : 廿人弓人 (TONO)
- 漢 : 水廿中人 (ETLO)
Les inclassables
[modifier | modifier le wikicode]- 帶 : 大心月中月 (KPBLB)
- 養 : 廿人戈日女 (TOIAV)
- 臧 : 戈一尸中中 (IMSLL)
- 釜 : 金大一土金 (CKMGC)
- 衆 : 竹月廿人 (HBTO) en Cangjie 3
- 參 : forme un bloc unique : 戈戈戈竹 (IIIH), et non pas 戈戈人竹竹 (IIOHH)
- 麗 : 一一月月心 (MMBBP)
- 貧 : 金尸竹金 (CSHC), et non pas 金竹月山金 (CHBUC)
- 尹 : 尸大 (SK), et non pas 中 (L)
- 幾 : 女戈竹戈 (VIHI)
- 帝 : 卜月中月 (YBLB)
- 央 : 中月大 (LBK)
Éléments de tête
[modifier | modifier le wikicode]-
Y 卜
-
B 月
-
J 十
-
N 弓
-
H 竹
-
M 一
-
I 戈
-
K 大
-
卜心 YP
Radicaux problématiques
[modifier | modifier le wikicode]Ces radicaux présent dans de nombreux caractères constituent les deux premiers codes d'un grand nombre de caractères.
Radical | Dans un sinogramme composé |
---|---|
厶 | VI quand il est isolé mais I (戈) dans des composés. Comme dans : 䏍 = IB (戈月) ; 虫 LI (中戈)
乡 : 女女竹 (VVH) |
飠 | OI (人戈) |
犬 | KI (大戈) avec 戈 considéré comme à l'intérieur de K, parfois IK dans certains caractères. |
礻 ou ⺬ | IF (戈火) |
衤 | L (中) |
犭 | KH (大竹) mais 豕 = MSHO (一尸竹人) |
豸 | BH (月竹) |
工 | M (一) |
𧾷 | RM (口一) |
癶 | NO (弓人) |
partie haute du caractère 祭 | BO (月人) |
龹 | FQ (火手) |
𡗗 | QK (手大) |
⻗ | MB (一月) |
罒 | WL (田中) |
酉 | MW (一田) |
耂 | JK (十大) |
杀 | KD (大木) mais parfois KC (大金) en Cangjie 3. |
舟 | HY (竹卜) |
刀 | SH (尸竹) mais étrangement NH (弓竹) dans 剪 (廿月弓竹) alors que dans d'autres composés, il reste SH (尸竹) |
小 | Même si le caractère isolé s'écrit 弓金 (NC), sa forme est représentée par 火 (F). |
叚 | Même si le caractère isolé s'écrit 口尸尸水 (RSSE), dans les composés, il est écrit 口卜水 (RYE) |
麻 | Même si le caractère isolé (麻) s'écrit 戈木木 (IDD), les composés comme 麾 commencent par 戈金 (IC) en Cangjie 5. |
Attention aux modernisations
[modifier | modifier le wikicode]Certains caractères ont des formes alternatives que l'on retrouve dans certains ouvrages anciens. Le code associé à de tels caractères correspond à la forme moderne.
- Ainsi, le caractère écrit 慨 est codifié par 心日戈山 (PAIU) qui est aussi celui du caractère 慨.
- 㕣 : clairement CR (金口), mais dans le caractère 船, il est représenté par 几 dans certains affichages.
- 最, qui ressemble à BMM 月一一 mais il s'agit de A 日 : 最
- 聖, dont la partie basse ressemble à 王 (MG 一土) mais il s'écrit 壬 (HG 竹土)
- 枼, dont la partie basse ressemble à 火 (F) mais il s'écrit avec 木 (D)
- 朿, dont le centre ressemble à 中 (L) mais il s'écrit 月 (B)
- 熬, dont la partie supérieure est dérivée de 敖 (土尸人大 GSOK), d'où 土大火 (GKF)
- 啟, la partie de gauche peut ressembler à 一[尸]口 (M[S]O) mais il faut bien utiliser HROK (竹口人大)
Ponctuation
[modifier | modifier le wikicode]Version 3
[modifier | modifier le wikicode]ZXAA | (espace idéographique) | ZXAB | , | ZXAC | 、 |
ZXAD | 。 | ZXAE | . | ZXAF | ‧ |
ZXAG | ; | ZXAH | : | ZXAI | ? |
ZXAJ | ! | ZXAK | ︰(deux-points « vertical ») | ZXAL | … |
Sources
[modifier | modifier le wikicode]
- anglais Cet article est partiellement ou en totalité issu de l’article de Wikipedia en anglais intitulé « Cangjie input method » (voir la liste des auteurs)
- chinois Cet article est partiellement ou en totalité issu de l’article de b en chinois intitulé « 倉頡輸入法 » (voir la liste des auteurs)
- chinois Cet article est partiellement ou en totalité issu de l’article de b en chinois intitulé « 倉頡輸入法/進階知識 » (voir la liste des auteurs)