Coder avec Unicode/Normalisation
Unicode permet de coder les caractères accentués de deux manières distinctes[1]:
- le caractère de base et du caractère accent
- un seul caractère.
Ceci peu soulever des difficultés lors de comparaison de chaînes ou pour savoir si deux chaînes sont identiques. Cela peut aussi permettre d'avoir deux fichiers portant le même nom mais avec un codage binaire différend.
La normalisation permet de standardiser la question de savoir si un caractère accentué est codé du caractère de base et du caractère accent ou bien s'il ne constitue qu'un seul caractère.
Vala[modifier | modifier le wikicode]
En vala, la méthode normalize de la classe string converti une chaîne dans sa forme canonique de manière à standardiser la question de savoir si un caractère accentué est codé du caractère de base et du caractère accent ou bien s'il ne constitue qu'un seul caractère.
Références[modifier | modifier le wikicode]
- ↑ Lire par exemple {{w:fr:Normalisation Unicode}} sur wikipedia