Discussion:Le langage HTML/Entités

Un livre de Wikilivres.
Sauter à la navigation Sauter à la recherche

Quelques corrections nécessaires;

  • les entités permettent d'adresser, c'est à dire de désigner, un caractère présent dans la table Unicode, qui est la norme pour le Web et qui comporte, disons, tous les caractères existants.
  • les entités numériques adressent directement la table Unicode
  • les entités caractères n'adressent pas directement la table Unicode, et sont propres à chaque DTD qui les définit. En ce sens, il est généralement préférables d'opter pour les entités numériques, pour éviter des difficultés inutiles (entités caractères définies en XHTML mais pas en HTML, par exemple).
  • l'entité désignant l'Euro n'est pas €. Cette dernière est propre aux jeux de caractères Windows (windows-1252) et est incompatible avec Unicode. Elle ne sera pas correctement interprétée sur toutes les plates-formes et tous les navigateurs, et invalidera le document HTML. L'entité numérique valide est €. Il en est de même pour tous les caractères encodés sous Windows de € à Ÿ (ligature oe, point de suspension, tiret cadratin, etc).
  • le rôle principal des entités est de permettre l'utilisation de caractères hors du jeu utilisé pour le document (l'entité euro dans un document en iso-8859-1, par exemple). Le cas des caractères < et > est très spécifique et ne constitue pas l'explication principale à donner.
  • la note Avant l'avénement de l'Unicode, seuls les caractères non-accentués étaient standard (ASCII pur)... est erronée. De très nombreux jeux étendus (iso-8859-x) ou spécifiques (UCS-2) ont existé entre ASCII et utf-8. Cette note entretient l'idée fausse selon laquelle les caractères accentués doivent être écrits sous forme d'entité dans ces différents jeux, alors que seuls les caractères absents du jeu le nécessitent. Par ailleurs, l'avènement d'Unicode est ici hors-sujet. Enfin, inciter à passer par la table des caractères d'un traitement de texte est malavisé, ceci conduisant le plus souvent à l'insertion de caractères incorrectement codés selon le jeu windows-1252 (cas-type des caractères générés via Word).
  • la distinction entre le dièze et le croisillon est superflue, le terme dièze étant largement répandu et ne prêtant pas à confusion ici.

Cordialement, --LgD 15 mars 2007 à 09:28 (CET)

Sur la notion d'adressage : c'est purement abstrait.
Sur le dernier point : c'est un de mes dadas ;-) et par ailleurs, comment justifier après qu'il y ait une entité spécifique pour le vrai dièse ?
Cdang 16 mars 2007 à 12:18 (CET)