« Le langage HTML/Internationalisation » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
Tavernier (discussion | contributions)
coquille
Ligne 149 : Ligne 149 :
* RFC 4646
* RFC 4646
* [http://www.iana.org/assignments/language-subtag-registry IANA: Subtag registry]
* [http://www.iana.org/assignments/language-subtag-registry IANA: Subtag registry]
* [http://www.yoyodesign.org/ Yooyo design]
* [http://www.yoyodesign.org/ Yoyo design]
** [http://www.yoyodesign.org/doc/w3c/css2/generate.html#propdef-quotes Gestion des guillemets]
** [http://www.yoyodesign.org/doc/w3c/css2/generate.html#propdef-quotes Gestion des guillemets]
** [http://www.yoyodesign.org/doc/w3c/css2/selector.html#lang La pseudo-classe de langue]
** [http://www.yoyodesign.org/doc/w3c/css2/selector.html#lang La pseudo-classe de langue]

Version du 14 mars 2007 à 21:16

L'Internet est un réseau mondial (world wide web). Le rendu du contenu peut donc varier selon la configuration du navigateur. Il peut être intéressant d'indiquer la langue utilisée, ce qui permettra au navigateur d'appliquer les paramètres régionaux relatifs à cette langue (s'il le peut).

L'identification des langues est définie dans le document RFC 3066 Tags for the Identification of Languages.

Comment indique-t-on la langue utilisée ?

La langue utilisée dans la majeure partie du document est un paramètre de la balise <html> d'ouverture :

<html lang="…">

Si on change de langue au cours du document, il faut l'indiquer dans la balise qui encadre le texte concerné. Par exemple

<html lang="fr" >

<head></head>

<body>

<p>
   Le texte est en français par défaut.
   Mais comme on dit en italien&nbsp;:
   <q lang="it">Tradutore, traditore</q>.
</p>

</body>

</html>

En XHTML, il faut indiquer en outre la langue selon la norme XML, avec l'attribut : xml:lang="…". L'exemple ci-dessus devient donc :

<html lang="fr" xml:lang="fr" >

<head></head>

<body>

<p>
   Le texte est en français par défaut.
   Mais comme on dit en italien&nbsp;:
   <q lang="it" xml:lang="it">Tradutore, traditore</q>.
</p>

</body>

</html>

Si le texte en langue étrangère n'est pas inclus dans une balise particulière, on peut simplement utiliser la balise <span>…</span> (voir le chapitre Calques).

Identificateur de la langue

De manière générale, la langue est identifiée par deux lettre selon la norme ISO 639-1 (dite « alpha-2 »), par exemple :

  • allemand : de
  • anglais : en
  • arabe : ar
  • chinois : zh
  • espagnol : es
  • français : fr
  • grec moderne : el
  • hébreu : he
  • italien : it
  • japonais : ja
  • néerlandais : nl
  • portuguais : pt
  • russe : ru

Certaines langues sont identifiées par un code de trois lettres, par exemple :

  • ancien anglais (entre 450 et 1100) : ang
  • moyen anglais (1100–1500) : enm
  • berbère : ber
  • créole/pidgin issu de l'anglais : cpe
  • créole issu du français : cpf
  • créole issu du portuguais : cpp
  • égyptien antique : egy
  • ancien français (842–1400) : fro
  • français moyen (1400–1600) : frm
  • grec ancien (jusqu'en 1453) : grc
  • kabyle : kab
  • massaï : mas

On peut indiquer une sous-catégorie de langue. Par exemple :

  • anglais : en
    • anglais du Royaume Uni : en-GB
      • anglais du Royaume Uni, selon l'orthographe du dictionnaire d'Oxford (Oxford English Dictionary) : en-GB-oed
    • anglais étatsunien : en-US
    • anglais cockney : en-cockney
  • espagnol : es
    • espagnol d'Espagne : es-ES
    • espagnol de l'Amérique latine : es-419
  • français : fr
    • français de France : fr-FR
    • français de Belgique : fr-BE
    • français du Canada : fr-CA

Direction de l'écriture

On peut préciser si l'écriture se fait de gauche à droite (left-to-right, LTR) ou de droite à gauche (right-to-left, RTL), avec le paramètre dir, par exemple

<p lang="he" dir="rtl">עברית</p>

Exemple de feuille de style différenciant la langue

L'exemple suivant est une feuille de style dans laquelle la mise en page d'un paragraphe dépend de la langue.

<head>
   <style>
   <!--********** Français **********-->
      HTML:lang(fr) { quotes: '« ' ' »'; } <!-- guillemets de citation pour tout le document -->
      p:lang(fr) {
         text-align: justify; <!-- texte justifié -->
         text-indent: 2em;    <!-- retrait de paragraphe -->
         margin-top: 0;       <!-- pas de saut de ligne -->
         margin-bottom: 0;
         quotes: '« ' ' »';   <!-- guillemets de citation pour un paragraphe -->
      }
   <!--********** Anglais **********-->
      HTML:lang(en) { quotes: '‘' '’' '“' '”'; } <!-- guillemets de citation pour tout le document -->
      HTML:lang(en-GB) { quotes: '‘' '’' '“' '”'; } <!-- 2 niveaux de citation  -->
      HTML:lang(en-US) { quotes: '“' '”' '‘' '’'; }  <!-- différents en GB et aux US  -->
      p:lang(en) {
         text-align:left;        <!-- texte aligné à gauche -->
         text-indent: 0;         <!-- pas de retrait de paragraphe -->
         margin-top: 1em;
         margin-bottom: 1em;     <!-- saut de ligne -->
         quotes: '‘' '’' '“' '”' <!-- guillemets de citation pour un paragraphe -->
      }
      p:lang(en-GB) { quotes: '‘' '’' '“' '”'; }
      p:lang(en-US) { quotes: '“' '”' '‘' '’'; }
   </style>
</head>

Vous pouvez tester le résultat avec des paragraphes suffisamment longs.

Exemple
<p lang="fr">
   Ceci est un paragraphe en français…
</p>

<p lang="en">
   This is a paragraph in english…
</p>


Pour plus de détails voir : Programmation CSS/Les sélecteurs#Autres pseudo-classes.

Voir aussi