Unicode XML propose un jeu de caractères "universel". Cet objectif est extrêmement important sur Internet, où des textes dans toutes les langues, voir multilangues, cohabitent.
Actuellement, et dans sa troisième version, Unicode couvre la plupart des séquences de caractères utilisées dans le monde. Il contient également les caractères spéciaux pour l'interopérabilité avec des jeux de caractères plus anciens, ainsi que les caractères de commande usuels.
XML utilise Unicode XML, selon ses propres recommandations (voir [ recommandation Unicode in XML and other Markup Languages - Unicode Technical Report 20]). L'avantage est alors de détenir un véritable langage universel, au moment où les échanges de données sont de plus en plus universel, surtout sur l'Internet.
Si, grâce à Unicode XML, les caractères échangés sont non ambigus, cela ne veut pas pour autant dire que l'affichage de ces caractères est toujours possible... On se rappellera qu'il existe une différence fondamentale entre la définition d'un caractère et sa représentation (souvent appelée police de caractère ou plus précisément glyphe).
Information descriptive non finalisée ; n'hésitez pas à nous contacter pour rédiger et/ou maintenir cette information à jour.
Unicode XML et ISO 10646 en français
(Conseils HAPAX) Traductions en français. Projet financé par le gouvernement du Québec |
Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646, Jacques André, Michel Goossens, in Cahiers GUTenberg - 20, 05/1995, édité par GUTenberg |
Unicode XML and Multilingual Support in HTML, Fonts, Web Browsers and Other Applications, Alan Wood, édité par Alan Wood's Unicode Resources |