Character Sets

Un « jeu de caractères » est un mappage de caractères à leurs valeurs de code d’identification. Le jeu de caractères le plus couramment utilisé dans les ordinateurs aujourd’hui est Unicode, une norme mondiale pour l’encodage de caractères. En interne, les applications Windows utilisent l’implémentation UTF-16 d’Unicode. Dans UTF-16, la plupart des caractères sont identifiés par des codes de deux octets. Les caractères supplémentaires les moins couramment utilisés sont chacun représentés par une paire de substituts, qui est une paire de codes de deux octets. Pour plus d’informations, consultez Substituts et caractères supplémentaires.

Certaines applications Windows doivent fonctionner avec les anciens jeux de caractères natifs de Windows Me/98/95. Les pages de code Windows permettent à votre application d’utiliser ces jeux de caractères. Ces jeux de caractères peuvent être divisés en :

  • Jeux de caractères sur un octet (SBCS). Dans un SBCS, chaque caractère est identifié par une valeur d’un octet de large.
  • Jeux de caractères multioctets, en particulier les jeux de caractères double octet (DBCS). Les jeux de caractères multioctets permettent de représenter le grand nombre de caractères dans de nombreuses langues asiatiques.

Pour plus d'informations, voir les rubriques suivantes :

À propos d’Unicode et des jeux de caractères