Character Sets
Un « jeu de caractères » est un mappage de caractères avec leurs valeurs de code d’identification. Le jeu de caractères le plus couramment utilisé dans les ordinateurs actuels est Unicode, une norme globale pour l’encodage des caractères. en interne, les applications Windows utilisent l’implémentation UTF-16 d’Unicode. En UTF-16, la plupart des caractères sont identifiés par des codes à deux octets. Les caractères supplémentaires les moins communément utilisés sont représentés par une paire de substitution, qui est une paire de codes à deux octets. Pour plus d’informations, consultez substituts et caractères supplémentaires.
certaines applications Windows doivent fonctionner avec les jeux de caractères plus anciens qui sont natifs pour Windows Me/98/95. Windows pages de codes permettent à votre application de travailler avec ces jeux de caractères. Ces jeux de caractères peuvent être divisés en :
- Jeux de caractères codés sur un octet (SBCS). Dans un SBCS, chaque caractère est identifié par une valeur d’un octet en largeur.
- Jeux de caractères multioctets, en particulier les jeux de caractères codés sur deux octets (DBCS). Les jeux de caractères multioctets offrent un moyen de représenter le grand nombre de caractères dans de nombreuses langues asiatiques.
Pour plus d'informations, voir les rubriques suivantes :
- Pages de codes
- Jeux de caractères codés sur deux octets
- Jeux de caractères codés sur un octet
- Substituts et caractères supplémentaires
- Unicode