Partager via


Unicode et MBCS

La bibliothèque Microsoft Foundation Classes (MFC), la bibliothèque d’exécution C pour Visual C++, et l’environnement de développement Visual C++ sont activés pour faciliter votre programmation internationale. Elles fournissent :

  • Prise en charge de la norme Unicode sur Windows. Unicode est la norme actuelle et doit être utilisé dans la mesure du possible.

    Unicode est un encodage de caractères 16 bits, fournissant suffisamment d’encodages pour tous les langages. Tous les caractères ASCII sont inclus dans Unicode sous forme de caractères larges.

  • Prise en charge d’une forme de jeu de caractères multioctets (Mo CS) appelée jeu de caractères codés sur deux octets (DBCS) sur toutes les plateformes.

    Les caractères DBCS sont composés de 1 ou 2 octets. Certaines plages d’octets sont mises de côté pour une utilisation en tant qu’octets de prospect. Un octet de prospect spécifie qu’il et l’octet de fin suivant comprennent un caractère à 2 octets. Vous devez suivre quels octets sont des octets de prospect. Dans un jeu de caractères multioctets, les octets de tête sont compris dans une plage et les octets de fin dans une autre. Lorsque ces plages se chevauchent, il peut être nécessaire d’évaluer le contexte pour déterminer si un octet donné fonctionne comme un octet de prospect ou un octet de fin.

  • Prise en charge des outils qui simplifient la programmation Mo CS des applications écrites pour les marchés internationaux.

    Lors de l’exécution sur une version compatible Mo CS du système d’exploitation Windows, le système de développement Visual C++ ( y compris l’éditeur de code source intégré, le débogueur et les outils en ligne de commande) est entièrement Mo CS. Pour plus d’informations, consultez Mo CS Support dans Visual C++.

Remarque

Dans cette documentation, Mo CS est utilisé pour décrire la prise en charge non Unicode des caractères multioctets. Dans Visual C++, Mo CS signifie toujours DBCS. Les jeux de caractères plus larges que 2 octets ne sont pas pris en charge.

Par définition, le jeu de caractères ASCII est un sous-ensemble de tous les jeux de caractères multioctets. Dans de nombreux jeux de caractères multioctets, chaque caractère de la plage 0x00-0x7F est identique au caractère qui a la même valeur dans le jeu de caractères ASCII. Par exemple, dans les chaînes de caractères ASCII et Mo CS, le caractère NULL de 1 octet ('\0') a la valeur 0x00 et indique le caractère null de fin.

Voir aussi

Texte et chaînes
Compatibilité internationale