Juegos de caracteres de un solo byte y de varios bytes

El juego de caracteres ASCII define los caracteres que están en el intervalo de 0x00 a 0x7F. Hay otros juegos de caracteres, principalmente europeos, que definen los caracteres que están en el intervalo de 0x00 a 0x7F, al igual que el juego de caracteres ASCII, y que también definen un juego de caracteres extendidos de 0x80 a 0xFF. Un juego de caracteres de un solo byte (SBCS) de 8 bits es suficiente para representar el juego de caracteres ASCII, así como los juegos de caracteres para muchos idiomas europeos. Sin embargo, algunos juegos de caracteres no europeos, como el kanji japonés, incluyen muchos más caracteres de los que se pueden representar en un esquema de codificación de un solo byte, por lo que requieren codificación de juego de caracteres multibyte (MBCS).

Nota

Muchas rutinas de SBCS en la biblioteca en tiempo de ejecución de Microsoft controlan bytes, caracteres y cadenas multibyte según corresponda. Muchos juegos de caracteres de varios bytes definen el juego de caracteres ASCII como un subconjunto. En muchos juegos de caracteres de varios bytes, cada uno de los caracteres que está en el intervalo de 0x00 a 0x7F es idéntico al carácter que tiene el mismo valor en el juego de caracteres ASCII. Por ejemplo, en las cadenas de caracteres ASCII y MBCS, el carácter nulo de un byte ("\0") tiene el valor 0x00 e indica el carácter nulo final.

Un juego de caracteres multibyte puede constar de caracteres de un byte y dos bytes. Una cadena de caracteres multibyte puede contener una mezcla de caracteres de un solo byte y de doble byte. Un carácter multibyte de dos bytes tiene un byte inicial y un byte final. En un juego de caracteres multibyte específico, los bytes iniciales quedan dentro de un intervalo determinado, al igual que los bytes finales. Cuando estos intervalos se superponen, es posible que tenga que evaluar el contexto para determinar si un byte determinado funciona como byte inicial o byte final.

Vea también

Internacionalización
Rutinas en tiempo de ejecución Universal C por categoría