Juegos de caracteres

Un "juego de caracteres" es una asignación de caracteres a sus valores de código de identificación. El juego de caracteres más usado actualmente en los equipos es Unicode, un estándar global para la codificación de caracteres. Internamente, las aplicaciones de Windows usan la implementación UTF-16 de Unicode. En UTF-16, la mayoría de los caracteres se identifican mediante códigos de dos bytes. Cada uno de los caracteres complementarios menos usados se representa mediante un par suplente, que es un par de códigos de dos bytes. Para obtener más información, vea Suplentes y caracteres complementarios.

Algunas aplicaciones de Windows deben funcionar con los juegos de caracteres anteriores que son nativos de Windows Me/98/95. Las páginas de códigos de Windows permiten que la aplicación funcione con estos juegos de caracteres. Estos juegos de caracteres se pueden dividir en:

  • Juegos de caracteres de un solo byte (SBCS). En un SBCS, cada carácter se identifica mediante un valor de un byte ancho.
  • Juegos de caracteres multibyte, en particular los juegos de caracteres de doble byte (DBCS). Los juegos de caracteres multibyte proporcionan un medio para representar el gran número de caracteres en muchos idiomas asiáticos.

Para obtener más información, vea los temas siguientes:

Acerca de Unicode y juegos de caracteres