다음을 통해 공유


문자 집합

"문자 집합"은 식별 코드 값에 문자를 매핑하는 것입니다. 현재 컴퓨터에서 가장 일반적으로 사용되는 문자 집합은 문자 인코딩에 대한 글로벌 표준인 유니코드입니다. 내부적으로 Windows 애플리케이션은 유니코드의 UTF-16 구현을 사용합니다. UTF-16에서는 대부분의 문자가 2 바이트 코드로 식별됩니다. 덜 일반적으로 사용되는 보조 문자는 각각 2 바이트 코드 쌍인 서로게이트 쌍으로 표시됩니다. 자세한 내용은 서로게이트 및 보조 문자를 참조하세요.

일부 Windows 애플리케이션은 Windows Me/98/95에 기본 제공되는 이전 문자 집합으로 작동해야 합니다. Windows 코드 페이지를 사용하면 애플리케이션이 이러한 문자 집합으로 작업할 수 있습니다. 이러한 문자 집합은 다음으로 나눌 수 있습니다.

  • SBCS(싱글 바이트 문자 집합). SBCS에서 각 문자는 너비가 1 바이트인 값으로 식별됩니다.
  • 멀티 바이트 문자 집합, 특히 DBCS( 더블 바이트 문자 집합 ). 멀티 바이트 문자 집합은 많은 아시아 언어로 많은 수의 문자를 나타내는 수단을 제공합니다.

자세한 내용은 아래 항목을 참조하세요.

유니코드 및 문자 집합 정보