싱글바이트 및 멀티바이트 문자 집합Single-Byte and Multibyte Character Sets

ASCII 문자 집합은 0x00 - 0x7F 범위의 문자를 정의합니다.The ASCII character set defines characters in the range 0x00 - 0x7F. 주로 유럽의 많은 문자 집합은 ASCII 문자 집합과 동일하게 0x00 - 0x7F 범위 내 문자를 정의할 뿐만 아니라 0x80 - 0xFF 범위의 확장명 문자 집합도 정의합니다.There are a number of other character sets, primarily European, that define the characters within the range 0x00 - 0x7F identically to the ASCII character set and also define an extended character set from 0x80 - 0xFF. 따라서 8비트 SBCS(싱글바이트 문자 집합)는 ASCII 문자 집합과 많은 유럽 언어의 문자 집합을 나타내는 데 충분합니다.Thus an 8-bit, single-byte-character set (SBCS) is sufficient to represent the ASCII character set as well as the character sets for many European languages. 그러나 한국어와 같은 일부 비유럽 문자 집합에는 싱글바이트 코딩 구성표로 표현할 수 있는 것보다 더 많은 문자가 포함되므로 MBCS(멀티바이트 문자 집합) 인코딩이 필요합니다.However, some non-European character sets, such as Japanese Kanji, include many more characters than can be represented in a single-byte coding scheme, and therefore require multibyte-character set (MBCS) encoding.

참고

Microsoft 런타임 라이브러리의 많은 SBCS 루틴에서는 멀티바이트 바이트, 문자 및 문자열을 적절하게 처리합니다.Many SBCS routines in the Microsoft run-time library handle multibyte bytes, characters, and strings as appropriate. 많은 멀티바이트 문자 집합은 ASCII 문자 집합을 하위 집합으로 정의합니다.Many multibyte-character sets define the ASCII character set as a subset. 많은 멀티바이트 문자 집합에서 0x00 - 0x7F 범위의 각 문자는 ASCII 문자 집합에 동일한 값을 가진 문자와 같습니다.In many multibyte character sets, each character in the range 0x00 - 0x7F is identical to the character that has the same value in the ASCII character set. 예를 들어 ASCII 및 MBCS 문자열 모두에서 1바이트 null 문자('\0')는 0x00 값을 가지며 종료 null 문자를 나타냅니다.For example, in both ASCII and MBCS character strings, the one-byte null character ('\0') has value 0x00 and indicates the terminating null character.

멀티바이트 문자 집합은 1바이트 문자와 2바이트 문자 모두로 구성할 수 있습니다.A multibyte character set may consist of both one-byte and two-byte characters. 따라서 멀티바이트 문자열은 싱글바이트 및 더블바이트 문자를 혼합하여 포함할 수 있습니다.Thus a multibyte-character string may contain a mixture of single-byte and double-byte characters. 2바이트 멀티바이트 문자는 후행 바이트와 선행 바이트를 가집니다.A two-byte multibyte character has a lead byte and a trail byte. 특정 멀티바이트 문자 집합에서 선행 바이트는 후행 바이트와 마찬가지로 특정 범위 내에 속합니다.In a particular multibyte-character set, the lead bytes fall within a certain range, as do the trail bytes. 이러한 범위가 겹치는 경우에는 지정된 바이트가 선행 바이트 또는 후행 바이트로 작동하는지 여부를 특정 상황에 따라 판단해야 합니다.When these ranges overlap, it may be necessary to evaluate the particular context to determine whether a given byte is functioning as a lead byte or a trail byte.

참고 항목See Also

국제화Internationalization
범주별 유버니설 C 런타임 루틴Universal C runtime routines by category