Set di caratteri a byte singolo e multibyteSingle-Byte and Multibyte Character Sets

Il set di caratteri ASCII definisce i caratteri inclusi nell'intervallo da 0x00 a 0x7F.The ASCII character set defines characters in the range 0x00 - 0x7F. Sono disponibili altri set di caratteri, principalmente europei, che definiscono i caratteri inclusi nell'intervallo da 0x00 a 0x7F come il set di caratteri ASCII, e che includono anche un set di caratteri estesi inclusi nell'intervallo da 0x80 a 0xFF.There are a number of other character sets, primarily European, that define the characters within the range 0x00 - 0x7F identically to the ASCII character set and also define an extended character set from 0x80 - 0xFF. Pertanto, un set di caratteri a 8 bit o a byte singolo (SBCS) è sufficiente per rappresentare sia il set di caratteri ASCII che i set di caratteri di molte lingue europee.Thus an 8-bit, single-byte-character set (SBCS) is sufficient to represent the ASCII character set as well as the character sets for many European languages. Tuttavia, alcuni set di caratteri non europei, come il Kanji giapponese, includono molti più caratteri di quelli che possono essere rappresentati in uno schema di codifica a byte singolo e pertanto richiedono una codifica con set di caratteri multibyte (MBCS).However, some non-European character sets, such as Japanese Kanji, include many more characters than can be represented in a single-byte coding scheme, and therefore require multibyte-character set (MBCS) encoding.

Nota

Molte routine SBCS nella libreria di runtime Microsoft gestiscono byte, caratteri e stringhe multibyte in modo appropriato.Many SBCS routines in the Microsoft run-time library handle multibyte bytes, characters, and strings as appropriate. Molti set di caratteri multibyte definiscono il set di caratteri ASCII come subset.Many multibyte-character sets define the ASCII character set as a subset. In molti set di caratteri multibyte, ogni carattere incluso nell'intervallo da 0x00 a 0x7F è identico al carattere che ha lo stesso valore nel set di caratteri ASCII.In many multibyte character sets, each character in the range 0x00 - 0x7F is identical to the character that has the same value in the ASCII character set. Ad esempio, sia nella stringa di caratteri ASCII che MBCS, il carattere NULL ('\0') a un byte ha il valore 0x00 e indica il carattere con terminazione null.For example, in both ASCII and MBCS character strings, the one-byte NULL character ('\0') has value 0x00 and indicates the terminating null character.

Un set di caratteri multibyte può essere costituito sia da caratteri a un byte che a due byte.A multibyte character set may consist of both one-byte and two-byte characters. Pertanto una stringa di caratteri multibyte può contenere una combinazione di caratteri a byte singolo e a byte doppio.Thus a multibyte-character string may contain a mixture of single-byte and double-byte characters. Un carattere multibyte a due byte ha un byte iniziale e un byte finale.A two-byte multibyte character has a lead byte and a trail byte. In un determinato set di caratteri multibyte, i byte di apertura e di chiusura sono inclusi in un intervallo specifico.In a particular multibyte-character set, the lead bytes fall within a certain range, as do the trail bytes. Quando questi intervalli si sovrappongono, può essere necessario valutare nel particolare contesto se un determinato byte funga da byte iniziale o finale.When these ranges overlap, it may be necessary to evaluate the particular context to determine whether a given byte is functioning as a lead byte or a trail byte.

Vedere ancheSee Also

Internazionalizzazione Internationalization
Routine di runtime per categoriaRun-Time Routines by Category