Character Sets

Un "set di caratteri" è un mapping di caratteri ai relativi valori di codice di identificazione. Il set di caratteri più comunemente usato nei computer è attualmente Unicode, uno standard globale per la codifica dei caratteri. Internamente, le applicazioni Windows usano l'implementazione UTF-16 di Unicode. In UTF-16 la maggior parte dei caratteri è identificata da codici a due byte. I caratteri supplementari meno usati sono rappresentati da una coppia di surrogati, ovvero una coppia di codici a due byte. Per altre informazioni, vedere Surrogati e caratteri supplementari.

Alcune applicazioni Windows devono funzionare con i set di caratteri meno recenti nativi di Windows Me/98/95. Le tabelle codici di Windows consentono all'applicazione di usare questi set di caratteri. Questi set di caratteri possono essere suddivisi in:

  • Set di caratteri a byte singolo (SBCS). In un SBCS ogni carattere è identificato da un valore largo di un byte.
  • Set di caratteri multibyte, in particolare i set di caratteri a byte doppio (DBCS). I set di caratteri multibyte forniscono un mezzo per rappresentare il numero elevato di caratteri in molte lingue asiatiche.

Per altre informazioni, vedere gli argomenti seguenti:

Informazioni su Unicode e set di caratteri