文字セット

"文字セット" は、文字と識別コード値のマッピングです。 現在のコンピューターで最も一般的に使用されている文字セットは 、文字エンコードのグローバル標準である Unicode です。 内部的には、Windows アプリケーションは Unicode の UTF-16 実装を使用します。 UTF-16 では、ほとんどの文字は 2 バイト コードで識別されます。 あまり一般的に使用されていない補助文字は、それぞれサロゲート ペア (2 バイト コードのペア) で表されます。 詳細については、「 サロゲートと補助文字」を参照してください。

一部の Windows アプリケーションは、Windows Me/98/95 にネイティブな古い文字セットで動作する必要があります。 Windows コード ページ を使用すると、アプリケーションでこれらの文字セットを操作できます。 これらの文字セットは、次のように分割できます。

  • 1 バイト文字セット (SBCS)。 SBCS では、各文字は 1 バイト幅の値で識別されます。
  • マルチバイト文字セット、特に 2 バイト文字セット (DBCS)。 マルチバイト文字セットは、多くのアジア言語で多数の文字を表す手段を提供します。

詳細については、次のトピックを参照してください。

Unicode と文字セットについて