文字セット

[アーティクル]
06/13/2023

"文字セット" は、文字と識別コード値のマッピングです。現在のコンピューターで最も一般的に使用されている文字セットは、文字エンコードのグローバル標準である Unicode です。内部的には、Windows アプリケーションは Unicode の UTF-16 実装を使用します。 UTF-16 では、ほとんどの文字は 2 バイトコードで識別されます。あまり一般的に使用されていない補助文字は、それぞれサロゲートペア (2 バイトコードのペア) で表されます。詳細については、「サロゲートと補助文字」を参照してください。

一部の Windows アプリケーションは、Windows Me/98/95 にネイティブな古い文字セットで動作する必要があります。 Windows コードページを使用すると、アプリケーションでこれらの文字セットを操作できます。これらの文字セットは、次のように分割できます。

1 バイト文字セット (SBCS)。 SBCS では、各文字は 1 バイト幅の値で識別されます。
マルチバイト文字セット、特に 2 バイト文字セット (DBCS)。マルチバイト文字セットは、多くのアジア言語で多数の文字を表す手段を提供します。

詳細については、次のトピックを参照してください。

Unicode と文字セットについて

文字セット

フィードバック

フィードバック

その他のリソース

文字セット

関連トピック

フィードバック

フィードバック

その他のリソース