マルチバイト文字とワイド文字

マルチバイト文字は 1 つ以上のバイトのシーケンスで構成される文字です。 各バイト シーケンスは、拡張文字セットの 1 つの文字を表します。 マルチバイト文字は、漢字などの文字セットで使用されます。

ワイド文字は、常に 16 ビットの多言語文字コードです。 文字定数の型は char です。ワイド文字の場合、型は wchar_t です。 ワイド文字は常に固定サイズであるため、ワイド文字を使用すると、各種言語の文字セットを使ったプログラミングが簡単になります。

ワイド文字の文字列リテラル L"hello" は型 wchar_t の 6 つの整数の配列になります。

{L'h', L'e', L'l', L'l', L'o', 0}

Unicode 仕様はワイド文字の仕様です。 マルチバイト文字とワイド文字の相互変換用のランタイム ライブラリ ルーチンには、mbstowcsmbtowcwcstombs、および wctomb があります。

関連項目

C の識別子