特殊文字 : サロゲート ペア

サロゲート文字は、標準が約 65,000 文字の制限を越えて展開できる、既存の Unicode 規格の拡張です。日本語、簡体字中国語、繁体字中国語、および韓国語向けのリリース済みまたは開発中の規格があります。

2 つの異なる予約範囲からの Unicode 値が 1 文字を表します。このため、サロゲート ペアという用語が使用されています。1 つの高位の値を 1 つの低位の値と組み合わせて一意のサロゲート ペアを作成します。その一意のペアは、表示の際に実際の文字にマップされます。最初の (高位) サロゲートは、U+DBFF ~ U+D800 の範囲の 16 ビット コード値です。2 番目の (低位) サロゲートは、U+DFFF ~ U+DC00 の範囲の 16 ビット コード値です。サロゲートは、サロゲート ペアの一部となっている場合以外は解釈されません。つまり、単独では、サロゲートは意味がありません。

サロゲート ペアの入力または表示を行う前に、まず、入力する文字用の適切なサロゲート サポート パッケージをインストールする必要があります。ただし、すべての言語にサロゲート サポート パッケージが用意されているわけではありません。利用可能な最新のサロゲート サポート パッケージについては、http://go.microsoft.com/fwlink/?LinkId=20260 の「Global Development and Computing Portal」を参照してください。

ここで説明する項目は次のとおりです。

https://msdn.microsoft.com/ja-jp/library/cc419853(v=msdn.10)