UnicodeCategory 列挙体

文字の Unicode カテゴリを定義します。

<Serializable>
Public Enum UnicodeCategory
[C#]
[Serializable]
public enum UnicodeCategory
[C++]
[Serializable]
__value public enum UnicodeCategory
[JScript]
public
   Serializable
enum UnicodeCategory

解説

Unicode Standard は、次のことを定義しています。

サロゲート ペアとは、2 つのコード単位からなる単一の抽象文字を表すコード化文字表現です。ペアの最初の単位が上位サロゲート、2 番目の単位が下位サロゲートとなります。上位サロゲートは U+D800 ~ U+DBFF の範囲の Unicode コード ポイントであり、下位サロゲートは U+DC00 ~ U+DFFF の範囲の Unicode コード ポイントです。

組み合わせ文字シーケンスとは、1 つの基本文字と 1 つ以上の組み合わせ文字の組み合わせです。サロゲート ペアは、基本文字または組み合わせた文字を表すことができます。組み合わせ文字は、スペーシングまたは非スペーシングのいずれかにできます。スペーシング組み合わせ文字は、表示されるときにそれ自体で余白位置を占めます。これに対して、非スペーシング組み合わせ文字は、余白を占めません。発音区別符は、非スペーシング組み合わせ文字の一例です。

修飾子文字とは、組み合わせ文字のように、先行文字の修飾を示すフリースタンディング スペーシング文字です。

囲み記号とは、基本文字まで (基本文字を含む) のすべての先行文字を囲む非スペーシング組み合わせ文字です。

形式指定文字とは、通常は表示されませんが、テキストのレイアウトまたはテキスト処理の動作に影響を与える文字です。

Unicode Standard は、各種の区切り記号を定義しています。たとえば、ハイフンには、U+002D (ハイフン - マイナス)、U+00AD (ソフト ハイフン)、U+2010 (ハイフン)、または U+2011 (改行なしハイフン) のように、ハイフンを表す複数のコード値のいずれかを使用できます。ダッシュ、空白文字、および引用符についても同様です。

Unicode Standard は、U+0030 (ゼロ) および U+0660 (アラビアやインドのゼロ) のように、特定の文字または言語に固有な 10 進数表現にもコードを割り当てています。

この列挙体は、Unicode Standard, Version 3.1 に基づいています。

詳細については、http://www.unicode.org の「Unicode Standard」を参照してください。

この列挙体は、 IsUpper などの Char メソッドをサポートするために使用します。

メンバ

メンバ名 説明
ClosePunctuation

.NET Compact Framework でもサポート。

文字が、かっこ、角かっこ、中かっこなどの区切り記号のペアの終了文字であることを示します。Unicode の表記 "Pe" (punctuation, close) によって指定します。値は 21 です。
ConnectorPunctuation

.NET Compact Framework でもサポート。

文字が、2 つの文字を接続する接続区切り記号であることを示します。Unicode の表記 "Pc" (punctuation, connector) によって指定します。値は 18 です。
Control

.NET Compact Framework でもサポート。

文字が、制御コードであることを示します。その Unicode 値は、U+007F であるか、U+0000 から U+001F または U+0080 から U+009F の範囲です。Unicode の表記 "Cc" (other, control) によって指定します。値は 14 です。
CurrencySymbol

.NET Compact Framework でもサポート。

文字が通貨記号であることを示します。Unicode の表記 "Sc" (symbol, currency) によって指定します。値は 26 です。
DashPunctuation

.NET Compact Framework でもサポート。

文字がダッシュまたはハイフンであることを示します。Unicode の表記 "Pd" (punctuation, dash) によって指定します。値は 19 です。
DecimalDigitNumber

.NET Compact Framework でもサポート。

文字が 0 から 9 の範囲の 10 進数の数字であることを示します。Unicode の表記 "Nd" (number, decimal digit) によって指定します。値は 8 です。
EnclosingMark

.NET Compact Framework でもサポート。

文字が、囲み記号であることを示します。これは、基本文字まで (基本文字を含む) のすべての先行文字を囲む非スペーシング組み合わせ文字です。Unicode の表記 "Me" (mark, enclosing) によって指定します。値は 7 です。
FinalQuotePunctuation

.NET Compact Framework でもサポート。

文字が、終了引用符または最後の引用符であることを示します。Unicode の表記 "Pf" (punctuation, final quote) によって指定します。値は 23 です。
Format

.NET Compact Framework でもサポート。

文字が、形式指定文字であることを示します。これは、通常は表示されませんが、テキストのレイアウトまたはテキスト処理の動作に影響を与える文字です。Unicode の表記 "Cf" (other, format) によって指定します。値は 15 です。
InitialQuotePunctuation

.NET Compact Framework でもサポート。

文字が、開始引用符または最初の引用符であることを示します。Unicode の表記 "Pi" (punctuation, initial quote) によって指定します。値は 22 です。
LetterNumber

.NET Compact Framework でもサポート。

数字の 5 がローマ数字では "V" となるように、文字が 10 進数の数字ではなく、文字によって表される数値であることを示します。Unicode の表記 "Nl" (number, letter) によって指定します。値は 9 です。
LineSeparator

.NET Compact Framework でもサポート。

文字が、テキストの行を区切るために使用されることを示します。Unicode の表記 "Zl" (separator, line) によって指定します。値は 12 です。
LowercaseLetter

.NET Compact Framework でもサポート。

文字が小文字であることを示します。Unicode の表記 "Ll" (letter, lowercase) によって指定します。値は 1 です。
MathSymbol

.NET Compact Framework でもサポート。

文字が、"+" または "=" などの算術記号であることを示します。Unicode の表記 "Sm" (symbol, math) によって指定します。値は 25 です。
ModifierLetter

.NET Compact Framework でもサポート。

文字が修飾子文字であることを示します。これは、先行文字の修飾を示すフリースタンディング スペーシング文字です。Unicode の表記 "Lm" (letter, modifier) によって指定します。値は 3 です。
ModifierSymbol

.NET Compact Framework でもサポート。

文字が、修飾子記号であることを示します。これは、囲んでいる文字の修飾を示します。たとえば、分数のスラッシュは、左側の数値が分子で、右側の数値が分母であることを示します。Unicode の表記 "Sk" (symbol, modifier) によって指定します。値は 27 です。
NonSpacingMark

.NET Compact Framework でもサポート。

文字が、基本文字の修飾を示す非スペーシング文字であることを示します。Unicode の表記 "Mn" (mark, nonspacing) によって指定します。値は 5 です。
OpenPunctuation

.NET Compact Framework でもサポート。

文字が、かっこ、角かっこ、中かっこなどの区切り記号のペアの開始文字であることを示します。Unicode の表記 "Ps" (punctuation, open) によって指定します。値は 20 です。
OtherLetter

.NET Compact Framework でもサポート。

文字が、大文字、小文字、タイトル文字、または修飾子文字以外の文字であることを示します。Unicode の表記 "Lo" (letter, other) によって指定します。値は 4 です。
OtherNotAssigned

.NET Compact Framework でもサポート。

文字が Unicode カテゴリに割り当てられていないことを示します。Unicode の表記 "Cn" (other, not assigned) によって指定します。値は 29 です。
OtherNumber

.NET Compact Framework でもサポート。

文字が、分数の 1/2 のように、10 進数の数字でも文字数字でもない数値であることを示します。Unicode の表記 "No" (number, other) によって指定します。値は 10 です。
OtherPunctuation

.NET Compact Framework でもサポート。

文字が、接続区切り文字、ダッシュ区切り文字、開始区切り文字、終了区切り文字、最初の引用区切り文字、または最後の引用区切り文字以外の区切り文字であることを示します。Unicode の表記 "Po" (punctuation, other) によって指定します。値は 24 です。
OtherSymbol

.NET Compact Framework でもサポート。

文字が、算術記号、通貨記号、または修飾子記号以外の記号であることを示します。Unicode の表記 "So" (symbol, other) によって指定します。値は 28 です。
ParagraphSeparator

.NET Compact Framework でもサポート。

文字が、段落を区切るために使用されることを示します。Unicode の表記 "Zp" (separator, paragraph) によって指定します。値は 13 です。
PrivateUse

.NET Compact Framework でもサポート。

文字が、プライベート用文字であることを示します。その Unicode 値は、U+E000 から U+F8FF の範囲です。Unicode の表記 "Co" (other, private use) によって指定します。値は 17 です。
SpaceSeparator

.NET Compact Framework でもサポート。

文字が、制御文字または形式指定文字以外のグリフのない空白文字であることを示します。Unicode の表記 "Zs" (separator, space) によって指定します。値は 11 です。
SpacingCombiningMark

.NET Compact Framework でもサポート。

文字がスペーシング文字であることを示します。これは、基本文字の修飾を示し、その基本文字のグリフの幅に影響を与えます。Unicode の表記 "Mc" (mark, spacing combining) によって指定します。値は 6 です。
Surrogate

.NET Compact Framework でもサポート。

文字が、上位サロゲートまたは下位サロゲートであることを示します。サロゲート コード値は、U+D800 から U+DFFF の範囲です。Unicode の表記 "Cs" (other, surrogate) によって指定します。値は 16 です。
TitlecaseLetter

.NET Compact Framework でもサポート。

文字がタイトル文字であることを示します。Unicode の表記 "Lt" (letter, titlecase) によって指定します。値は 2 です。
UppercaseLetter

.NET Compact Framework でもサポート。

文字が大文字であることを示します。Unicode の表記 "Lu" (letter, uppercase) によって指定します。値は 0 です。

必要条件

名前空間: System.Globalization

プラットフォーム: Windows 98, Windows NT 4.0, Windows Millennium Edition, Windows 2000, Windows XP Home Edition, Windows XP Professional, Windows Server 2003 ファミリ, .NET Compact Framework - Windows CE .NET

アセンブリ: Mscorlib (Mscorlib.dll 内)

参照

System.Globalization 名前空間 | System.Text.UnicodeEncoding