UnicodeCategory UnicodeCategory UnicodeCategory UnicodeCategory Enum

定義

文字の Unicode カテゴリを定義します。Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
継承
UnicodeCategoryUnicodeCategoryUnicodeCategoryUnicodeCategory
属性

フィールド

ClosePunctuation ClosePunctuation ClosePunctuation ClosePunctuation 21

かっこ、角かっこ、中かっこなどの区切り記号のペアの終了文字。Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Unicode の表記では "Pe" (punctuation, close) で表されます。Signified by the Unicode designation "Pe" (punctuation, close). 値は 21 です。The value is 21.

ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation 18

2 つの文字を接続するコネクタ区切り記号文字。Connector punctuation character that connects two characters. Unicode の表記では "Pc" (punctuation, connector) で表されます。Signified by the Unicode designation "Pc" (punctuation, connector). 値は 18 です。The value is 18.

Control Control Control Control 14

Unicode 値が U+007F であるか、U+0000 から U+001F または U+0080 から U+009F の範囲に含まれる制御コード文字。Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. Unicode の表記では "Cc" (other, control) で表されます。Signified by the Unicode designation "Cc" (other, control). 値は 14 です。The value is 14.

CurrencySymbol CurrencySymbol CurrencySymbol CurrencySymbol 26

通貨記号文字。Currency symbol character. Unicode の表記では "Sc" (symbol, currency) で表されます。Signified by the Unicode designation "Sc" (symbol, currency). 値は 26 です。The value is 26.

DashPunctuation DashPunctuation DashPunctuation DashPunctuation 19

ダッシュ文字またはハイフン文字。Dash or hyphen character. Unicode の表記では "Pd" (punctuation, dash) で表されます。Signified by the Unicode designation "Pd" (punctuation, dash). 値は 19 です。The value is 19.

DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber 8

0 から 9 の範囲の 10 進数字。Decimal digit character, that is, a character in the range 0 through 9. Unicode の表記 "Nd" (number, decimal digit) によって指定します。Signified by the Unicode designation "Nd" (number, decimal digit). 値は 8 です。The value is 8.

EnclosingMark EnclosingMark EnclosingMark EnclosingMark 7

囲み記号文字。基本文字まで (基本文字を含む) のすべての先行文字を囲む非スペーシング組み合わせ文字です。Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. Unicode の表記では "Me" (mark, enclosing) で表されます。Signified by the Unicode designation "Me" (mark, enclosing). 値は 7 です。The value is 7.

FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation 23

終了引用符文字または最後の引用符文字。Closing or final quotation mark character. Unicode の表記では "Pf" (punctuation, final quote) で表されます。Signified by the Unicode designation "Pf" (punctuation, final quote). 値は 23 です。The value is 23.

Format Format Format Format 15

形式指定文字。テキストのレイアウトまたはテキスト処理の動作に影響を与えますが、通常は表示されません。Format character that affects the layout of text or the operation of text processes, but is not normally rendered. Unicode の表記では "Cf" (other, format) で表されます。Signified by the Unicode designation "Cf" (other, format). 値は 15 です。The value is 15.

InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation 22

開始引用符文字または最初の引用符文字。Opening or initial quotation mark character. Unicode の表記では "Pi" (punctuation, initial quote) で表されます。Signified by the Unicode designation "Pi" (punctuation, initial quote). 値は 22 です。The value is 22.

LetterNumber LetterNumber LetterNumber LetterNumber 9

数字の 5 がローマ数字では "V" となるように、10 進数の数字ではなく文字によって表される数値。Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". Unicode の表記では "Nl" (number, letter) で表されます。The indicator is signified by the Unicode designation "Nl" (number, letter). 値は 9 です。The value is 9.

LineSeparator LineSeparator LineSeparator LineSeparator 12

テキストの行を区切るために使用される文字。Character that is used to separate lines of text. Unicode の表記では "Zl" (separator, line) で表されます。Signified by the Unicode designation "Zl" (separator, line). 値は 12 です。The value is 12.

LowercaseLetter LowercaseLetter LowercaseLetter LowercaseLetter 1

英小文字。Lowercase letter. Unicode の表記では "Ll" (letter, lowercase) で表されます。Signified by the Unicode designation "Ll" (letter, lowercase). 値は 1 です。The value is 1.

MathSymbol MathSymbol MathSymbol MathSymbol 25

プラス記号 ("+") や等号 ("=") などの算術記号文字。Mathematical symbol character, such as "+" or "= ". Unicode の表記では "Sm" (symbol, math) で表されます。Signified by the Unicode designation "Sm" (symbol, math). 値は 25 です。The value is 25.

ModifierLetter ModifierLetter ModifierLetter ModifierLetter 3

修飾子文字。先行文字の修飾を示すフリースタンディング スペーシング文字です。Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. Unicode の表記では "Lm" (letter, modifier) で表されます。Signified by the Unicode designation "Lm" (letter, modifier). 値は 3 です。The value is 3.

ModifierSymbol ModifierSymbol ModifierSymbol ModifierSymbol 27

修飾子記号文字。囲んでいる文字の修飾を示します。Modifier symbol character, which indicates modifications of surrounding characters. たとえば、分数のスラッシュは、左側の数値が分子で、右側の数値が分母であることを示します。For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. Unicode の表記では "Sk" (symbol, modifier) で表されます。The indicator is signified by the Unicode designation "Sk" (symbol, modifier). 値は 27 です。The value is 27.

NonSpacingMark NonSpacingMark NonSpacingMark NonSpacingMark 5

基本文字の修飾を示す非スペーシング文字。Nonspacing character that indicates modifications of a base character. Unicode の表記では "Mn" (mark, nonspacing) で表されます。Signified by the Unicode designation "Mn" (mark, nonspacing). 値は 5 です。The value is 5.

OpenPunctuation OpenPunctuation OpenPunctuation OpenPunctuation 20

かっこ、角かっこ、中かっこなどの区切り記号のペアの開始文字。Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Unicode の表記では "Ps" (punctuation, open) で表されます。Signified by the Unicode designation "Ps" (punctuation, open). 値は 20 です。The value is 20.

OtherLetter OtherLetter OtherLetter OtherLetter 4

英大文字、英小文字、タイトル文字、または修飾子文字以外の文字。Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. Unicode の表記では "Lo" (letter, other) で表されます。Signified by the Unicode designation "Lo" (letter, other). 値は 4 です。The value is 4.

OtherNotAssigned OtherNotAssigned OtherNotAssigned OtherNotAssigned 29

Unicode カテゴリに割り当てられていない文字。Character that is not assigned to any Unicode category. Unicode の表記では "Cn" (other, not assigned) で表されます。Signified by the Unicode designation "Cn" (other, not assigned). 値は 29 です。The value is 29.

OtherNumber OtherNumber OtherNumber OtherNumber 10

分数の 1/2 のように、10 進数の数字でも文字数字でもない数値。Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. インジケーターは、Unicode の表記 "No" (number, other) によって指定します。The indicator is signified by the Unicode designation "No" (number, other). 値は 10 です。The value is 10.

OtherPunctuation OtherPunctuation OtherPunctuation OtherPunctuation 24

コネクタ区切り文字、ダッシュ区切り文字、開始区切り文字、終了区切り文字、最初の引用区切り文字、または最後の引用区切り文字以外の区切り文字。Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. Unicode の表記では "Po" (punctuation, other) で表されます。Signified by the Unicode designation "Po" (punctuation, other). 値は 24 です。The value is 24.

OtherSymbol OtherSymbol OtherSymbol OtherSymbol 28

算術記号、通貨記号、または修飾子記号以外の記号文字。Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. Unicode の表記では "So" (symbol, other) で表されます。Signified by the Unicode designation "So" (symbol, other). 値は 28 です。The value is 28.

ParagraphSeparator ParagraphSeparator ParagraphSeparator ParagraphSeparator 13

段落を区切るために使用される文字。Character used to separate paragraphs. Unicode の表記では "Zp" (separator, paragraph) で表されます。Signified by the Unicode designation "Zp" (separator, paragraph). 値は 13 です。The value is 13.

PrivateUse PrivateUse PrivateUse PrivateUse 17

Unicode 値が U+E000 から U+F8FF の範囲に含まれるプライベート用文字。Private-use character, with a Unicode value in the range U+E000 through U+F8FF. Unicode の表記では "Co" (other, private use) で表されます。Signified by the Unicode designation "Co" (other, private use). 値は 17 です。The value is 17.

SpaceSeparator SpaceSeparator SpaceSeparator SpaceSeparator 11

制御文字または形式指定文字以外のグリフのない空白文字。Space character, which has no glyph but is not a control or format character. Unicode の表記では "Zs" (separator, space) で表されます。Signified by the Unicode designation "Zs" (separator, space). 値は 11 です。The value is 11.

SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark 6

基本文字の修飾を示し、その基本文字のグリフの幅に影響を与えるスペーシング文字。Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. Unicode の表記では "Mc" (mark, spacing combining) で表されます。Signified by the Unicode designation "Mc" (mark, spacing combining). 値は 6 です。The value is 6.

Surrogate Surrogate Surrogate Surrogate 16

上位サロゲート文字または下位サロゲート文字。High surrogate or a low surrogate character. サロゲート コード値は、U+D800 から U+DFFF の範囲です。Surrogate code values are in the range U+D800 through U+DFFF. Unicode の表記では "Cs" (other, surrogate) で表されます。Signified by the Unicode designation "Cs" (other, surrogate). 値は 16 です。The value is 16.

TitlecaseLetter TitlecaseLetter TitlecaseLetter TitlecaseLetter 2

タイトル文字。Titlecase letter. Unicode の表記では "Lt" (letter, titlecase) で表されます。Signified by the Unicode designation "Lt" (letter, titlecase). 値は 2 です。The value is 2.

UppercaseLetter UppercaseLetter UppercaseLetter UppercaseLetter 0

英大文字。Uppercase letter. Unicode の表記では "Lu" (letter, uppercase) で表されます。Signified by the Unicode designation "Lu" (letter, uppercase). 値は 0 です。The value is 0.

次の例では、UppercaseLetter カテゴリに含まれる文字の文字とそれに対応するコードポイントが表示されます。The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. この例を変更して、他のカテゴリの文字を表示するようにすることができます。そのためには、 category変数への代入で UppercaseLetter を目的のカテゴリに置き換えます。You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. 一部のカテゴリの出力が広範囲にわたる場合があることに注意してください。Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

注釈

UnicodeCategory列挙体のメンバーは、メソッドChar.GetUnicodeCategoryCharUnicodeInfo.GetUnicodeCategoryメソッドによって返されます。A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. 列挙体は、などのメソッドChar IsUpper(Char)をサポートするためにも使用されます。 UnicodeCategoryThe UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). このようなメソッドは、指定された文字が特定の Unicode 一般カテゴリのメンバーであるかどうかを判断します。Such methods determine whether a specified character is a member of a particular Unicode general category. Unicode 一般カテゴリは、文字の広範な分類、つまり、文字の種類、10進数字、区切り記号、数学記号、句読点などを定義します。A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

この列挙は、Unicode 標準バージョン5.0 に基づいています。This enumeration is based on The Unicode Standard, version 5.0. 詳細については、「Unicode Character Database (Unicode 文字データベース)」内の「UCD File Format (UCD ファイル形式)」および「General Category Values (一般カテゴリの値)」を参照してください。For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

Unicode 規格では、次のものが定義されています。The Unicode Standard defines the following:

サロゲートペアは、2つのコード単位のシーケンスで構成される単一の抽象文字のコード化された文字表現で、ペアの最初の単位は上位サロゲート、2番目は下位サロゲートです。A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. 上位サロゲートは、u + D800 から U + DBFF の範囲の Unicode コードポイントであり、下位サロゲートは u + DC00 から U + DFFF の範囲の Unicode コードポイントです。A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

組み合わせ文字シーケンスは、基本文字と1つ以上の組み合わせ文字を組み合わせたものです。A combining character sequence is a combination of a base character and one or more combining characters. サロゲートペアは、基本文字または組み合わせ文字を表します。A surrogate pair represents a base character or a combining character. 組み合わせ文字は、スペーシングまたは非スペーシングです。A combining character is either spacing or nonspacing. スペーシング結合文字は、レンダリング時に単独で間隔を取りますが、非スペーシング組み合わせ文字にはスペースを入れません。A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. 分音記号は、非スペーシング組み合わせ文字の一例です。Diacritics are an example of nonspacing combining characters.

修飾子文字は、組み合わせ文字のように、前の文字が変更されたことを示す、自由な空白文字です。A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

外側のマークは、基本文字までのすべての前の文字を囲む非スペーシング組み合わせ文字です。An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

フォーマット文字は、通常はレンダリングされないが、テキストのレイアウトまたはテキスト処理の操作に影響を与える文字です。A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

Unicode 規格では、いくつかの区切り記号にいくつかのバリエーションが定義されています。The Unicode Standard defines several variations to some punctuation marks. たとえば、ハイフンは、ハイフンを表すいくつかのコード値のうちの1つです。たとえば、U + 002D (ハイフン-マイナス)、U + 002D (ソフトハイフン)、u + 2010 (ハイフン)、u + 2011 (改行なし) などがあります。For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). これは、ダッシュ、スペース文字、および引用符にも当てはまります。The same is true for dashes, space characters, and quotation marks.

Unicode 規格では、指定されたスクリプトまたは言語に固有の10進数表現にもコードが割り当てられます。たとえば、U + 0030 ~ (数字ゼロ) や U + 0660 (アラビアインド数字ゼロ) などです。The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

適用対象

こちらもご覧ください