CharUnicodeInfo CharUnicodeInfo CharUnicodeInfo CharUnicodeInfo Class

정의

유니코드 문자에 대한 정보를 검색합니다.Retrieves information about a Unicode character. 이 클래스는 상속될 수 없습니다.This class cannot be inherited.

public ref class CharUnicodeInfo abstract sealed
public static class CharUnicodeInfo
type CharUnicodeInfo = class
Public Class CharUnicodeInfo
상속
CharUnicodeInfoCharUnicodeInfoCharUnicodeInfoCharUnicodeInfo

예제

다음 코드 예제에서는 다양 한 문자에 대 한 각 메서드에 의해 반환 되는 값을 보여 줍니다.The following code example shows the values returned by each method for different types of characters.

using namespace System;
using namespace System::Globalization;
void PrintProperties( Char c );
int main()
{
   Console::WriteLine( "                                        c  Num   Dig   Dec   UnicodeCategory" );
   Console::Write( "U+0061 LATIN SMALL LETTER A            " );
   PrintProperties( L'a' );
   Console::Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
   PrintProperties( L'\u0393' );
   Console::Write( "U+0039 DIGIT NINE                      " );
   PrintProperties( L'9' );
   Console::Write( "U+00B2 SUPERSCRIPT TWO                 " );
   PrintProperties( L'\u00B2' );
   Console::Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
   PrintProperties( L'\u00BC' );
   Console::Write( "U+0BEF TAMIL DIGIT NINE                " );
   PrintProperties( L'\u0BEF' );
   Console::Write( "U+0BF0 TAMIL NUMBER TEN                " );
   PrintProperties( L'\u0BF0' );
   Console::Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
   PrintProperties( L'\u0F33' );
   Console::Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
   PrintProperties( L'\u2788' );
}

void PrintProperties( Char c )
{
   Console::Write( " {0,-3}", c );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetNumericValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDigitValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDecimalDigitValue( c ) );
   Console::WriteLine( "{0}", CharUnicodeInfo::GetUnicodeCategory( c ) );
}

/*
This code produces the following output.  Some characters might not display at the console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

*/
using System;
using System.Globalization;

public class SamplesCharUnicodeInfo  {

   public static void Main()  {

      Console.WriteLine( "                                        c  Num   Dig   Dec   UnicodeCategory" );

      Console.Write( "U+0061 LATIN SMALL LETTER A            " );
      PrintProperties( 'a' );

      Console.Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
      PrintProperties( '\u0393' );

      Console.Write( "U+0039 DIGIT NINE                      " );
      PrintProperties( '9' );

      Console.Write( "U+00B2 SUPERSCRIPT TWO                 " );
      PrintProperties( '\u00B2' );

      Console.Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
      PrintProperties( '\u00BC' );

      Console.Write( "U+0BEF TAMIL DIGIT NINE                " );
      PrintProperties( '\u0BEF' );

      Console.Write( "U+0BF0 TAMIL NUMBER TEN                " );
      PrintProperties( '\u0BF0' );

      Console.Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
      PrintProperties( '\u0F33' );

      Console.Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
      PrintProperties( '\u2788' );

   }

   public static void PrintProperties( char c )  {
      Console.Write( " {0,-3}", c );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( c ) );
      Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( c ) );
   }

}


/*
This code produces the following output.  Some characters might not display at the console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

*/

Imports System
Imports System.Globalization
Imports Microsoft.VisualBasic

Public Class SamplesCharUnicodeInfo   

   Public Shared Sub Main()

      Console.WriteLine("                                        c  Num   Dig   Dec   UnicodeCategory")

      Console.Write("U+0061 LATIN SMALL LETTER A            ")
      PrintProperties("a"c)

      Console.Write("U+0393 GREEK CAPITAL LETTER GAMMA      ")
      PrintProperties(ChrW(&H0393))

      Console.Write("U+0039 DIGIT NINE                      ")
      PrintProperties("9"c)

      Console.Write("U+00B2 SUPERSCRIPT TWO                 ")
      PrintProperties(ChrW(&H00B2))

      Console.Write("U+00BC VULGAR FRACTION ONE QUARTER     ")
      PrintProperties(ChrW(&H00BC))

      Console.Write("U+0BEF TAMIL DIGIT NINE                ")
      PrintProperties(ChrW(&H0BEF))

      Console.Write("U+0BF0 TAMIL NUMBER TEN                ")
      PrintProperties(ChrW(&H0BF0))

      Console.Write("U+0F33 TIBETAN DIGIT HALF ZERO         ")
      PrintProperties(ChrW(&H0F33))

      Console.Write("U+2788 CIRCLED SANS-SERIF DIGIT NINE   ")
      PrintProperties(ChrW(&H2788))

   End Sub 'Main

   Public Shared Sub PrintProperties(c As Char)
      Console.Write(" {0,-3}", c)
      Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(c))
      Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(c))
   End Sub 'PrintProperties

End Class 'SamplesCharUnicodeInfo 


'This code produces the following output.  Some characters might not display at the console.
'
'                                        c  Num   Dig   Dec   UnicodeCategory
'U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
'U+0393 GREEK CAPITAL LETTER GAMMA       \u0393   -1    -1    -1   UppercaseLetter
'U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
'U+00B2 SUPERSCRIPT TWO                  \u00B2   2     2     2    OtherNumber
'U+00BC VULGAR FRACTION ONE QUARTER      \u00BC   0.25  -1    -1   OtherNumber
'U+0BEF TAMIL DIGIT NINE                 \u0BEF   9     9     9    DecimalDigitNumber
'U+0BF0 TAMIL NUMBER TEN                 \u0BF0   10    -1    -1   OtherNumber
'U+0F33 TIBETAN DIGIT HALF ZERO          \u0F33   -0.5  -1    -1   OtherNumber
'U+2788 CIRCLED SANS-SERIF DIGIT NINE    \u2788   9     9     -1   OtherNumber

설명

합니다 유니코드 표준 유니코드 문자 범주 수를 정의 합니다.The Unicode Standard defines a number of Unicode character categories. 예를 들어 문자는 대문자, 소문자, 십진수, 문자 번호, 단락 구분 기호, 수학 기호 또는 통화 기호도 분류할 수 있습니다.For example, a character might be categorized as an uppercase letter, a lowercase letter, a decimal digit number, a letter number, a paragraph separator, a math symbol, or a currency symbol. 응용 프로그램이 구문 분석 또는 정규식을 사용 하 여 부분 문자열을 추출 하는 등의 문자열 기반 작업을 관리 하기 위해 문자 범주를 사용할 수 있습니다.Your application can use the character category to govern string-based operations, such as parsing or extracting substring with regular expressions. UnicodeCategory 열거형은 가능한 문자 범주를 정의 합니다.The UnicodeCategory enumeration defines the possible character categories.

사용할 합니다 CharUnicodeInfo 가져오려고 클래스는 UnicodeCategory 특정 문자에 대 한 값입니다.You use the CharUnicodeInfo class to obtain the UnicodeCategory value for a specific character. CharUnicodeInfo 클래스 다음 유니코드 문자 값을 반환 하는 메서드를 정의 합니다.The CharUnicodeInfo class defines methods that return the following Unicode character values:

  • 문자나 서로게이트 쌍이 속해 있는 특정 범주입니다.The specific category to which a character or surrogate pair belongs. 반환 된 값의 구성원임을 UnicodeCategory 열거형입니다.The value returned is a member of the UnicodeCategory enumeration.

  • 숫자 값입니다.Numeric value. 숫자, 분수, 아래 첨자, 위 첨자, 로마 숫자, 통화 분자, 원된 숫자 및 스크립트의 특정 숫자를 포함 하 여에 적용 됩니다.Applies only to numeric characters, including fractions, subscripts, superscripts, Roman numerals, currency numerators, encircled numbers, and script-specific digits.

  • 숫자 값입니다.Digit value. 번호 매기기 시스템에서 정수를 나타내는 다른 숫자 문자를 사용 하 여 결합 될 수 있는 숫자에 적용 됩니다.Applies to numeric characters that can be combined with other numeric characters to represent a whole number in a numbering system.

  • 10 진수 값입니다.Decimal digit value. 10 진수 (밑수 10) 시스템의 소수 자릿수를 나타내는 문자에만 적용 됩니다.Applies only to characters that represent decimal digits in the decimal (base 10) system. 10 진수 이면 0부터 9까지 10 개의 숫자 중 하나일 수 있습니다.A decimal digit can be one of ten digits, from zero through nine. 이러한 문자는의 멤버는 UnicodeCategory.DecimalDigitNumber 범주입니다.These characters are members of the UnicodeCategory.DecimalDigitNumber category.

또한는 CharUnicodeInfo 클래스는 다양 한 문자 분류를 사용 하는 메서드와 다른.NET Framework 형식에서 내부적으로 사용 됩니다.In addition, the CharUnicodeInfo class is used internally by a number of other .NET Framework types and methods that rely on character classification. 여기에는 다음이 포함됩니다.These include:

  • StringInfo 문자열의 단일 문자 대신 텍스트 요소를 사용 하 여 작동 하는 클래스입니다.The StringInfo class, which works with textual elements instead of single characters in a string.

  • 오버 로드는 Char.GetUnicodeCategory 문자나 서로게이트 쌍이 속한 범주를 결정 하는 메서드.The overloads of the Char.GetUnicodeCategory method, which determine the category to which a character or surrogate pair belongs.

  • 합니다 문자 클래스 인식 Regex,.NET Framework의 정규식 엔진입니다.The character classes recognized by Regex, the .NET Framework's regular expression engine.

응용 프로그램에서이 클래스를 사용 하는 경우 유지 염두에서 다음 프로그래밍 사용 시 고려 사항은 Char 형식입니다.When using this class in your applications, keep in mind the following programming considerations for using the Char type. 형식을 사용 하려면 어려울 수 있습니다 및 문자열은 일반적으로 언어 콘텐츠를 나타내기 위한 것이 좋습니다.The type can be difficult to use, and strings are generally preferable for representing linguistic content.

  • Char 개체는 단일 문자 항상 일치 하지 않습니다.A Char object does not always correspond to a single character. 하지만 Char 형식은 단일 16 비트 값을 나타내며, 두 개 이상의 utf-16 코드 단위의 일부 문자 (예: 문자 소 클러스터 및 서로게이트 쌍)으로 구성 됩니다.Although the Char type represents a single 16-bit value, some characters (such as grapheme clusters and surrogate pairs) consist of two or more UTF-16 code units. 자세한 내용은의 "개체 및 유니코드 문자 Char" 참조를 String 클래스입니다.For more information, see "Char Objects and Unicode Characters" in the String class.

  • "Character" 개념이 유연한 이기도합니다.The notion of a "character" is also flexible. 문자는 문자 모양으로 생각할 종종 있지만 많은 문자 모양 여러 코드 포인트에 필요 합니다.A character is often thought of as a glyph, but many glyphs require multiple code points. 예를 들어, ä 수 있습니다 2로 나타낼 코드 포인트 ("a" + 결합 diaeresis 인 + 0308,), 또는 단일 코드 포인트 ("ä" 또는 U + 00A4).For example, ä can be represented either by two code points ("a" plus U+0308, which is the combining diaeresis), or by a single code point ("ä" or U+00A4). 일부 언어에는 여러 문자, 문자 및 언어적 내용 표현에 혼동을 일으킬 수 있는 여러 코드 포인트를 필요로 하는 문자 모양에 있습니다.Some languages have many letters, characters, and glyphs that require multiple code points, which can cause confusion in linguistic content representation. 예를 들어 있습니다 (U + 03B0, 그리스어 소문자 웁실론 dialytika와 tonos) ΰ 이지만 해당 하는 대문자 문자가 없습니다.For example, there is a ΰ (U+03B0, Greek small letter upsilon with dialytika and tonos), but there is no equivalent capital letter. 이러한 값을 대문자로 원래 값을 검색 합니다.Uppercasing such a value simply retrieves the original value.

호출자 참고

인식 된 문자 및 특정 범주가 속한 유니코드 표준에서 정의 되 고 유니코드 표준의 버전 간에 변경할 수 있습니다.Recognized characters and the specific categories to which they belong are defined by the Unicode standard and can change from one version of the Unicode Standard to another. 특정 버전의.NET Framework의 문자 분류의 유니코드 표준.NET Framework 실행 되는 기본 운영 체제에 관계 없이 단일 버전을 기반으로 합니다.Categorization of characters in a particular version of the .NET Framework is based on a single version of the Unicode Standard regardless of the underlying operating system on which the .NET Framework is running. 다음 표에서 이후.NET Framework의 버전을 .NET Framework 4.NET Framework 4 문자를 분류 하는 데는 유니코드 표준의 버전 및 합니다.The following table lists versions of the .NET Framework since the .NET Framework 4.NET Framework 4 and the versions of the Unicode Standard used to classify characters.

.NET Framework 버전.NET Framework version 유니코드 표준 버전Version of the Unicode Standard
[!INCLUDE[net_v40_long](~/includes/net-v40-long-md.md)] [유니코드 표준, 버전 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/) [The Unicode Standard, Version 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/)
[!INCLUDE[net_v45](~/includes/net-v45-md.md)] [유니코드 표준, 버전 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/) [The Unicode Standard, Version 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/)
[!INCLUDE[net_v451](~/includes/net-v451-md.md)] [유니코드 표준, 버전 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/) [The Unicode Standard, Version 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/)
[!INCLUDE[net_v452](~/includes/net-v452-md.md)] [유니코드 표준, 버전 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/) [The Unicode Standard, Version 5.0.0](https://www.unicode.org/versions/Unicode5.0.0/)
[!INCLUDE[net_v46](~/includes/net-v46-md.md)] [유니코드 표준, 버전 6.3.0](https://www.unicode.org/versions/Unicode6.3.0/) [The Unicode Standard, Version 6.3.0](https://www.unicode.org/versions/Unicode6.3.0/)
[!INCLUDE[net_v461](~/includes/net-v461-md.md)] [유니코드 표준, 버전 6.3.0](https://www.unicode.org/versions/Unicode6.3.0/) [The Unicode Standard, Version 6.3.0](https://www.unicode.org/versions/Unicode6.3.0/)
[!INCLUDE[net_v462](~/includes/net-v462-md.md)] [유니코드 표준 버전 8.0.0](https://www.unicode.org/versions/Unicode8.0.0/) [The Unicode Standard, Version 8.0.0](https://www.unicode.org/versions/Unicode8.0.0/)

유니코드 표준의 각 버전에는 이전 버전 이후 유니코드 문자 데이터베이스 변경 내용에 대 한 정보가 포함 됩니다.Each version of the Unicode standard includes information on changes to the Unicode character database since the previous version. 유니코드 문자 데이터베이스에서 사용 되는 CharUnicodeInfo 문자를 분류 하는 것에 대 한 클래스입니다.The Unicode character database is used by the CharUnicodeInfo class for categorizing characters.

메서드

GetDecimalDigitValue(Char) GetDecimalDigitValue(Char) GetDecimalDigitValue(Char) GetDecimalDigitValue(Char)

지정된 숫자 문자의 10진 자릿수 값을 가져옵니다.Gets the decimal digit value of the specified numeric character.

GetDecimalDigitValue(String, Int32) GetDecimalDigitValue(String, Int32) GetDecimalDigitValue(String, Int32) GetDecimalDigitValue(String, Int32)

지정된 문자열의 지정된 인덱스에 있는 숫자 문자의 10진 자릿수 값을 가져옵니다.Gets the decimal digit value of the numeric character at the specified index of the specified string.

GetDigitValue(Char) GetDigitValue(Char) GetDigitValue(Char) GetDigitValue(Char)

지정된 숫자 문자의 자릿수 값을 가져옵니다.Gets the digit value of the specified numeric character.

GetDigitValue(String, Int32) GetDigitValue(String, Int32) GetDigitValue(String, Int32) GetDigitValue(String, Int32)

지정된 문자열의 지정된 인덱스에 있는 숫자 문자의 자릿수 값을 가져옵니다.Gets the digit value of the numeric character at the specified index of the specified string.

GetNumericValue(Char) GetNumericValue(Char) GetNumericValue(Char) GetNumericValue(Char)

지정된 문자와 연결된 숫자 값을 가져옵니다.Gets the numeric value associated with the specified character.

GetNumericValue(String, Int32) GetNumericValue(String, Int32) GetNumericValue(String, Int32) GetNumericValue(String, Int32)

지정된 문자열의 지정된 인덱스에 있는 문자와 연결된 숫자 값을 가져옵니다.Gets the numeric value associated with the character at the specified index of the specified string.

GetUnicodeCategory(Char) GetUnicodeCategory(Char) GetUnicodeCategory(Char) GetUnicodeCategory(Char)

지정된 문자의 유니코드 범주를 가져옵니다.Gets the Unicode category of the specified character.

GetUnicodeCategory(Int32) GetUnicodeCategory(Int32) GetUnicodeCategory(Int32) GetUnicodeCategory(Int32)
GetUnicodeCategory(String, Int32) GetUnicodeCategory(String, Int32) GetUnicodeCategory(String, Int32) GetUnicodeCategory(String, Int32)

지정된 문자열의 지정된 인덱스에 있는 문자의 유니코드 범주를 가져옵니다.Gets the Unicode category of the character at the specified index of the specified string.

적용 대상

추가 정보