Aracılığıyla paylaş

CharUnicodeInfo.GetUnicodeCategory Yöntem


Unicode karakterinin Unicode kategorisini alır.

Aşırı Yüklemeler


Belirtilen karakterin Unicode kategorisini alır.


Belirtilen karakterin Unicode kategorisini alır.

GetUnicodeCategory(String, Int32)

Belirtilen dizenin belirtilen dizinindeki karakterin Unicode kategorisini alır.



Belirtilen karakterin Unicode kategorisini alır.

 static System::Globalization::UnicodeCategory GetUnicodeCategory(char ch);
public static System.Globalization.UnicodeCategory GetUnicodeCategory (char ch);
static member GetUnicodeCategory : char -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (ch As Char) As UnicodeCategory



Unicode kategorisinin alındığı Unicode karakteri.


UnicodeCategory Belirtilen karakterin kategorisini gösteren bir değer.


Aşağıdaki kod örneği, farklı karakter türleri için her yöntem tarafından döndürülen değerleri gösterir.

using namespace System;
using namespace System::Globalization;
void PrintProperties( Char c );
int main()
   Console::WriteLine( "                                        c  Num   Dig   Dec   UnicodeCategory" );
   Console::Write( "U+0061 LATIN SMALL LETTER A            " );
   PrintProperties( L'a' );
   Console::Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
   PrintProperties( L'\u0393' );
   Console::Write( "U+0039 DIGIT NINE                      " );
   PrintProperties( L'9' );
   Console::Write( "U+00B2 SUPERSCRIPT TWO                 " );
   PrintProperties( L'\u00B2' );
   Console::Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
   PrintProperties( L'\u00BC' );
   Console::Write( "U+0BEF TAMIL DIGIT NINE                " );
   PrintProperties( L'\u0BEF' );
   Console::Write( "U+0BF0 TAMIL NUMBER TEN                " );
   PrintProperties( L'\u0BF0' );
   Console::Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
   PrintProperties( L'\u0F33' );
   Console::Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
   PrintProperties( L'\u2788' );

void PrintProperties( Char c )
   Console::Write( " {0,-3}", c );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetNumericValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDigitValue( c ) );
   Console::Write( " {0,-5}", CharUnicodeInfo::GetDecimalDigitValue( c ) );
   Console::WriteLine( "{0}", CharUnicodeInfo::GetUnicodeCategory( c ) );

This code produces the following output.  Some characters might not display at the console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       Γ   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  ²   2     2     -1   OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      ¼   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 ௯   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 ௰   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          ༳   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    ➈   9     9     -1   OtherNumber

using System;
using System.Globalization;

public class SamplesCharUnicodeInfo  {

   public static void Main()  {

      Console.WriteLine( "                                        c  Num   Dig   Dec   UnicodeCategory" );

      Console.Write( "U+0061 LATIN SMALL LETTER A            " );
      PrintProperties( 'a' );

      Console.Write( "U+0393 GREEK CAPITAL LETTER GAMMA      " );
      PrintProperties( '\u0393' );

      Console.Write( "U+0039 DIGIT NINE                      " );
      PrintProperties( '9' );

      Console.Write( "U+00B2 SUPERSCRIPT TWO                 " );
      PrintProperties( '\u00B2' );

      Console.Write( "U+00BC VULGAR FRACTION ONE QUARTER     " );
      PrintProperties( '\u00BC' );

      Console.Write( "U+0BEF TAMIL DIGIT NINE                " );
      PrintProperties( '\u0BEF' );

      Console.Write( "U+0BF0 TAMIL NUMBER TEN                " );
      PrintProperties( '\u0BF0' );

      Console.Write( "U+0F33 TIBETAN DIGIT HALF ZERO         " );
      PrintProperties( '\u0F33' );

      Console.Write( "U+2788 CIRCLED SANS-SERIF DIGIT NINE   " );
      PrintProperties( '\u2788' );

   public static void PrintProperties( char c )  {
      Console.Write( " {0,-3}", c );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( c ) );
      Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( c ) );
      Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( c ) );

This code produces the following output.  Some characters might not display at the console.

                                        c  Num   Dig   Dec   UnicodeCategory
U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
U+0393 GREEK CAPITAL LETTER GAMMA       Γ   -1    -1    -1   UppercaseLetter
U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
U+00B2 SUPERSCRIPT TWO                  ²   2     2     -1   OtherNumber
U+00BC VULGAR FRACTION ONE QUARTER      ¼   0.25  -1    -1   OtherNumber
U+0BEF TAMIL DIGIT NINE                 ௯   9     9     9    DecimalDigitNumber
U+0BF0 TAMIL NUMBER TEN                 ௰   10    -1    -1   OtherNumber
U+0F33 TIBETAN DIGIT HALF ZERO          ༳   -0.5  -1    -1   OtherNumber
U+2788 CIRCLED SANS-SERIF DIGIT NINE    ➈   9     9     -1   OtherNumber

Imports System.Globalization

Public Class SamplesCharUnicodeInfo

   Public Shared Sub Main()

      Console.WriteLine("                                        c  Num   Dig   Dec   UnicodeCategory")

      Console.Write("U+0061 LATIN SMALL LETTER A            ")

      Console.Write("U+0393 GREEK CAPITAL LETTER GAMMA      ")

      Console.Write("U+0039 DIGIT NINE                      ")

      Console.Write("U+00B2 SUPERSCRIPT TWO                 ")

      Console.Write("U+00BC VULGAR FRACTION ONE QUARTER     ")

      Console.Write("U+0BEF TAMIL DIGIT NINE                ")

      Console.Write("U+0BF0 TAMIL NUMBER TEN                ")

      Console.Write("U+0F33 TIBETAN DIGIT HALF ZERO         ")

      Console.Write("U+2788 CIRCLED SANS-SERIF DIGIT NINE   ")

   End Sub

   Public Shared Sub PrintProperties(c As Char)
      Console.Write(" {0,-3}", c)
      Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(c))
      Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(c))
      Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(c))
   End Sub

End Class

'This code produces the following output.  Some characters might not display at the console.
'                                        c  Num   Dig   Dec   UnicodeCategory
'U+0061 LATIN SMALL LETTER A             a   -1    -1    -1   LowercaseLetter
'U+0393 GREEK CAPITAL LETTER GAMMA       Γ   -1    -1    -1   UppercaseLetter
'U+0039 DIGIT NINE                       9   9     9     9    DecimalDigitNumber
'U+00B2 SUPERSCRIPT TWO                  ²   2     2     -1   OtherNumber
'U+00BC VULGAR FRACTION ONE QUARTER      ¼   0.25  -1    -1   OtherNumber
'U+0BEF TAMIL DIGIT NINE                 ௯   9     9     9    DecimalDigitNumber
'U+0BF0 TAMIL NUMBER TEN                 ௰   10    -1    -1   OtherNumber
'U+0F33 TIBETAN DIGIT HALF ZERO          ༳   -0.5  -1    -1   OtherNumber
'U+2788 CIRCLED SANS-SERIF DIGIT NINE    ➈   9     9     -1   OtherNumber


Unicode karakterler kategorilere ayrılır. Karakterin kategorisi özelliklerinden biridir. Örneğin, karakter büyük harf, küçük harf, ondalık basamak numarası, harf numarası, bağlayıcı noktalama işareti, matematik simgesi veya para birimi simgesi olabilir. sınıfı, UnicodeCategory Unicode karakterinin kategorisini döndürür. Unicode karakterleri hakkında daha fazla bilgi için bkz. Unicode Standardı.

yöntemi, GetUnicodeCategory bunun tek bir dil karakterine karşılık geldiğini ch varsayar ve kategorisini döndürür. Bu, vekil çiftler için vekilin ait olduğu kategori yerine döndürdüğü UnicodeCategory.Surrogate anlamına gelir. Örneğin, Ugaritik alfabesi U+10380 ile U+1039F kod noktalarını kaplar. Aşağıdaki örnek, Ugaritik alfabesinin ConvertFromUtf32 ilk harfi olan UGARITIC LETTER ALPA'yı (U+10380) temsil eden bir dize örneği oluşturmak için yöntemini kullanır. Örnekteki çıktıda gösterildiği gibi yöntemi, IsNumber(Char) bu karakterin yüksek vekili veya düşük vekili geçirilirse döndürür false .

int utf32 = 0x10380;       // UGARITIC LETTER ALPA
string surrogate = Char.ConvertFromUtf32(utf32);
foreach (var ch in surrogate)
    Console.WriteLine($"U+{(ushort)ch:X4}: {System.Globalization.CharUnicodeInfo.GetUnicodeCategory(ch):G}");
// The example displays the following output:
//       U+D800: Surrogate
//       U+DF80: Surrogate
Dim utf32 As Integer = &h10380       ' UGARITIC LETTER ALPA
Dim surrogate As String = Char.ConvertFromUtf32(utf32)
For Each ch In surrogate
   Console.WriteLine("U+{0:X4}: {1:G}", 
' The example displays the following output:
'       U+D800: Surrogate
'       U+DF80: Surrogate

CharUnicodeInfo.GetUnicodeCategory Parametre olarak belirli bir karakter geçirildiğinde yöntemiyle Char.GetUnicodeCategory her zaman aynı UnicodeCategory değeri döndürmediğini unutmayın. CharUnicodeInfo.GetUnicodeCategory yöntemi Unicode standardının geçerli sürümünü yansıtacak şekilde tasarlanmıştır. Buna karşılık, yöntem genellikle Unicode standardının Char.GetUnicodeCategory geçerli sürümünü yansıtsa da, standardın önceki bir sürümünü temel alan bir karakterin kategorisini döndürebilir veya geriye dönük uyumluluğu korumak için geçerli standarttan farklı bir kategori döndürebilir.

Ayrıca bkz.

Şunlara uygulanır



Belirtilen karakterin Unicode kategorisini alır.

 static System::Globalization::UnicodeCategory GetUnicodeCategory(int codePoint);
public static System.Globalization.UnicodeCategory GetUnicodeCategory (int codePoint);
static member GetUnicodeCategory : int -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (codePoint As Integer) As UnicodeCategory



Unicode karakterinin 32 bit kod noktası değerini temsil eden bir sayı.


UnicodeCategory Belirtilen karakterin kategorisini gösteren bir değer.

Şunlara uygulanır

GetUnicodeCategory(String, Int32)


Belirtilen dizenin belirtilen dizinindeki karakterin Unicode kategorisini alır.

 static System::Globalization::UnicodeCategory GetUnicodeCategory(System::String ^ s, int index);
public static System.Globalization.UnicodeCategory GetUnicodeCategory (string s, int index);
static member GetUnicodeCategory : string * int -> System.Globalization.UnicodeCategory
Public Shared Function GetUnicodeCategory (s As String, index As Integer) As UnicodeCategory



String Unicode kategorisinin alındığı Unicode karakterini içeren.


Unicode kategorisinin alındığı Unicode karakterinin dizini.


UnicodeCategory Belirtilen dizenin belirtilen dizinindeki karakterin kategorisini gösteren değer.

Özel durumlar

s, null değeridir.

index içindeki geçerli dizin aralığının sdışındadır.


Aşağıdaki kod örneği, farklı karakter türleri için her yöntem tarafından döndürülen değerleri gösterir.

using namespace System;
using namespace System::Globalization;
int main()

   // The String to get information for.
   String^ s = "a9\u0393\u00B2\u00BC\u0BEF\u0BF0\u2788";
   Console::WriteLine( "String: {0}", s );

   // Print the values for each of the characters in the string.
   Console::WriteLine( "index c  Num   Dig   Dec   UnicodeCategory" );
   for ( int i = 0; i < s->Length; i++ )
      Console::Write( "{0,-5} {1,-3}", i, s[ i ] );
      Console::Write( " {0,-5}", CharUnicodeInfo::GetNumericValue( s, i ) );
      Console::Write( " {0,-5}", CharUnicodeInfo::GetDigitValue( s, i ) );
      Console::Write( " {0,-5}", CharUnicodeInfo::GetDecimalDigitValue( s, i ) );
      Console::WriteLine( "{0}", CharUnicodeInfo::GetUnicodeCategory( s, i ) );


This code produces the following output.  Some characters might not display at the console.

String: a9Γ²¼௯௰➈
index c  Num   Dig   Dec   UnicodeCategory
0     a   -1    -1    -1   LowercaseLetter
1     9   9     9     9    DecimalDigitNumber
2     Γ   -1    -1    -1   UppercaseLetter
3     ²   2     2     -1   OtherNumber
4     ¼   0.25  -1    -1   OtherNumber
5     ௯   9     9     9    DecimalDigitNumber
6     ௰   10    -1    -1   OtherNumber
7     ➈   9     9     -1   OtherNumber

using System;
using System.Globalization;

public class SamplesCharUnicodeInfo  {

   public static void Main()  {

      // The String to get information for.
      String s = "a9\u0393\u00B2\u00BC\u0BEF\u0BF0\u2788";
      Console.WriteLine( "String: {0}", s );

      // Print the values for each of the characters in the string.
      Console.WriteLine( "index c  Num   Dig   Dec   UnicodeCategory" );
      for ( int i = 0; i < s.Length; i++ )  {
         Console.Write( "{0,-5} {1,-3}", i, s[i] );
         Console.Write( " {0,-5}", CharUnicodeInfo.GetNumericValue( s, i ) );
         Console.Write( " {0,-5}", CharUnicodeInfo.GetDigitValue( s, i ) );
         Console.Write( " {0,-5}", CharUnicodeInfo.GetDecimalDigitValue( s, i ) );
         Console.WriteLine( "{0}", CharUnicodeInfo.GetUnicodeCategory( s, i ) );

This code produces the following output.  Some characters might not display at the console.

String: a9Γ²¼௯௰➈
index c  Num   Dig   Dec   UnicodeCategory
0     a   -1    -1    -1   LowercaseLetter
1     9   9     9     9    DecimalDigitNumber
2     Γ   -1    -1    -1   UppercaseLetter
3     ²   2     2     -1   OtherNumber
4     ¼   0.25  -1    -1   OtherNumber
5     ௯   9     9     9    DecimalDigitNumber
6     ௰   10    -1    -1   OtherNumber
7     ➈   9     9     -1   OtherNumber

Imports System.Globalization

Public Class SamplesCharUnicodeInfo

   Public Shared Sub Main()

      ' The String to get information for.
      Dim s As [String] = "a9\u0393\u00B2\u00BC\u0BEF\u0BF0\u2788"
      Console.WriteLine("String: {0}", s)

      ' Print the values for each of the characters in the string.
      Console.WriteLine("index c  Num   Dig   Dec   UnicodeCategory")
      Dim i As Integer
      For i = 0 To s.Length - 1
         Console.Write("{0,-5} {1,-3}", i, s(i))
         Console.Write(" {0,-5}", CharUnicodeInfo.GetNumericValue(s, i))
         Console.Write(" {0,-5}", CharUnicodeInfo.GetDigitValue(s, i))
         Console.Write(" {0,-5}", CharUnicodeInfo.GetDecimalDigitValue(s, i))
         Console.WriteLine("{0}", CharUnicodeInfo.GetUnicodeCategory(s, i))
      Next i

   End Sub

End Class

'This code produces the following output.  Some characters might not display at the console.
'String: a9Γ²¼௯௰➈
'index c  Num   Dig   Dec   UnicodeCategory
'0     a   -1    -1    -1   LowercaseLetter
'1     9   9     9     9    DecimalDigitNumber
'2     Γ   -1    -1    -1   UppercaseLetter
'3     ²   2     2     -1   OtherNumber
'4     ¼   0.25  -1    -1   OtherNumber
'5     ௯   9     9     9    DecimalDigitNumber
'6     ௰   10    -1    -1   OtherNumber
'7     ➈   9     9     -1   OtherNumber


Unicode karakterler kategorilere ayrılır. Karakterin kategorisi özelliklerinden biridir. Örneğin, karakter büyük harf, küçük harf, ondalık basamak numarası, harf numarası, bağlayıcı noktalama işareti, matematik simgesi veya para birimi simgesi olabilir. sınıfı, UnicodeCategory Unicode karakterinin kategorisini döndürür. Unicode karakterleri hakkında daha fazla bilgi için bkz. Unicode Standardı.

Konumundaki Charindex nesne geçerli bir vekil çiftin ilk karakteriyse, GetUnicodeCategory(String, Int32) yöntemi döndürmek UnicodeCategory.Surrogateyerine vekil çiftin Unicode kategorisini döndürür. Örneğin, Ugaritik alfabesi U+10380 ile U+1039F kod noktalarını kaplar. Aşağıdaki örnek, Ugaritik alfabesinin ConvertFromUtf32 ilk harfi olan UGARITIC LETTER ALPA'yı (U+10380) temsil eden bir dize örneği oluşturmak için yöntemini kullanır. Örnekteki çıktıda gösterildiği gibi, GetUnicodeCategory(String, Int32) yöntem bu karakterin yüksek vekilinin geçirilip geçirilmediğini döndürür UnicodeCategory.OtherLetter ve bu da vekil çifti dikkate alındığını gösterir. Ancak, düşük vekil geçirilirse, yalnızca düşük vekili yalıtılmış olarak değerlendirir ve döndürür UnicodeCategory.Surrogate.

int utf32 = 0x10380;       // UGARITIC LETTER ALPA
string surrogate = Char.ConvertFromUtf32(utf32);
for (int ctr = 0; ctr < surrogate.Length; ctr++)
    Console.WriteLine($"U+{(ushort)surrogate[ctr]:X4}: {System.Globalization.CharUnicodeInfo.GetUnicodeCategory(surrogate, ctr):G}");
// The example displays the following output:
//       U+D800: OtherLetter
//       U+DF80: Surrogate
Dim utf32 As Integer = &h10380       ' UGARITIC LETTER ALPA
Dim surrogate As String = Char.ConvertFromUtf32(utf32)
For ctr As Integer = 0 To surrogate.Length - 1
   Console.WriteLine("U+{0:X4}: {1:G}", 
                     System.Globalization.CharUnicodeInfo.GetUnicodeCategory(surrogate, ctr))
' The example displays the following output:
'       U+D800: OtherLetter
'       U+DF80: Surrogate

YönteminCharUnicodeInfo.GetUnicodeCategory, parametre olarak belirli bir karakter geçirildiğinde yöntemle Char.GetUnicodeCategory her zaman aynı UnicodeCategory değeri döndürmediğini unutmayın. CharUnicodeInfo.GetUnicodeCategory yöntemi Unicode standardının geçerli sürümünü yansıtacak şekilde tasarlanmıştır. Buna karşılık, yöntem genellikle Unicode standardının Char.GetUnicodeCategory geçerli sürümünü yansıtsa da, standardın önceki bir sürümünü temel alan bir karakterin kategorisini döndürebilir veya geriye dönük uyumluluğu korumak için geçerli standarttan farklı bir kategori döndürebilir.

Ayrıca bkz.

Şunlara uygulanır