UnicodeCategory Enumerazione

Definizione

Definisce la categoria Unicode di un carattere.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
Ereditarietà
UnicodeCategory
Attributi

Campi

ClosePunctuation 21

Carattere di chiusura di una coppia di segni di punteggiatura, ad esempio parentesi, parentesi quadre e parentesi graffe.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Identificato dalla definizione Unicode "Pe" (punctuation, close).Signified by the Unicode designation "Pe" (punctuation, close). Il valore è 21.The value is 21.

ConnectorPunctuation 18

Carattere di punteggiatura di connessione che unisce due caratteri.Connector punctuation character that connects two characters. Identificato dalla definizione Unicode "Pc" (punctuation, connector).Signified by the Unicode designation "Pc" (punctuation, connector). Il valore è 18.The value is 18.

Control 14

Carattere di codice di controllo, con un valore Unicode U+007F oppure compreso nell'intervallo tra U+0000 e U+001F o tra U+0080 e U+009F.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. Identificato dalla definizione Unicode "Cc" (other, control).Signified by the Unicode designation "Cc" (other, control). Il valore è 14.The value is 14.

CurrencySymbol 26

Carattere del simbolo di valuta.Currency symbol character. Identificato dalla definizione Unicode "Sc" (symbol, currency).Signified by the Unicode designation "Sc" (symbol, currency). Il valore è 26.The value is 26.

DashPunctuation 19

Carattere di trattino o lineetta.Dash or hyphen character. Identificato dalla definizione Unicode "Pd" (punctuation, dash).Signified by the Unicode designation "Pd" (punctuation, dash). Il valore è 19.The value is 19.

DecimalDigitNumber 8

Carattere di cifra decimale, ovvero un carattere compreso nell'intervallo tra 0 e 9.Decimal digit character, that is, a character in the range 0 through 9. Identificato dalla definizione Unicode "Nd" (number, decimal digit).Signified by the Unicode designation "Nd" (number, decimal digit). Il valore è 8.The value is 8.

EnclosingMark 7

Carattere di inclusione, ovvero un carattere di combinazione di non spaziatura che racchiude tutti i caratteri precedenti fino a comprendere un carattere di base.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. Identificato dalla definizione Unicode "Me" (mark, enclosing).Signified by the Unicode designation "Me" (mark, enclosing). Il valore è 7.The value is 7.

FinalQuotePunctuation 23

Carattere di virgolette di chiusura.Closing or final quotation mark character. Identificato dalla definizione Unicode "Pf" (punctuation, final quote).Signified by the Unicode designation "Pf" (punctuation, final quote). Il valore è 23.The value is 23.

Format 15

Carattere di formattazione che influisce sul layout del testo o il tipo di elaborazione del testo, ma in genere non viene sottoposto a rendering.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. Identificato dalla definizione Unicode "Cf" (other, format).Signified by the Unicode designation "Cf" (other, format). Il valore è 15.The value is 15.

InitialQuotePunctuation 22

Carattere di virgolette di apertura.Opening or initial quotation mark character. Identificato dalla definizione Unicode "Pi" (punctuation, initial quote).Signified by the Unicode designation "Pi" (punctuation, initial quote). Il valore è 22.The value is 22.

LetterNumber 9

Numero rappresentato da una lettera, anziché da una cifra decimale, ad esempio il numero romano 5 indicato dalla lettera 'V'.Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". L'indicatore è identificato dalla definizione Unicode "Nl" (number, letter).The indicator is signified by the Unicode designation "Nl" (number, letter). Il valore è 9.The value is 9.

LineSeparator 12

Carattere utilizzato per separare le righe di testo.Character that is used to separate lines of text. Identificato dalla definizione Unicode "Zl" (separator, line).Signified by the Unicode designation "Zl" (separator, line). Il valore è 12.The value is 12.

LowercaseLetter 1

Lettera minuscola.Lowercase letter. Identificato dalla definizione Unicode "Ll" (letter, lowercase).Signified by the Unicode designation "Ll" (letter, lowercase). Il valore è 1.The value is 1.

MathSymbol 25

Carattere di simbolo matematico, quale "+" o "=".Mathematical symbol character, such as "+" or "= ". Identificato dalla definizione Unicode "Sm" (symbol, math).Signified by the Unicode designation "Sm" (symbol, math). Il valore è 25.The value is 25.

ModifierLetter 3

Carattere di modificatore, ovvero un carattere di spaziatura libero che specifica le modifiche di una lettera precedente.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. Identificato dalla definizione Unicode "Lm" (letter, modifier).Signified by the Unicode designation "Lm" (letter, modifier). Il valore è 3.The value is 3.

ModifierSymbol 27

Carattere di simbolo modificatore, che specifica le modifiche dei caratteri adiacenti.Modifier symbol character, which indicates modifications of surrounding characters. Ad esempio, la barra obliqua di una frazione indica che il numero alla sinistra è il numeratore e il numero alla destra è il denominatore.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. L'indicatore è identificato dalla definizione Unicode "Sk" (symbol, modifier).The indicator is signified by the Unicode designation "Sk" (symbol, modifier). Il valore è 27.The value is 27.

NonSpacingMark 5

Carattere senza spaziatura che indica le modifiche di un carattere di base.Nonspacing character that indicates modifications of a base character. Identificato dalla definizione Unicode "Mn" (mark, nonspacing).Signified by the Unicode designation "Mn" (mark, nonspacing). Il valore è 5.The value is 5.

OpenPunctuation 20

Carattere di apertura di una coppia di segni di punteggiatura, ad esempio parentesi, parentesi quadre e parentesi graffe.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Identificato dalla definizione Unicode "Ps" (punctuation, open).Signified by the Unicode designation "Ps" (punctuation, open). Il valore è 20.The value is 20.

OtherLetter 4

Lettera diversa da una lettera maiuscola, una lettera minuscola, una lettera di un titolo o un modificatore.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. Identificato dalla definizione Unicode "Lo" (letter, other).Signified by the Unicode designation "Lo" (letter, other). Il valore è 4.The value is 4.

OtherNotAssigned 29

Carattere non assegnato ad alcuna categoria Unicode.Character that is not assigned to any Unicode category. Identificato dalla definizione Unicode "Cn" (other, not assigned).Signified by the Unicode designation "Cn" (other, not assigned). Il valore è 29.The value is 29.

OtherNumber 10

Numero che non è né una cifra decimale né un numero rappresentato da una lettera, ad esempio la frazione 1/2.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. L'indicatore è identificato dalla definizione Unicode "No" (numero, altro).The indicator is signified by the Unicode designation "No" (number, other). Il valore è 10.The value is 10.

OtherPunctuation 24

Carattere di punteggiatura diverso da un segno di punteggiatura di connessione, una lineetta, un segno di punteggiatura di apertura, un segno di punteggiatura di chiusura, un segno di virgolette di apertura o un segno di virgolette di chiusura.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. Identificato dalla definizione Unicode "Po" (punctuation, other).Signified by the Unicode designation "Po" (punctuation, other). Il valore è 24.The value is 24.

OtherSymbol 28

Carattere simbolo diverso da un simbolo matematico, di valuta o modificatore.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. Identificato dalla definizione Unicode "So" (symbol, other).Signified by the Unicode designation "So" (symbol, other). Il valore è 28.The value is 28.

ParagraphSeparator 13

Carattere utilizzato per separare paragrafi.Character used to separate paragraphs. Identificato dalla definizione Unicode "Zp" (separator, paragraph).Signified by the Unicode designation "Zp" (separator, paragraph). Il valore è 13.The value is 13.

PrivateUse 17

Carattere ad uso privato, con valore Unicode compreso nell'intervallo tra U+E000 e U+F8FF.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. Identificato dalla definizione Unicode "Co" (other, private use).Signified by the Unicode designation "Co" (other, private use). Il valore è 17.The value is 17.

SpaceSeparator 11

Carattere di spazio, che non dispone di un glifo, ma non è un carattere di controllo o di formattazione.Space character, which has no glyph but is not a control or format character. Identificato dalla definizione Unicode "Zs" (separator, space).Signified by the Unicode designation "Zs" (separator, space). Il valore è 11.The value is 11.

SpacingCombiningMark 6

Carattere di spaziatura, che specifica le modifiche di un carattere di base e influenza la larghezza del glifo del carattere di base.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. Identificato dalla definizione Unicode "Mc" (mark, spacing combining).Signified by the Unicode designation "Mc" (mark, spacing combining). Il valore è 6.The value is 6.

Surrogate 16

Carattere surrogato alto o basso.High surrogate or a low surrogate character. I valori dei codici dei surrogati sono compresi nell'intervallo tra U+D800 e U+DFFF.Surrogate code values are in the range U+D800 through U+DFFF. Identificato dalla definizione Unicode "Cs" (other, surrogate).Signified by the Unicode designation "Cs" (other, surrogate). Il valore è 16.The value is 16.

TitlecaseLetter 2

Lettera di titolo.Titlecase letter. Identificato dalla definizione Unicode "Lt" (letter, titlecase).Signified by the Unicode designation "Lt" (letter, titlecase). Il valore è 2.The value is 2.

UppercaseLetter 0

Lettera maiuscola.Uppercase letter. Identificato dalla definizione Unicode "Lu" (letter, uppercase).Signified by the Unicode designation "Lu" (letter, uppercase). Il valore è 0.The value is 0.

Esempi

Nell'esempio seguente vengono visualizzati i caratteri e i punti di codice corrispondenti per i caratteri nella categoria UppercaseLetter.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. È possibile modificare l'esempio per visualizzare le lettere in qualsiasi altra categoria sostituendo UppercaseLetter con la categoria di interesse nell'assegnazione alla category variabile.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. Si noti che l'output di alcune categorie può essere esteso.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

Commenti

Un membro dell' UnicodeCategory enumerazione viene restituito Char.GetUnicodeCategory dai metodi e CharUnicodeInfo.GetUnicodeCategory .A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. L' UnicodeCategory enumerazione viene inoltre utilizzata per supportare Char metodi, ad esempio IsUpper(Char).The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). Tali metodi determinano se un carattere specificato è un membro di una particolare categoria generale Unicode.Such methods determine whether a specified character is a member of a particular Unicode general category. Una categoria generale Unicode definisce l'ampia classificazione di un carattere, ovvero la designazione come un tipo di lettera, una cifra decimale, un separatore, un simbolo matematico, una punteggiatura e così via.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

Questa enumerazione è basata sullo standard Unicode, versione 5,0.This enumeration is based on The Unicode Standard, version 5.0. Per altre informazioni, vedere gli argomenti correlati "UCD File Format" (Formato di file UCD) e "General Category Values" (Valori di categoria generale) in Unicode Character Database (Database di caratteri Unicode).For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

Lo standard Unicode definisce quanto segue:The Unicode Standard defines the following:

Una coppia di surrogati è una rappresentazione di caratteri codificati per un singolo carattere astratto costituito da una sequenza di due unità di codice, in cui la prima unità della coppia è un surrogato alto e il secondo è un surrogato basso.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. Un surrogato alto è un punto di codice Unicode compreso nell'intervallo tra U + D800 e U + DBFF e un surrogato basso è un punto di codice Unicode compreso nell'intervallo tra U + DC00 e U + DFFF.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

Una sequenza di caratteri di combinazione è una combinazione di un carattere di base e uno o più caratteri combinati.A combining character sequence is a combination of a base character and one or more combining characters. Una coppia di surrogati rappresenta un carattere di base o un carattere di combinazione.A surrogate pair represents a base character or a combining character. Un carattere di combinazione può essere spaziatura o senza spaziatura.A combining character is either spacing or nonspacing. Quando viene eseguito il rendering, un carattere di combinazione di spaziatura occupa automaticamente una posizione di spaziatura, mentre un carattere di combinazione senza spaziatura.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. I segni diacritici sono un esempio di caratteri di combinazione senza spaziatura.Diacritics are an example of nonspacing combining characters.

Una lettera di modificatore è un carattere di spaziatura libero che, come un carattere di combinazione, indica le modifiche di una lettera precedente.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

Un contrassegno di inclusione è un carattere di combinazione senza spaziatura che racchiude tutti i caratteri precedenti fino a un carattere di base.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

Un carattere di formato è un carattere normalmente non sottoposto a rendering ma che influiscono sul layout del testo o sull'operazione dei processi di testo.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

Lo standard Unicode definisce diverse varianti per alcuni segni di punteggiatura.The Unicode Standard defines several variations to some punctuation marks. Un trattino, ad esempio, può essere uno dei diversi valori di codice che rappresentano un trattino, ad esempio U + 002D (segno meno) o U + 00AD (trattino leggero) o u + 2010 (trattino) o U + 2011 (trattino senza interruzioni).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). Lo stesso vale per trattini, caratteri di spazio e virgolette.The same is true for dashes, space characters, and quotation marks.

Lo standard Unicode assegna anche codici alle rappresentazioni di cifre decimali specifiche di un determinato script o linguaggio, ad esempio U + 0030 (digit zero) e U + 0660 (Arabic-Indian digit zero).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

Si applica a

Vedi anche