UnicodeCategory UnicodeCategory UnicodeCategory UnicodeCategory Enum

Definizione

Definisce la categoria Unicode di un carattere.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
Ereditarietà
UnicodeCategoryUnicodeCategoryUnicodeCategoryUnicodeCategory
Attributi

Campi

ClosePunctuation ClosePunctuation ClosePunctuation ClosePunctuation 21

Carattere di chiusura di una coppia di segni di punteggiatura, ad esempio parentesi, parentesi quadre e parentesi graffe.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Identificato dalla definizione Unicode "Pe" (punctuation, close).Signified by the Unicode designation "Pe" (punctuation, close). Il valore è 21.The value is 21.

ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation 18

Carattere di punteggiatura di connessione che unisce due caratteri.Connector punctuation character that connects two characters. Identificato dalla definizione Unicode "Pc" (punctuation, connector).Signified by the Unicode designation "Pc" (punctuation, connector). Il valore è 18.The value is 18.

Control Control Control Control 14

Carattere di codice di controllo, con un valore Unicode U+007F oppure compreso nell'intervallo tra U+0000 e U+001F o tra U+0080 e U+009F.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. Identificato dalla definizione Unicode "Cc" (other, control).Signified by the Unicode designation "Cc" (other, control). Il valore è 14.The value is 14.

CurrencySymbol CurrencySymbol CurrencySymbol CurrencySymbol 26

Carattere del simbolo di valuta.Currency symbol character. Identificato dalla definizione Unicode "Sc" (symbol, currency).Signified by the Unicode designation "Sc" (symbol, currency). Il valore è 26.The value is 26.

DashPunctuation DashPunctuation DashPunctuation DashPunctuation 19

Carattere di trattino o lineetta.Dash or hyphen character. Identificato dalla definizione Unicode "Pd" (punctuation, dash).Signified by the Unicode designation "Pd" (punctuation, dash). Il valore è 19.The value is 19.

DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber 8

Carattere di cifra decimale, ovvero un carattere compreso nell'intervallo tra 0 e 9.Decimal digit character, that is, a character in the range 0 through 9. Identificato dalla definizione Unicode "Nd" (number, decimal digit).Signified by the Unicode designation "Nd" (number, decimal digit). Il valore è 8.The value is 8.

EnclosingMark EnclosingMark EnclosingMark EnclosingMark 7

Carattere di inclusione, ovvero un carattere di combinazione di non spaziatura che racchiude tutti i caratteri precedenti fino a comprendere un carattere di base.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. Identificato dalla definizione Unicode "Me" (mark, enclosing).Signified by the Unicode designation "Me" (mark, enclosing). Il valore è 7.The value is 7.

FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation 23

Carattere di virgolette di chiusura.Closing or final quotation mark character. Identificato dalla definizione Unicode "Pf" (punctuation, final quote).Signified by the Unicode designation "Pf" (punctuation, final quote). Il valore è 23.The value is 23.

Format Format Format Format 15

Carattere di formattazione che influisce sul layout del testo o il tipo di elaborazione del testo, ma in genere non viene sottoposto a rendering.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. Identificato dalla definizione Unicode "Cf" (other, format).Signified by the Unicode designation "Cf" (other, format). Il valore è 15.The value is 15.

InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation 22

Carattere di virgolette di apertura.Opening or initial quotation mark character. Identificato dalla definizione Unicode "Pi" (punctuation, initial quote).Signified by the Unicode designation "Pi" (punctuation, initial quote). Il valore è 22.The value is 22.

LetterNumber LetterNumber LetterNumber LetterNumber 9

Numero rappresentato da una lettera, anziché da una cifra decimale, ad esempio il numero romano 5 indicato dalla lettera 'V'.Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". L'indicatore è identificato dalla definizione Unicode "Nl" (number, letter).The indicator is signified by the Unicode designation "Nl" (number, letter). Il valore è 9.The value is 9.

LineSeparator LineSeparator LineSeparator LineSeparator 12

Carattere utilizzato per separare le righe di testo.Character that is used to separate lines of text. Identificato dalla definizione Unicode "Zl" (separator, line).Signified by the Unicode designation "Zl" (separator, line). Il valore è 12.The value is 12.

LowercaseLetter LowercaseLetter LowercaseLetter LowercaseLetter 1

Lettera minuscola.Lowercase letter. Identificato dalla definizione Unicode "Ll" (letter, lowercase).Signified by the Unicode designation "Ll" (letter, lowercase). Il valore è 1.The value is 1.

MathSymbol MathSymbol MathSymbol MathSymbol 25

Carattere di simbolo matematico, quale "+" o "=".Mathematical symbol character, such as "+" or "= ". Identificato dalla definizione Unicode "Sm" (symbol, math).Signified by the Unicode designation "Sm" (symbol, math). Il valore è 25.The value is 25.

ModifierLetter ModifierLetter ModifierLetter ModifierLetter 3

Carattere di modificatore, ovvero un carattere di spaziatura libero che specifica le modifiche di una lettera precedente.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. Identificato dalla definizione Unicode "Lm" (letter, modifier).Signified by the Unicode designation "Lm" (letter, modifier). Il valore è 3.The value is 3.

ModifierSymbol ModifierSymbol ModifierSymbol ModifierSymbol 27

Carattere di simbolo modificatore, che specifica le modifiche dei caratteri adiacenti.Modifier symbol character, which indicates modifications of surrounding characters. Ad esempio, la barra obliqua di una frazione indica che il numero alla sinistra è il numeratore e il numero alla destra è il denominatore.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. L'indicatore è identificato dalla definizione Unicode "Sk" (symbol, modifier).The indicator is signified by the Unicode designation "Sk" (symbol, modifier). Il valore è 27.The value is 27.

NonSpacingMark NonSpacingMark NonSpacingMark NonSpacingMark 5

Carattere senza spaziatura che indica le modifiche di un carattere di base.Nonspacing character that indicates modifications of a base character. Identificato dalla definizione Unicode "Mn" (mark, nonspacing).Signified by the Unicode designation "Mn" (mark, nonspacing). Il valore è 5.The value is 5.

OpenPunctuation OpenPunctuation OpenPunctuation OpenPunctuation 20

Carattere di apertura di una coppia di segni di punteggiatura, ad esempio parentesi, parentesi quadre e parentesi graffe.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Identificato dalla definizione Unicode "Ps" (punctuation, open).Signified by the Unicode designation "Ps" (punctuation, open). Il valore è 20.The value is 20.

OtherLetter OtherLetter OtherLetter OtherLetter 4

Lettera diversa da una lettera maiuscola, una lettera minuscola, una lettera di un titolo o un modificatore.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. Identificato dalla definizione Unicode "Lo" (letter, other).Signified by the Unicode designation "Lo" (letter, other). Il valore è 4.The value is 4.

OtherNotAssigned OtherNotAssigned OtherNotAssigned OtherNotAssigned 29

Carattere non assegnato ad alcuna categoria Unicode.Character that is not assigned to any Unicode category. Identificato dalla definizione Unicode "Cn" (other, not assigned).Signified by the Unicode designation "Cn" (other, not assigned). Il valore è 29.The value is 29.

OtherNumber OtherNumber OtherNumber OtherNumber 10

Numero che non è né una cifra decimale né un numero rappresentato da una lettera, ad esempio la frazione 1/2.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. L'indicatore è identificato dalla definizione Unicode "No" (numero, altro).The indicator is signified by the Unicode designation "No" (number, other). Il valore è 10.The value is 10.

OtherPunctuation OtherPunctuation OtherPunctuation OtherPunctuation 24

Carattere di punteggiatura diverso da un segno di punteggiatura di connessione, una lineetta, un segno di punteggiatura di apertura, un segno di punteggiatura di chiusura, un segno di virgolette di apertura o un segno di virgolette di chiusura.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. Identificato dalla definizione Unicode "Po" (punctuation, other).Signified by the Unicode designation "Po" (punctuation, other). Il valore è 24.The value is 24.

OtherSymbol OtherSymbol OtherSymbol OtherSymbol 28

Carattere simbolo diverso da un simbolo matematico, di valuta o modificatore.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. Identificato dalla definizione Unicode "So" (symbol, other).Signified by the Unicode designation "So" (symbol, other). Il valore è 28.The value is 28.

ParagraphSeparator ParagraphSeparator ParagraphSeparator ParagraphSeparator 13

Carattere utilizzato per separare paragrafi.Character used to separate paragraphs. Identificato dalla definizione Unicode "Zp" (separator, paragraph).Signified by the Unicode designation "Zp" (separator, paragraph). Il valore è 13.The value is 13.

PrivateUse PrivateUse PrivateUse PrivateUse 17

Carattere ad uso privato, con valore Unicode compreso nell'intervallo tra U+E000 e U+F8FF.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. Identificato dalla definizione Unicode "Co" (other, private use).Signified by the Unicode designation "Co" (other, private use). Il valore è 17.The value is 17.

SpaceSeparator SpaceSeparator SpaceSeparator SpaceSeparator 11

Carattere di spazio, che non dispone di un glifo, ma non è un carattere di controllo o di formattazione.Space character, which has no glyph but is not a control or format character. Identificato dalla definizione Unicode "Zs" (separator, space).Signified by the Unicode designation "Zs" (separator, space). Il valore è 11.The value is 11.

SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark 6

Carattere di spaziatura, che specifica le modifiche di un carattere di base e influenza la larghezza del glifo del carattere di base.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. Identificato dalla definizione Unicode "Mc" (mark, spacing combining).Signified by the Unicode designation "Mc" (mark, spacing combining). Il valore è 6.The value is 6.

Surrogate Surrogate Surrogate Surrogate 16

Carattere surrogato alto o basso.High surrogate or a low surrogate character. I valori dei codici dei surrogati sono compresi nell'intervallo tra U+D800 e U+DFFF.Surrogate code values are in the range U+D800 through U+DFFF. Identificato dalla definizione Unicode "Cs" (other, surrogate).Signified by the Unicode designation "Cs" (other, surrogate). Il valore è 16.The value is 16.

TitlecaseLetter TitlecaseLetter TitlecaseLetter TitlecaseLetter 2

Lettera di titolo.Titlecase letter. Identificato dalla definizione Unicode "Lt" (letter, titlecase).Signified by the Unicode designation "Lt" (letter, titlecase). Il valore è 2.The value is 2.

UppercaseLetter UppercaseLetter UppercaseLetter UppercaseLetter 0

Lettera maiuscola.Uppercase letter. Identificato dalla definizione Unicode "Lu" (letter, uppercase).Signified by the Unicode designation "Lu" (letter, uppercase). Il valore è 0.The value is 0.

Esempi

L'esempio seguente mostra i caratteri e i relativi punti di codice per i caratteri nella categoria UppercaseLetter.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. È possibile modificare l'esempio per visualizzare le lettere in nessun'altra categoria sostituendo UppercaseLetter con la categoria di interesse dell'assegnazione di category variabile.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. Si noti che l'output per alcune categorie può essere esteso.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

Commenti

Un membro del UnicodeCategory enumerazione viene restituita per il Char.GetUnicodeCategory e CharUnicodeInfo.GetUnicodeCategory metodi.A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. Il UnicodeCategory enumerazione viene utilizzata anche per supportare Char metodi, ad esempio IsUpper(Char).The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). Tali metodi determinano se un carattere specificato è un membro di una determinata categoria generale Unicode.Such methods determine whether a specified character is a member of a particular Unicode general category. Una categoria generale Unicode definisce la classificazione più ampia di un carattere, vale a dire, una definizione di un tipo di lettera, le cifre decimali, separatore, simbolo matematico, segni di punteggiatura e così via.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

Questa enumerazione è basata sullo Unicode Standard, versione 5.0.This enumeration is based on The Unicode Standard, version 5.0. Per altre informazioni, vedere gli argomenti correlati "UCD File Format" (Formato di file UCD) e "General Category Values" (Valori di categoria generale) in Unicode Character Database (Database di caratteri Unicode).For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

Lo Unicode Standard definisce gli elementi seguenti:The Unicode Standard defines the following:

Una coppia di surrogati è una rappresentazione di caratteri codificati per un singolo carattere astratto costituito da una sequenza di due unità di codice, in cui l'unità prima della coppia è un surrogato alto e il secondo è un surrogato basso.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. Un surrogato alto è un punto di codice Unicode nell'intervallo compreso tra U+D800 e U + DBFF e un surrogato basso rappresenta un punto di codice Unicode compreso nell'intervallo tra U+DC00 e U + DFFF.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

Una combinazione di sequenza di caratteri è una combinazione di un carattere di base e uno o più caratteri di combinazione.A combining character sequence is a combination of a base character and one or more combining characters. Una coppia di surrogati rappresenta un carattere di base o un carattere di combinazione.A surrogate pair represents a base character or a combining character. Non è un carattere di combinazione spaziatura o senza spaziatura.A combining character is either spacing or nonspacing. Una combinazione carattere di spaziatura occupa una posizione di spaziatura da solo quando viene eseguito il rendering, mentre una combinazione di caratteri di non spaziatura non.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. I segni diacritici sono un esempio di caratteri di combinazione senza spaziatura.Diacritics are an example of nonspacing combining characters.

Una lettera di modificatore è un carattere di spaziatura libero che, come un carattere di combinazione, indica modifiche di una lettera precedente.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

Un segno di inclusione è un senza spaziatura, la combinazione di caratteri che circonda tutti i caratteri precedenti fino a e includendo un carattere di base.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

Un carattere di formato è un carattere che in genere non viene sottoposto a rendering, ma influisce sul layout del testo o l'operazione di elaborazione del testo.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

Lo Unicode Standard definisce diverse varianti per alcuni segni di punteggiatura.The Unicode Standard defines several variations to some punctuation marks. Ad esempio, un trattino può essere uno dei diversi valori di codice che rappresentano un trattino, ad esempio 002D U + (segno meno) o 00AD U + (segno meno facoltativo) U + 2010 (trattino) o U + 2011 (unificatore).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). Lo stesso vale per gli spazi, trattini e racchiusi tra virgolette.The same is true for dashes, space characters, and quotation marks.

Lo Unicode Standard assegna inoltre i codici per le rappresentazioni di cifre decimali che sono specifiche di un dato alfabeto o lingua, ad esempio, u+0030 (cifra zero) e U + 0660 (cifre indo-arabici zero).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

Si applica a

Vedi anche