UnicodeCategory UnicodeCategory UnicodeCategory UnicodeCategory Enum

Definición

Define la categoría Unicode de un carácter.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
Herencia
UnicodeCategoryUnicodeCategoryUnicodeCategoryUnicodeCategory
Atributos

Campos

ClosePunctuation ClosePunctuation ClosePunctuation ClosePunctuation 21

Carácter de cierre de uno de los signos de puntuación dobles, como paréntesis, corchetes y llaves.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Indicado por la designación de Unicode "Pe" (puntuación, cerrar).Signified by the Unicode designation "Pe" (punctuation, close). El valor es 21.The value is 21.

ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation 18

Carácter de signo de puntuación conector que conecta dos caracteres.Connector punctuation character that connects two characters. Indicado por la designación de Unicode "Pc" (puntuación, conector).Signified by the Unicode designation "Pc" (punctuation, connector). El valor es 18.The value is 18.

Control Control Control Control 14

Carácter de código de control, con un valor Unicode de U+007F o en el intervalo comprendido entre U+0000 y U+001F o entre U+0080 y U+009F.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. Indicado por la designación de Unicode "Cc" (otro, control).Signified by the Unicode designation "Cc" (other, control). El valor es 14.The value is 14.

CurrencySymbol CurrencySymbol CurrencySymbol CurrencySymbol 26

Carácter de símbolo de divisa.Currency symbol character. Indicado por la designación de Unicode "Sc" (símbolo, divisa).Signified by the Unicode designation "Sc" (symbol, currency). El valor es 26.The value is 26.

DashPunctuation DashPunctuation DashPunctuation DashPunctuation 19

Carácter de raya o guión.Dash or hyphen character. Indicado por la designación de Unicode "Pd" (puntuación, raya).Signified by the Unicode designation "Pd" (punctuation, dash). El valor es 19.The value is 19.

DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber 8

Carácter de dígito decimal, es decir, carácter en el intervalo comprendido entre 0 y 9.Decimal digit character, that is, a character in the range 0 through 9. Indicado por la designación de Unicode "Nd" (número, dígito decimal).Signified by the Unicode designation "Nd" (number, decimal digit). El valor es 8.The value is 8.

EnclosingMark EnclosingMark EnclosingMark EnclosingMark 7

Carácter de marca de cierre, que es un carácter de combinación sin espacio que rodea todos los caracteres anteriores hasta el carácter base incluido.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. Indicado por la designación de Unicode "Me" (marca, cerrar).Signified by the Unicode designation "Me" (mark, enclosing). El valor es 7.The value is 7.

FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation 23

Carácter de comilla final o de cierre.Closing or final quotation mark character. Indicado por la designación de Unicode "Pf" (puntuación, comilla final).Signified by the Unicode designation "Pf" (punctuation, final quote). El valor es 23.The value is 23.

Format Format Format Format 15

Carácter de formato que afecta al diseño del texto o la operación de procesos de texto, pero que no se representa normalmente.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. Indicado por la designación de Unicode "Cf" (otro, formato).Signified by the Unicode designation "Cf" (other, format). El valor es 15.The value is 15.

InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation 22

Carácter de comilla inicial o de apertura.Opening or initial quotation mark character. Indicado por la designación de Unicode "Pi" (puntuación, comilla inicial).Signified by the Unicode designation "Pi" (punctuation, initial quote). El valor es 22.The value is 22.

LetterNumber LetterNumber LetterNumber LetterNumber 9

Número representado por una letra, en lugar de un dígito decimal; por ejemplo, el número romano de cinco, que es "V".Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". El indicador se especifica mediante la designación de Unicode "Nl" (número, letra).The indicator is signified by the Unicode designation "Nl" (number, letter). El valor es 9.The value is 9.

LineSeparator LineSeparator LineSeparator LineSeparator 12

Carácter que se utiliza para separar líneas de texto.Character that is used to separate lines of text. Indicado por la designación de Unicode "Zl" (separador, línea).Signified by the Unicode designation "Zl" (separator, line). El valor es 12.The value is 12.

LowercaseLetter LowercaseLetter LowercaseLetter LowercaseLetter 1

Letra en minúsculas.Lowercase letter. Indicado por la designación de Unicode "Ll" (letra, minúscula).Signified by the Unicode designation "Ll" (letter, lowercase). El valor es 1.The value is 1.

MathSymbol MathSymbol MathSymbol MathSymbol 25

Carácter de símbolo matemático, como "+" o "=".Mathematical symbol character, such as "+" or "= ". Indicado por la designación de Unicode "Sm" (símbolo, matemático).Signified by the Unicode designation "Sm" (symbol, math). El valor es 25.The value is 25.

ModifierLetter ModifierLetter ModifierLetter ModifierLetter 3

Carácter de letra modificadora, que es un carácter de espacio cualquiera que indica modificaciones de una letra anterior.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. Indicado por la designación de Unicode "Lm" (letra, modificador).Signified by the Unicode designation "Lm" (letter, modifier). El valor es 3.The value is 3.

ModifierSymbol ModifierSymbol ModifierSymbol ModifierSymbol 27

Carácter de símbolo modificador, que especifica las modificaciones de los caracteres circundantes.Modifier symbol character, which indicates modifications of surrounding characters. Por ejemplo, la barra diagonal de fracción indica que el número a la izquierda es el numerador y el número a la derecha, el denominador.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. El indicador se especifica mediante la designación de Unicode "Sk" (símbolo, modificador).The indicator is signified by the Unicode designation "Sk" (symbol, modifier). El valor es 27.The value is 27.

NonSpacingMark NonSpacingMark NonSpacingMark NonSpacingMark 5

Carácter que no es un espacio que indica modificaciones de un carácter base.Nonspacing character that indicates modifications of a base character. Indicado por la designación de Unicode "Mn" (marca, sin espacios).Signified by the Unicode designation "Mn" (mark, nonspacing). El valor es 5.The value is 5.

OpenPunctuation OpenPunctuation OpenPunctuation OpenPunctuation 20

Carácter de apertura de uno de los signos de puntuación dobles, como paréntesis, corchetes y llaves.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Indicado por la designación de Unicode "Ps" (puntuación, abrir).Signified by the Unicode designation "Ps" (punctuation, open). El valor es 20.The value is 20.

OtherLetter OtherLetter OtherLetter OtherLetter 4

Letra que no es una letra mayúscula, una letra minúscula, una letra de título o una letra modificadora.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. Indicado por la designación de Unicode "Lo" (letra, otra).Signified by the Unicode designation "Lo" (letter, other). El valor es 4.The value is 4.

OtherNotAssigned OtherNotAssigned OtherNotAssigned OtherNotAssigned 29

Carácter que no está asignado a ninguna categoría Unicode.Character that is not assigned to any Unicode category. Indicado por la designación de Unicode "Cn" (otro, no asignado).Signified by the Unicode designation "Cn" (other, not assigned). El valor es 29.The value is 29.

OtherNumber OtherNumber OtherNumber OtherNumber 10

Número que no es un dígito decimal ni un número de letra, por ejemplo, la fracción 1/2.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. El indicador se especifica mediante la designación de Unicode "No" (número, otro).The indicator is signified by the Unicode designation "No" (number, other). El valor es 10.The value is 10.

OtherPunctuation OtherPunctuation OtherPunctuation OtherPunctuation 24

Carácter de signo de puntuación que no es un conector, una raya, un signo de puntuación de apertura, un signo de puntuación de cierre, una comilla inicial o una comilla final.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. Indicado por la designación de Unicode "Po" (puntuación, otro).Signified by the Unicode designation "Po" (punctuation, other). El valor es 24.The value is 24.

OtherSymbol OtherSymbol OtherSymbol OtherSymbol 28

Carácter de símbolo que no es un símbolo matemático, un símbolo de divisa o un símbolo modificador.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. Indicado por la designación de Unicode "So" (símbolo, otro).Signified by the Unicode designation "So" (symbol, other). El valor es 28.The value is 28.

ParagraphSeparator ParagraphSeparator ParagraphSeparator ParagraphSeparator 13

Carácter utilizado para separar párrafos.Character used to separate paragraphs. Indicado por la designación de Unicode "Zp" (separador, párrafo).Signified by the Unicode designation "Zp" (separator, paragraph). El valor es 13.The value is 13.

PrivateUse PrivateUse PrivateUse PrivateUse 17

Carácter de uso privado, con un valor Unicode en el intervalo comprendido entre U+E000 y U+F8FF.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. Indicado por la designación de Unicode "Co" (otro, uso privado).Signified by the Unicode designation "Co" (other, private use). El valor es 17.The value is 17.

SpaceSeparator SpaceSeparator SpaceSeparator SpaceSeparator 11

Carácter de espacio, que no tiene glifo pero no es un carácter de formato o control.Space character, which has no glyph but is not a control or format character. Indicado por la designación de Unicode "Zs" (separador, espacio).Signified by the Unicode designation "Zs" (separator, space). El valor es 11.The value is 11.

SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark 6

Carácter de espacio que indica modificaciones de un carácter base y afecta al ancho del glifo para ese carácter base.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. Indicado por la designación de Unicode "Mc" (marca, espacio combinable).Signified by the Unicode designation "Mc" (mark, spacing combining). El valor es 6.The value is 6.

Surrogate Surrogate Surrogate Surrogate 16

Carácter de suplente bajo o suplente alto.High surrogate or a low surrogate character. Los valores de códigos de suplente están comprendidos en el intervalo de U+D800 a U+DFFF.Surrogate code values are in the range U+D800 through U+DFFF. Indicado por la designación de Unicode "Cs" (otro, suplente).Signified by the Unicode designation "Cs" (other, surrogate). El valor es 16.The value is 16.

TitlecaseLetter TitlecaseLetter TitlecaseLetter TitlecaseLetter 2

Letra de título.Titlecase letter. Indicado por la designación de Unicode "Lt" (letra, título).Signified by the Unicode designation "Lt" (letter, titlecase). El valor es 2.The value is 2.

UppercaseLetter UppercaseLetter UppercaseLetter UppercaseLetter 0

Letra en mayúsculas.Uppercase letter. Indicado por la designación de Unicode "Lu" (letra, mayúscula).Signified by the Unicode designation "Lu" (letter, uppercase). El valor es 0.The value is 0.

Ejemplos

El ejemplo siguiente muestra los caracteres y sus puntos de código correspondiente para los caracteres en la categoría UppercaseLetter.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. Puede modificar el ejemplo para mostrar las letras en cualquier otra categoría reemplazando UppercaseLetter con la categoría de su interés en la asignación en el category variable.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. Tenga en cuenta que la salida para algunas categorías puede ser amplia.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

Comentarios

Un miembro de la UnicodeCategory enumeración devuelta por la Char.GetUnicodeCategory y CharUnicodeInfo.GetUnicodeCategory métodos.A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. El UnicodeCategory enumeración también se usa para admitir Char métodos, como IsUpper(Char).The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). Tales métodos determinan si un carácter especificado es un miembro de una categoría general Unicode determinada.Such methods determine whether a specified character is a member of a particular Unicode general category. Una categoría general Unicode define la clasificación amplia de un carácter, es decir, la designación como un tipo de letra, dígito decimal, separador, símbolo matemático, signos de puntuación y así sucesivamente.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

Esta enumeración se basa en el estándar Unicode, versión 5.0.This enumeration is based on The Unicode Standard, version 5.0. Para obtener más información, consulte las secciones sobre el "formato de archivo UCD" y los "valores de categorías generales" en la base de datos de caracteres Unicode.For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

El estándar Unicode define lo siguiente:The Unicode Standard defines the following:

Un par suplente es una representación de caracteres codificados para un único carácter abstracto que consta de una secuencia de dos unidades de código, donde la primera unidad del par es un suplente alto y el segundo es un suplente bajo.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. Un suplente alto es un punto de código Unicode en el intervalo de U+D800 a U+DBFF y un suplente bajo es un punto de código Unicode en el intervalo U+DC00 a U+DFFF.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

Una secuencia de caracteres combinables es una combinación de un carácter base y uno o más caracteres de combinación.A combining character sequence is a combination of a base character and one or more combining characters. Un par suplente representa un carácter base o un carácter de combinación.A surrogate pair represents a base character or a combining character. Un carácter de combinación es espacio o sin espacio.A combining character is either spacing or nonspacing. Una combinación de caracteres de espacios ocupa una posición de espacio por sí mismo cuando se procesa, mientras que un carácter combinables no.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. Los signos diacríticos son un ejemplo de los caracteres combinables.Diacritics are an example of nonspacing combining characters.

Una letra modificadora es un carácter de espaciado independiente que, al igual que un carácter combinable, indica modificaciones de una letra anterior.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

Una marca de cierre es sin espacio en una combinación de caracteres que rodea todos los caracteres anteriores hasta e incluyendo un carácter base.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

Un carácter de formato es un carácter que no se procesa con normalidad, pero que afecta al diseño del texto o la operación de procesos de texto.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

El estándar Unicode define varias variaciones para algunos signos de puntuación.The Unicode Standard defines several variations to some punctuation marks. Por ejemplo, un guión puede ser uno de varios valores de código que representan un guión, como u+002D (signo menos) o U + 00AD (guion) o U + 2010 (guión) o U + 2011 (guión de no separación).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). Lo mismo puede decirse de guiones, caracteres de espacio y las comillas.The same is true for dashes, space characters, and quotation marks.

El estándar Unicode también asigna códigos a representaciones de dígitos decimales que son específicas de un script determinado o un lenguaje, por ejemplo, u+0030 (dígito cero) y u+0660 (dígitos árabo-índicos cero).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

Se aplica a

Consulte también: