UnicodeCategory Enumeración

Definición

Define la categoría Unicode de un carácter.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
Herencia
UnicodeCategory
Atributos

Campos

ClosePunctuation 21

Carácter de cierre de uno de los signos de puntuación dobles, como paréntesis, corchetes y llaves.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Indicado por la designación de Unicode "Pe" (puntuación, cerrar).Signified by the Unicode designation "Pe" (punctuation, close). El valor es 21.The value is 21.

ConnectorPunctuation 18

Carácter de signo de puntuación conector que conecta dos caracteres.Connector punctuation character that connects two characters. Indicado por la designación de Unicode "Pc" (puntuación, conector).Signified by the Unicode designation "Pc" (punctuation, connector). El valor es 18.The value is 18.

Control 14

Carácter de código de control, con un valor Unicode de U+007F o en el intervalo comprendido entre U+0000 y U+001F o entre U+0080 y U+009F.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. Indicado por la designación de Unicode "Cc" (otro, control).Signified by the Unicode designation "Cc" (other, control). El valor es 14.The value is 14.

CurrencySymbol 26

Carácter de símbolo de divisa.Currency symbol character. Indicado por la designación de Unicode "Sc" (símbolo, divisa).Signified by the Unicode designation "Sc" (symbol, currency). El valor es 26.The value is 26.

DashPunctuation 19

Carácter de raya o guión.Dash or hyphen character. Indicado por la designación de Unicode "Pd" (puntuación, raya).Signified by the Unicode designation "Pd" (punctuation, dash). El valor es 19.The value is 19.

DecimalDigitNumber 8

Carácter de dígito decimal, es decir, carácter en el intervalo comprendido entre 0 y 9.Decimal digit character, that is, a character in the range 0 through 9. Indicado por la designación de Unicode "Nd" (número, dígito decimal).Signified by the Unicode designation "Nd" (number, decimal digit). El valor es 8.The value is 8.

EnclosingMark 7

Carácter de marca de cierre, que es un carácter de combinación sin espacio que rodea todos los caracteres anteriores hasta el carácter base incluido.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. Indicado por la designación de Unicode "Me" (marca, cerrar).Signified by the Unicode designation "Me" (mark, enclosing). El valor es 7.The value is 7.

FinalQuotePunctuation 23

Carácter de comilla final o de cierre.Closing or final quotation mark character. Indicado por la designación de Unicode "Pf" (puntuación, comilla final).Signified by the Unicode designation "Pf" (punctuation, final quote). El valor es 23.The value is 23.

Format 15

Carácter de formato que afecta al diseño del texto o la operación de procesos de texto, pero que no se representa normalmente.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. Indicado por la designación de Unicode "Cf" (otro, formato).Signified by the Unicode designation "Cf" (other, format). El valor es 15.The value is 15.

InitialQuotePunctuation 22

Carácter de comilla inicial o de apertura.Opening or initial quotation mark character. Indicado por la designación de Unicode "Pi" (puntuación, comilla inicial).Signified by the Unicode designation "Pi" (punctuation, initial quote). El valor es 22.The value is 22.

LetterNumber 9

Número representado por una letra, en lugar de un dígito decimal; por ejemplo, el número romano de cinco, que es "V".Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". El indicador se especifica mediante la designación de Unicode "Nl" (número, letra).The indicator is signified by the Unicode designation "Nl" (number, letter). El valor es 9.The value is 9.

LineSeparator 12

Carácter que se utiliza para separar líneas de texto.Character that is used to separate lines of text. Indicado por la designación de Unicode "Zl" (separador, línea).Signified by the Unicode designation "Zl" (separator, line). El valor es 12.The value is 12.

LowercaseLetter 1

Letra en minúsculas.Lowercase letter. Indicado por la designación de Unicode "Ll" (letra, minúscula).Signified by the Unicode designation "Ll" (letter, lowercase). El valor es 1.The value is 1.

MathSymbol 25

Carácter de símbolo matemático, como "+" o "=".Mathematical symbol character, such as "+" or "= ". Indicado por la designación de Unicode "Sm" (símbolo, matemático).Signified by the Unicode designation "Sm" (symbol, math). El valor es 25.The value is 25.

ModifierLetter 3

Carácter de letra modificadora, que es un carácter de espacio cualquiera que indica modificaciones de una letra anterior.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. Indicado por la designación de Unicode "Lm" (letra, modificador).Signified by the Unicode designation "Lm" (letter, modifier). El valor es 3.The value is 3.

ModifierSymbol 27

Carácter de símbolo modificador, que especifica las modificaciones de los caracteres circundantes.Modifier symbol character, which indicates modifications of surrounding characters. Por ejemplo, la barra diagonal de fracción indica que el número a la izquierda es el numerador y el número a la derecha, el denominador.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. El indicador se especifica mediante la designación de Unicode "Sk" (símbolo, modificador).The indicator is signified by the Unicode designation "Sk" (symbol, modifier). El valor es 27.The value is 27.

NonSpacingMark 5

Carácter que no es un espacio que indica modificaciones de un carácter base.Nonspacing character that indicates modifications of a base character. Indicado por la designación de Unicode "Mn" (marca, sin espacios).Signified by the Unicode designation "Mn" (mark, nonspacing). El valor es 5.The value is 5.

OpenPunctuation 20

Carácter de apertura de uno de los signos de puntuación dobles, como paréntesis, corchetes y llaves.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. Indicado por la designación de Unicode "Ps" (puntuación, abrir).Signified by the Unicode designation "Ps" (punctuation, open). El valor es 20.The value is 20.

OtherLetter 4

Letra que no es una letra mayúscula, una letra minúscula, una letra de título o una letra modificadora.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. Indicado por la designación de Unicode "Lo" (letra, otra).Signified by the Unicode designation "Lo" (letter, other). El valor es 4.The value is 4.

OtherNotAssigned 29

Carácter que no está asignado a ninguna categoría Unicode.Character that is not assigned to any Unicode category. Indicado por la designación de Unicode "Cn" (otro, no asignado).Signified by the Unicode designation "Cn" (other, not assigned). El valor es 29.The value is 29.

OtherNumber 10

Número que no es un dígito decimal ni un número de letra, por ejemplo, la fracción 1/2.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. El indicador se especifica mediante la designación de Unicode "No" (número, otro).The indicator is signified by the Unicode designation "No" (number, other). El valor es 10.The value is 10.

OtherPunctuation 24

Carácter de signo de puntuación que no es un conector, una raya, un signo de puntuación de apertura, un signo de puntuación de cierre, una comilla inicial o una comilla final.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. Indicado por la designación de Unicode "Po" (puntuación, otro).Signified by the Unicode designation "Po" (punctuation, other). El valor es 24.The value is 24.

OtherSymbol 28

Carácter de símbolo que no es un símbolo matemático, un símbolo de divisa o un símbolo modificador.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. Indicado por la designación de Unicode "So" (símbolo, otro).Signified by the Unicode designation "So" (symbol, other). El valor es 28.The value is 28.

ParagraphSeparator 13

Carácter utilizado para separar párrafos.Character used to separate paragraphs. Indicado por la designación de Unicode "Zp" (separador, párrafo).Signified by the Unicode designation "Zp" (separator, paragraph). El valor es 13.The value is 13.

PrivateUse 17

Carácter de uso privado, con un valor Unicode en el intervalo comprendido entre U+E000 y U+F8FF.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. Indicado por la designación de Unicode "Co" (otro, uso privado).Signified by the Unicode designation "Co" (other, private use). El valor es 17.The value is 17.

SpaceSeparator 11

Carácter de espacio, que no tiene glifo pero no es un carácter de formato o control.Space character, which has no glyph but is not a control or format character. Indicado por la designación de Unicode "Zs" (separador, espacio).Signified by the Unicode designation "Zs" (separator, space). El valor es 11.The value is 11.

SpacingCombiningMark 6

Carácter de espacio que indica modificaciones de un carácter base y afecta al ancho del glifo para ese carácter base.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. Indicado por la designación de Unicode "Mc" (marca, espacio combinable).Signified by the Unicode designation "Mc" (mark, spacing combining). El valor es 6.The value is 6.

Surrogate 16

Carácter de suplente bajo o suplente alto.High surrogate or a low surrogate character. Los valores de códigos de suplente están comprendidos en el intervalo de U+D800 a U+DFFF.Surrogate code values are in the range U+D800 through U+DFFF. Indicado por la designación de Unicode "Cs" (otro, suplente).Signified by the Unicode designation "Cs" (other, surrogate). El valor es 16.The value is 16.

TitlecaseLetter 2

Letra de título.Titlecase letter. Indicado por la designación de Unicode "Lt" (letra, título).Signified by the Unicode designation "Lt" (letter, titlecase). El valor es 2.The value is 2.

UppercaseLetter 0

Letra en mayúsculas.Uppercase letter. Indicado por la designación de Unicode "Lu" (letra, mayúscula).Signified by the Unicode designation "Lu" (letter, uppercase). El valor es 0.The value is 0.

Ejemplos

En el ejemplo siguiente se muestran los caracteres y sus puntos de código correspondientes para los caracteres de la categoría UppercaseLetter.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. Puede modificar el ejemplo para mostrar las letras de cualquier otra categoría reemplazando UppercaseLetter por la categoría que le interese en la asignación a la category variable.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. Tenga en cuenta que la salida de algunas categorías puede ser extensa.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

Comentarios

Los UnicodeCategory métodosChar.GetUnicodeCategory y devuelvenunmiembrodeCharUnicodeInfo.GetUnicodeCategory la enumeración.A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. La UnicodeCategory enumeración también se utiliza para Char admitir métodos, IsUpper(Char)como.The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). Estos métodos determinan si un carácter especificado es un miembro de una categoría general de Unicode determinada.Such methods determine whether a specified character is a member of a particular Unicode general category. Una categoría general de Unicode define la clasificación amplia de un carácter, es decir, designación como un tipo de letra, dígito decimal, separador, símbolo matemático, puntuación, etc.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

Esta enumeración se basa en el estándar Unicode, versión 5,0.This enumeration is based on The Unicode Standard, version 5.0. Para obtener más información, consulte las secciones sobre el "formato de archivo UCD" y los "valores de categorías generales" en la base de datos de caracteres Unicode.For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

El estándar Unicode define lo siguiente:The Unicode Standard defines the following:

Un par suplente es una representación de caracteres codificados para un único carácter abstracto que consta de una secuencia de dos unidades de código, donde la primera unidad del par es un suplente alto y la segunda es un suplente bajo.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. Un suplente alto es un punto de código Unicode en el intervalo de U + D800 a U + DBFF y un suplente bajo es un punto de código Unicode en el intervalo de U + DC00 a U + DFFF.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

Una secuencia de caracteres de combinación es una combinación de un carácter base y uno o más caracteres combinados.A combining character sequence is a combination of a base character and one or more combining characters. Un par suplente representa un carácter base o un carácter de combinación.A surrogate pair represents a base character or a combining character. Un carácter de combinación es espaciado o no espaciado.A combining character is either spacing or nonspacing. Un carácter de combinación de espaciado ocupa una posición de espaciado por sí misma cuando se representa, mientras que un carácter de combinación sin espaciado no lo hace.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. Los signos diacríticos son un ejemplo de caracteres de combinación que no tienen espacios.Diacritics are an example of nonspacing combining characters.

Una letra modificadora es un carácter de espaciado libre que, como un carácter de combinación, indica modificaciones de una letra anterior.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

Una marca de cierre es un carácter de combinación de no espaciado que rodea todos los caracteres anteriores hasta el carácter base incluido.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

Un carácter de formato es un carácter que normalmente no se representa, pero que afecta al diseño de texto o a la operación de procesos de texto.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

El estándar Unicode define varias variaciones en algunos signos de puntuación.The Unicode Standard defines several variations to some punctuation marks. Por ejemplo, un guión puede ser uno de varios valores de código que representan un guion, como U + 002D (guion-menos) o U + 00AD (guion flexible) o U + 2010 (guión) o U + 2011 (guion de no separación).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). Lo mismo se aplica a los guiones, caracteres de espacio y Comillas.The same is true for dashes, space characters, and quotation marks.

El estándar Unicode también asigna códigos a representaciones de dígitos decimales que son específicos de un script o un lenguaje determinados, por ejemplo U + 0030 (dígito cero) y U + 0660 (dígitos árabe-hindú cero).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

Se aplica a

Consulte también: