NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definición

Define el tipo de normalización a realizar.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Herencia
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Atributos

Campos

FormC FormC FormC FormC 1

Indica que una cadena Unicode se normaliza mediante descomposición canónica completa, seguida de la sustitución de secuencias por sus compuestos principales, si es posible.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Indica que una cadena Unicode se normaliza mediante descomposición canónica completa.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Indica que una cadena Unicode se normaliza mediante descomposición de compatibilidad completa, seguida de la sustitución de secuencias por sus compuestos principales, si es posible.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Indica que una cadena Unicode se normaliza mediante descomposición de compatibilidad completa.Indicates that a Unicode string is normalized using full compatibility decomposition.

Comentarios

Algunas secuencias de Unicode se consideran equivalentes porque representan el mismo carácter.Some Unicode sequences are considered equivalent because they represent the same character. Por ejemplo, los siguientes se consideran equivalentes porque cualquiera de ellos puede utilizarse para representar "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Sin embargo, ordinal, es decir, las comparaciones binarias, considere la posibilidad de estas secuencias diferentes porque contienen valores distintos de código Unicode.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Antes de realizar comparaciones ordinales, las aplicaciones deben normalizar estas cadenas para descomponerlas en sus componentes básicos.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Cada carácter Unicode compuesto se asigna a una secuencia más básica de uno o más caracteres.Each composite Unicode character is mapped to a more basic sequence of one or more characters. El proceso de descomposición reemplaza los caracteres compuestos de una cadena con sus asignaciones más básicas.The process of decomposition replaces composite characters in a string with their more basic mappings. Una descomposición completa de forma recursiva realiza esta sustitución hasta que ninguno de los caracteres de la cadena se puede descomponer aún más.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Unicode define dos tipos de descomposición: descomposición de compatibilidad y la descomposición canónica.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. En la descomposición de compatibilidad, información de formato se puede perder.In compatibility decomposition, formatting information might be lost. En la descomposición canónica, que es un subconjunto de descomposición de compatibilidad, se conserva la información de formato.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Dos conjuntos de caracteres se consideran que tienen una equivalencia canónica si sus descomposición canónica completa es idénticos.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Del mismo modo, dos conjuntos de caracteres se consideran que tienen la equivalencia de compatibilidad si sus descomposiciones de compatibilidad completas son idénticas.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Para obtener más información sobre la normalización, descomposiciones y equivalencia, vea Unicode Standard Annex #15: Formas de normalización Unicode en unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Se aplica a

Consulte también: