NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definição

Define o tipo de normalização a executar.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Herança
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Atributos

Campos

FormC FormC FormC FormC 1

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição canônica completa, seguida da substituição de sequências por seus compostos primários, se possível.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição canônica completa.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição de compatibilidade completa, seguida da substituição de sequências por seus compostos primários, se possível.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição de compatibilidade completa.Indicates that a Unicode string is normalized using full compatibility decomposition.

Comentários

Algumas sequências Unicode são consideradas equivalentes porque representam o mesmo caractere.Some Unicode sequences are considered equivalent because they represent the same character. Por exemplo, os itens a seguir são considerados equivalentes porque qualquer um deles pode ser usado para representar "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

No entanto, ordinal, ou seja, binary, comparações consideram essas sequências diferentes porque elas contêm valores de código Unicode diferentes.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Antes de executar comparações ordinais, os aplicativos devem normalizar essas cadeias de caracteres para decompo-las em seus componentes básicos.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Cada caractere Unicode composto é mapeado para uma sequência mais básica de um ou mais caracteres.Each composite Unicode character is mapped to a more basic sequence of one or more characters. O processo de decomposição substitui caracteres compostos em uma cadeia de caracteres por seus mapeamentos mais básicos.The process of decomposition replaces composite characters in a string with their more basic mappings. Uma decomposição completa executa essa substituição recursivamente até que nenhum dos caracteres na cadeia de caracteres possa ser decomposto ainda mais.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

O Unicode define dois tipos de decomposição: decomposição de compatibilidade e decomposição canônico.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. Na decomposição de compatibilidade, as informações de formatação podem ser perdidas.In compatibility decomposition, formatting information might be lost. Na decomposição canônica, que é um subconjunto da decomposição de compatibilidade, as informações de formatação são preservadas.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Dois conjuntos de caracteres são considerados equivalentes canônicos se suas descomposiçãos canônicas completas forem idênticas.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Da mesma forma, dois conjuntos de caracteres serão considerados como equivalências de compatibilidade se suas descomposiçãos de compatibilidade completa forem idênticas.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Para obter mais informações sobre a normalização, as decomposiçãos e a equivalência , consulte #15 do anexo Unicode padrão: Formulários de normalização Unicode em Unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Aplica-se a

Veja também