NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definição

Define o tipo de normalização a executar.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Herança
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Atributos

Campos

FormC FormC FormC FormC 1

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição canônica completa, seguida da substituição de sequências por seus compostos primários, se possível.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição canônica completa.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição de compatibilidade completa, seguida da substituição de sequências por seus compostos primários, se possível.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Indica que uma cadeia de caracteres Unicode é normalizada usando a decomposição de compatibilidade completa.Indicates that a Unicode string is normalized using full compatibility decomposition.

Comentários

Algumas sequências de Unicode são consideradas equivalentes porque eles representam o mesmo caractere.Some Unicode sequences are considered equivalent because they represent the same character. Por exemplo, os seguintes são considerados equivalentes porque qualquer um deles pode ser usado para representar "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

No entanto, ordinal, ou seja, as comparações binárias, considere essas sequências diferentes porque eles contêm valores diferentes de código Unicode.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Antes de executar comparações ordinais, os aplicativos devem normalizar essas cadeias de caracteres para decompor-los em seus componentes básicos.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Cada caractere Unicode composto é mapeado para uma sequência mais básica de um ou mais caracteres.Each composite Unicode character is mapped to a more basic sequence of one or more characters. O processo de Decomposição substitui caracteres compostos em uma cadeia de caracteres com seus mapeamentos mais básicos.The process of decomposition replaces composite characters in a string with their more basic mappings. Um total de Decomposição recursivamente executa essa substituição até que nenhum dos caracteres na cadeia de caracteres pode ser decomposta ainda mais.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

O Unicode define dois tipos de decompositions: a decomposição de compatibilidade e a decomposição canônica.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. Em Decomposição de compatibilidade, as informações de formatação podem ser perdidas.In compatibility decomposition, formatting information might be lost. A decomposição canônica, que é um subconjunto de Decomposição de compatibilidade, as informações de formatação é preservada.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Dois conjuntos de caracteres são considerados como tendo equivalência canônica se seus decompositions canônicas completa são idênticos.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Da mesma forma, os dois conjuntos de caracteres são considerados como tendo equivalência de compatibilidade, se seus decompositions compatibilidade total são idênticos.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Para obter mais informações sobre a normalização, decompositions e equivalência, consulte Unicode Standard Annex #15: Formulários de normalização Unicode no site unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Aplica-se a

Veja também