NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definice

Definuje typ normalizace, který má být proveden.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Dědičnost
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Atributy

Pole

FormC FormC FormC FormC 1

Označuje, že řetězec Unicode je normalizován pomocí úplného kanonického rozkladu následovaným nahrazením sekvencí jejich primárními složenými poli, pokud je to možné.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Označuje, že řetězec Unicode je normalizován pomocí úplného kanonického rozkladu.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Označuje, že řetězec Unicode je normalizován pomocí úplného rozkladu kompatibility následovaný náhradou sekvencí se svými primárními složenými možnostmi, pokud je to možné.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Označuje, že řetězec Unicode je normalizován pomocí úplného rozkladu kompatibility.Indicates that a Unicode string is normalized using full compatibility decomposition.

Poznámky

Některé posloupnosti Unicode jsou považovány za ekvivalentní, protože představují stejný znak.Some Unicode sequences are considered equivalent because they represent the same character. Například následující jsou považovány za ekvivalentní, protože kterýkoli z nich lze použít k reprezentaci "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Pořadové číslo, to znamená, binární, porovnání považuje tyto sekvence za odlišné, protože obsahují různé hodnoty kódu Unicode.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Před prováděním řadových porovnání musí aplikace tyto řetězce normalizovat, aby je bylo možné rozložit na své základní komponenty.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Každý složený znak Unicode je namapován na více základních sekvencí jednoho nebo více znaků.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Proces rozkladu nahradí složené znaky v řetězci s jejich obecnější mapováními.The process of decomposition replaces composite characters in a string with their more basic mappings. Úplné rozklad rekurzivně provádí tuto náhradu, dokud žádný ze znaků v řetězci nelze dále rozložit.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Kódování Unicode definuje dva typy rozkladů: rozklad kompatibility a kanonické rozklady.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. V případě rozkladu kompatibility může dojít ke ztrátě informací o formátování.In compatibility decomposition, formatting information might be lost. V kanonickém rozkladu, který je podmnožinou rozkladu kompatibility, jsou zachovány informace o formátování.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Dvě sady znaků jsou považovány za kanonický ekvivalent, pokud jsou jejich úplná kanonická rozklady identické.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Podobně se dvě sady znaků považují za, že mají rovnocennost kompatibility, pokud jejich úplné rozklady kompatibility jsou identické.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Další informace o normalizaci, rozkladech a rovnocennosti najdete v příloze Standard Unicode #15: Normalizační formuláře Unicode na Unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Platí pro

Viz také