NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definicja

Definiuje typ normalizacji do wykonania.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Dziedziczenie
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Atrybuty

Pola

FormC FormC FormC FormC 1

Wskazuje, że ciąg Unicode jest znormalizowany przy użyciu pełnej dekompozycji kanonicznej, a następnie zastępuje sekwencje przy użyciu ich podstawowych elementów złożonych, jeśli jest to możliwe.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Wskazuje, że ciąg Unicode jest znormalizowany przy użyciu pełnego dekompozycji kanonicznej.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Wskazuje, że ciąg Unicode jest znormalizowany przy użyciu pełnej dekompozycji zgodności, a następnie Zastępowanie sekwencji z ich podstawowymi kompozytami, jeśli jest to możliwe.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Wskazuje, że ciąg Unicode jest znormalizowany przy użyciu pełnej dekompozycji zgodności.Indicates that a Unicode string is normalized using full compatibility decomposition.

Uwagi

Niektóre sekwencje Unicode są uważane za równoważne, ponieważ reprezentują ten sam znak.Some Unicode sequences are considered equivalent because they represent the same character. Na przykład następujące są uważane za równoważne, ponieważ każdy z nich może służyć do reprezentowania "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Jednakże liczby porządkowe, czyli binarne, porównania uwzględniają te sekwencje różne, ponieważ zawierają różne wartości kodu Unicode.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Przed przeprowadzeniem porównania liczb porządkowych aplikacje muszą znormalizować te ciągi, aby rozłożyć je na podstawowe składniki.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Każdy złożony znak Unicode jest mapowany na bardziej podstawową sekwencję jednego lub więcej znaków.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Proces dekompozycji zastępuje znaki złożone w ciągu ciągiem zawierającym bardziej podstawowe mapowania.The process of decomposition replaces composite characters in a string with their more basic mappings. Pełna dekompozycja cyklicznie wykonuje tę wymianę do momentu, gdy żaden ze znaków w ciągu nie może być bardziej rozłożony.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Unicode definiuje dwa typy dekompozycji: dekompozycji zgodności i dekompozycji kanonicznej.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. W przypadku dekompozycji zgodności informacje o formatowaniu mogą zostać utracone.In compatibility decomposition, formatting information might be lost. W przypadku dekompozycji kanonicznej, która jest podzbiorem dekompozycji zgodności, informacje o formatowaniu są zachowywane.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Dwa zestawy znaków są traktowane jako mające równoważność kanoniczną, jeśli ich pełne rozkłady kanoniczne są identyczne.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Podobnie dwa zestawy znaków są uważane za równoważne zgodności, jeśli ich pełne rozkłady zgodności są identyczne.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Aby uzyskać więcej informacji na temat normalizacji, dekompozycji i równoważności, Zobacz artykuł standardowy Unicode #15: Formularze normalizacji Unicode w Unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Dotyczy

Zobacz też