NormalizationForm Enumeration

Definition

Definiert den Typ der auszuführenden Normalisierung.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Vererbung
NormalizationForm
Attribute

Felder

FormC 1

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD 2

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC 5

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD 6

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde.Indicates that a Unicode string is normalized using full compatibility decomposition.

Hinweise

Einige Unicode-Sequenzen gelten als gleichwertig, da Sie das gleiche Zeichen darstellen.Some Unicode sequences are considered equivalent because they represent the same character. Beispielsweise werden die folgenden Punkte als gleichwertig betrachtet, da diese zur Darstellung von "ắ" verwendet werden können:For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Bei einer Ordinalzahl, bei der es sich um binäre Vergleiche handelt, werden diese Sequenzen jedoch anders betrachtet, da Sie unterschiedliche Unicode-Codewerte enthalten.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Vor der Durchführung von ordinalvergleichen müssen Anwendungen diese Zeichen folgen normalisieren, um Sie in Ihre Grundkomponenten zu zerlegen.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Jedes zusammengesetzte Unicode-Zeichen wird einer grundlegenden Sequenz von einem oder mehreren Zeichen zugeordnet.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Der Prozess der Zerlegung ersetzt zusammengesetzte Zeichen in einer Zeichenfolge durch ihre grundlegenden Zuordnungen.The process of decomposition replaces composite characters in a string with their more basic mappings. Eine vollständige Zerlegung führt diese Ersetzung rekursiv aus, bis keines der Zeichen in der Zeichenfolge weiter zerlegt werden kann.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Unicode definiert zwei Typen von Dekomposition: Kompatibilitäts Zerlegung und kanonische Zerlegung.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. Bei der Kompatibilitäts Zerlegung können Formatierungsinformationen verloren gehen.In compatibility decomposition, formatting information might be lost. Bei kanonischer Zerlegung, bei der es sich um eine Teilmenge der Kompatibilitäts Zerlegung handelt, werden FormatierungsinformationenIn canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Zwei Zeichensätze gelten als kanonische Äquivalenz, wenn Ihre vollständigen kanonischen aufkompositionen identisch sind.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Ebenso werden zwei Zeichensätze als Kompatibilitäts Äquivalenz betrachtet, wenn Ihre vollständigen Kompatibilitäts Dekomposition identisch sind.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Weitere Informationen zu Normalisierung, Dekomposition und Äquivalenz finden Sie unter Unicode-Standard Anhang #15: Unicode-normalisierungs Formulare unter Unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Gilt für:

Siehe auch