NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Definition

Definiert den Typ der auszuführenden Normalisierung.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Vererbung
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Attribute

Felder

FormC FormC FormC FormC 1

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde.Indicates that a Unicode string is normalized using full compatibility decomposition.

Hinweise

Einige Unicode-Zeichenfolgen werden als gleichbedeutend angesehen, da sie auf das gleiche Zeichen darstellen.Some Unicode sequences are considered equivalent because they represent the same character. Beispielsweise werden im folgenden als identisch angesehen, da diese verwendet werden kann, um "ắ" darzustellen:For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Ordinal, d. h. binäre Vergleiche sollten aber diese Sequenzen andere, da sie unterschiedliche Werte von Unicode-Code enthalten.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Vor dem Ausführen von Ordinalvergleiche, müssen Anwendungen diese Zeichenfolgen werden in die grundlegenden Komponenten zerlegt normalisieren.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Jedes zusammengesetztes Unicode-Zeichen wird eine etwas einfachere Sequenz von ein oder mehrere Zeichen zugeordnet.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Der Zerlegung ersetzt zusammengesetzter Zeichen in einer Zeichenfolge durch ihre grundlegenden Zuordnungen.The process of decomposition replaces composite characters in a string with their more basic mappings. Eine vollständige Zerlegung rekursiv führt diese Ersetzung bis keines der Zeichen in der Zeichenfolge weiter zerlegt werden kann.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Unicode definiert zwei Typen von Decompositions: kompatibler Zerlegung und kanonischer Zerlegung.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. In kompatibler Zerlegung möglicherweise Informationen über die Formatierung verloren.In compatibility decomposition, formatting information might be lost. In kanonischer Zerlegung, der eine Teilmenge der kompatibler Zerlegung ist, werden die Informationen zur Formatierung beibehalten.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Zwei Sätze von Zeichen werden als kanonische Übereinstimmung aufweisen, wenn deren vollständiger kanonischer Zerlegung identisch sind.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Ebenso werden zwei Sätze von Zeichen als Kompatibilität Äquivalenz aufweisen, wenn ihre vollständiger kompatibler Zerlegung identisch sind.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Weitere Informationen zur Normalisierung, Zerlegung und Äquivalenz finden Sie unter Unicode Standard Annex #15: Unicode-Normalisierungsformen unter unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Gilt für:

Siehe auch