NormalizationForm Enumeration
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Definiert den Typ der auszuführenden Normalisierung.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Vererbung
- Attribute
Felder
| FormC | 1 | Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden. |
| FormD | 2 | Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kanonischer Zerlegung normalisiert wurde. |
| FormKC | 5 | Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde und dass danach die Sequenzen, sofern möglich, durch ihre primären kombinierenden Zeichen ersetzt wurden. |
| FormKD | 6 | Gibt an, dass eine Unicode-Zeichenfolge per vollständiger kompatibler Zerlegung normalisiert wurde. |
Hinweise
Einige Unicode-Sequenzen werden als gleichwertig angesehen, da sie das gleiche Zeichen darstellen. Beispielsweise werden die folgenden als gleichwertig angesehen, da eine dieser Elemente verwendet werden kann, um "ắ" darzustellen:
"\u1EAF"
"\u0103\u0301"
"\u0061\u0306\u0301"
Aber ordinal, das heißt binär, betrachten diese Sequenzen anders, da sie unterschiedliche Unicode-Codewerte enthalten. Bevor Sie Ordinalvergleiche ausführen, müssen Anwendungen diese Zeichenfolgen normalisieren, um sie in ihre grundlegenden Komponenten zu zersetzen.
Jedes zusammengesetzte Unicode-Zeichen wird einer grundlegenden Sequenz eines oder mehrerer Zeichen zugeordnet. Der Prozess der Zerlegung ersetzt zusammengesetzte Zeichen in einer Zeichenfolge durch ihre grundlegenden Zuordnungen. Eine vollständige Dekomposition führt diese Ersetzung rekursiv aus, bis keine der Zeichen in der Zeichenfolge weiter komposiert werden kann.
Unicode definiert zwei Arten von Zerlegungen: Kompatibilitätskomposition und kanonische Dekomposition. Bei der Kompatibilitätskomkomposition gehen möglicherweise Formatierungsinformationen verloren. In der kanonischen Dekomposition, die eine Teilmenge der Kompatibilitätskomkomposition ist, werden Formatierungsinformationen beibehalten.
Zwei Zeichensätze gelten als kanonische Gleichwertigkeit, wenn ihre vollständigen kanonischen Dekompositionen identisch sind. Ebenso werden zwei Zeichensätze als Kompatibilitätsäquivalent betrachtet, wenn ihre vollständige Kompatibilitätskomposition identisch ist.
Weitere Informationen zur Normalisierung, Dekomposition und Gleichwertigkeit finden Sie im Unicode-Standard-Anhang #15: Unicode-Normalisierungsformulare bei unicode.org.