NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Определение

Определяет тип выполняемой нормализации.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Наследование
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Атрибуты

Поля

FormC FormC FormC FormC 1

Указывает на то, что строка Юникода нормализуется с использованием полной канонической декомпозиции, после чего по возможности следует замена последовательностей их первичными составляющими.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Указывает на то, что строка Юникода нормализуется с использованием полной канонической декомпозиции.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Указывает на то, что строка Юникода нормализуется с использованием полной декомпозиции совместимости, после чего по возможности следует замена последовательностей их первичными составляющими.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Указывает на то, что строка Юникода нормализуется с использованием полной декомпозиции совместимости.Indicates that a Unicode string is normalized using full compatibility decomposition.

Комментарии

Некоторые последовательности Юникода считаются эквивалентными, так как они представляют один и тот же символ.Some Unicode sequences are considered equivalent because they represent the same character. Например, следующие данные считаются эквивалентными, так как их можно использовать для представления "ắ":For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Однако порядковый номер, т. е. двоичный, сравнения, рассматривайте эти последовательности различными способами, так как они содержат различные значения кода Юникода.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Перед выполнением порядковых сравнений в приложениях необходимо нормализовать эти строки, чтобы разбить их на основные компоненты.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Каждый составной символ Юникода сопоставляется с более базовой последовательностью из одного или нескольких символов.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Процесс декомпозиции заменяет составные символы в строке более базовыми сопоставлениями.The process of decomposition replaces composite characters in a string with their more basic mappings. Полная декомпозиция рекурсивно выполняет эту замену, пока ни один из символов в строке не может быть разложен дальше.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

В Юникоде определены два типа декомпозиций: декомпозиция совместимости и каноническая декомпозиция.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. При декомпозиции совместимости сведения о форматировании могут быть потеряны.In compatibility decomposition, formatting information might be lost. В канонической декомпозиции, которая является подмножеством декомпозиции совместимости, сохраняются сведения о форматировании.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Считается, что два набора символов имеют каноническую эквивалентность, если их полные канонические декомпозиции идентичны.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Аналогично, два набора символов считаются эквивалентными, если их полная декомпозиция совместимости идентична.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Дополнительные сведения об нормализации, декомпозициях и эквивалентности см. в разделе #15 стандартного стандарта Юникода: Формы нормализации Юникода по адресу Unicode.org.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Применяется к

Дополнительно