NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

Определение

Определяет тип выполняемой нормализации.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
Наследование
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
Атрибуты

Поля

FormC FormC FormC FormC 1

Указывает на то, что строка Юникода нормализуется с использованием полной канонической декомпозиции, после чего по возможности следует замена последовательностей их первичными составляющими.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

Указывает на то, что строка Юникода нормализуется с использованием полной канонической декомпозиции.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

Указывает на то, что строка Юникода нормализуется с использованием полной декомпозиции совместимости, после чего по возможности следует замена последовательностей их первичными составляющими.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

Указывает на то, что строка Юникода нормализуется с использованием полной декомпозиции совместимости.Indicates that a Unicode string is normalized using full compatibility decomposition.

Комментарии

Некоторые последовательности Юникода считаются эквивалентными, так как они представляют тот же символ.Some Unicode sequences are considered equivalent because they represent the same character. Например ниже считаются эквивалентными, так как любой из них может использоваться для представления символа «ắ»:For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • «\u1EAF»"\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

Тем не менее порядковый номер, то есть двоичных данных, сравнения рассмотрим эти последовательности различных так как они содержат различные кодовые значения Юникода.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. Прежде чем выполнять порядковые сравнения, приложения следует нормализовать эти строки, чтобы разбить их на базовые компоненты.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

Каждый составной символ Юникода сопоставляется с базовой последовательностью из одного или нескольких символов.Each composite Unicode character is mapped to a more basic sequence of one or more characters. Процесс декомпозиции заменяет составные символы в строке с их базовыми соответствиями.The process of decomposition replaces composite characters in a string with their more basic mappings. Такая замена выполняется рекурсивно полной декомпозиции, пока ни один из символов в строке может быть разделен Далее.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Юникод определяет два типа декомпозиции: декомпозиции совместимости и канонической декомпозиции.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. В декомпозиции совместимости сведения о форматировании могут быть потеряны.In compatibility decomposition, formatting information might be lost. В канонической декомпозиции, которая является подмножеством декомпозиции совместимости, сведения о форматировании сохраняется.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

Два набора символов, считаются канонически если совпадают их полной канонической декомпозиции.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. Аналогичным образом два набора символов, считаются эквивалентными по совместимости если совпадают их полные декомпозиции совместимости.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

Дополнительные сведения о нормализации, декомпозиции и эквивалентности, см. в разделе Unicode Standard Annex #15: Формы нормализации Юникода кодовые.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

Применяется к

Дополнительно