NormalizationForm 열거형

정의

수행할 정규화 형식을 정의합니다.Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
상속
NormalizationForm
특성

필드

FormC 1

유니코드 문자열이 완전한 정식 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD 2

유니코드 문자열이 완전한 정식 분해를 사용하여 정규화됨을 나타냅니다.Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC 5

유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD 6

유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화됨을 나타냅니다.Indicates that a Unicode string is normalized using full compatibility decomposition.

설명

일부 유니코드 시퀀스 같은 문자를 나타내므로 동일한으로 간주 됩니다.Some Unicode sequences are considered equivalent because they represent the same character. 예를 들어, 다음 동일 하다 고 간주 하므로 "ắ"을 나타내는 데 사용할 수 있습니다 이러한 합니다.For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

그러나 서 수, 즉, 이진 비교 고려해 이러한 시퀀스 다른 다양 한 유니코드 코드 값을 포함 하기 때문에 합니다.However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. 서 수 비교를 수행 하기 전에 애플리케이션 기본 구성 요소로 분해 이러한 문자열을 정규화 해야 합니다.Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

각 복합 유니코드 문자는 하나 이상의 문자 시퀀스 보다 기본적인에 매핑됩니다.Each composite Unicode character is mapped to a more basic sequence of one or more characters. 분해 프로세스 보다 기본적인 매핑과 사용 하 여 문자열의 복합 문자를 바꿉니다.The process of decomposition replaces composite characters in a string with their more basic mappings. 전체 분해를 재귀적으로 추가 분리할 수 있는 문자열에 문자가 없을 때까지이 교체를 수행 합니다.A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

유니코드 분해의 두 가지 형식을 정의 합니다: 호환성 분해 및 정식 분해 합니다.Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. 호환성 분해에 형식 정보가 손실 될 수 있습니다.In compatibility decomposition, formatting information might be lost. 호환성 분해의 하위 집합인 정식 분해에 형식 정보가 유지 됩니다.In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

두 문자 집합은 완전 한 정식 분해가 동일한 경우 정식 동등으로 간주 됩니다.Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. 마찬가지로, 두 문자 집합은 완전 한 호환성 분해가 동일한 경우 호환성 동등성 간주 됩니다.Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

정규화, decompositions 및 동급 에 대 한 자세한 내용은 유니코드 표준 부록 #15: Unicode.org의 유니코드 정규화 형식입니다.For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

적용 대상

추가 정보