NormalizationForm NormalizationForm NormalizationForm NormalizationForm Enum

定義

実行する正規化の種類を定義します。Defines the type of normalization to perform.

public enum class NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
Public Enum NormalizationForm
継承
NormalizationFormNormalizationFormNormalizationFormNormalizationForm
属性

フィールド

FormC FormC FormC FormC 1

完全標準分解を使用して Unicode 文字列を正規化した後、可能な場合は、シーケンスを主要な複合文字で置換することを示します。Indicates that a Unicode string is normalized using full canonical decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormD FormD FormD FormD 2

完全標準分解を使用して Unicode 文字列を正規化したことを示します。Indicates that a Unicode string is normalized using full canonical decomposition.

FormKC FormKC FormKC FormKC 5

完全互換性分解を使用して Unicode 文字列を正規化した後、可能な場合は、シーケンスを主要な複合文字で置換することを示します。Indicates that a Unicode string is normalized using full compatibility decomposition, followed by the replacement of sequences with their primary composites, if possible.

FormKD FormKD FormKD FormKD 6

完全互換性分解を使用して Unicode 文字列を正規化したことを示します。Indicates that a Unicode string is normalized using full compatibility decomposition.

注釈

一部の Unicode シーケンスは同じ文字を表しているため、同等と見なされます。Some Unicode sequences are considered equivalent because they represent the same character. たとえば、次のような場合は、これらのいずれかを使用して "ắ" を表すことができるため、同等と見なされます。For example, the following are considered equivalent because any of these can be used to represent "ắ":

  • "\u1EAF""\u1EAF"

  • "\u0103\u0301""\u0103\u0301"

  • "\u0061\u0306\u0301""\u0061\u0306\u0301"

ただし、序数、つまりバイナリ、比較では、これらのシーケンスが異なるため、異なる Unicode コード値が含まれていることが考慮されます。However, ordinal, that is, binary, comparisons consider these sequences different because they contain different Unicode code values. 序数による比較を実行する前に、アプリケーションはこれらの文字列を正規化して、それらを基本コンポーネントに分解する必要があります。Before performing ordinal comparisons, applications must normalize these strings to decompose them into their basic components.

各複合 Unicode 文字は、より基本的な1つ以上の文字のシーケンスにマップされます。Each composite Unicode character is mapped to a more basic sequence of one or more characters. 分解プロセスでは、文字列内の複合文字がより基本的なマッピングに置き換えられます。The process of decomposition replaces composite characters in a string with their more basic mappings. 完全な分解では、文字列内の文字がそれ以上分解されない限り、この置換を再帰的に実行します。A full decomposition recursively performs this replacement until none of the characters in the string can be decomposed further.

Unicode では、互換性分解と標準分解の2種類の decompositions が定義されています。Unicode defines two types of decompositions: compatibility decomposition and canonical decomposition. 互換性分解では、書式設定情報が失われる可能性があります。In compatibility decomposition, formatting information might be lost. 互換性分解のサブセットである標準分解では、書式設定情報が保持されます。In canonical decomposition, which is a subset of compatibility decomposition, formatting information is preserved.

正規の完全な decompositions が同一である場合、2つの文字セットが正規の等価性を持つと見なされます。Two sets of characters are considered to have canonical equivalence if their full canonical decompositions are identical. 同様に、完全な互換性の decompositions が同一である場合、2つの文字セットが互換性の等価性を持つと見なされます。Likewise, two sets of characters are considered to have compatibility equivalence if their full compatibility decompositions are identical.

正規化、decompositions、および等価性の詳細については、次を参照してください。 #15 Unicode 標準の付属品です。Unicode.org での Unicode 正規化形式。For more information about normalization, decompositions and equivalence, see Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org.

適用対象

こちらもご覧ください