UnicodeCategory UnicodeCategory UnicodeCategory UnicodeCategory Enum

정의

문자의 유니코드 범주를 정의합니다.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
상속
UnicodeCategoryUnicodeCategoryUnicodeCategoryUnicodeCategory
특성

필드

ClosePunctuation ClosePunctuation ClosePunctuation ClosePunctuation 21

괄호, 대괄호 및 중괄호처럼 쌍을 이루는 문장 부호의 닫는 문자입니다.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. 유니코드 지정 "Pe"(punctuation, close)로 지정됩니다.Signified by the Unicode designation "Pe" (punctuation, close). 값은 21입니다.The value is 21.

ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation ConnectorPunctuation 18

두 문자를 연결하는 연결 문장 부호 문자입니다.Connector punctuation character that connects two characters. 유니코드 지정 "Pc"(punctuation, connector)로 지정됩니다.Signified by the Unicode designation "Pc" (punctuation, connector). 값은 18입니다.The value is 18.

Control Control Control Control 14

유니코드 값이 U+007F이거나 U+0000부터 U+001F까지 또는 U+0080부터 U+009F까지의 범위에 있는 컨트롤 코드 문자입니다.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. 유니코드 지정 "Cc"(other, control)로 지정됩니다.Signified by the Unicode designation "Cc" (other, control). 값은 14입니다.The value is 14.

CurrencySymbol CurrencySymbol CurrencySymbol CurrencySymbol 26

통화 기호 문자입니다.Currency symbol character. 유니코드 지정 "Sc"(symbol, currency)로 지정됩니다.Signified by the Unicode designation "Sc" (symbol, currency). 값은 26입니다.The value is 26.

DashPunctuation DashPunctuation DashPunctuation DashPunctuation 19

대시 또는 하이픈 문자입니다.Dash or hyphen character. 유니코드 지정 "Pd"(punctuation, dash)로 지정됩니다.Signified by the Unicode designation "Pd" (punctuation, dash). 값은 19입니다.The value is 19.

DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber DecimalDigitNumber 8

0부터 9까지의 범위에 있는 10진수 문자입니다.Decimal digit character, that is, a character in the range 0 through 9. 유니코드 지정 "Nd"(number, decimal digit)로 지정됩니다.Signified by the Unicode designation "Nd" (number, decimal digit). 값은 8입니다.The value is 8.

EnclosingMark EnclosingMark EnclosingMark EnclosingMark 7

묶기 표시 문자, 즉 기본 문자를 포함한 모든 이전 문자를 둘러싸는 간격이 없는 조합 문자입니다.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. 유니코드 지정 "Me"(mark, enclosing)로 지정됩니다.Signified by the Unicode designation "Me" (mark, enclosing). 값은 7입니다.The value is 7.

FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation FinalQuotePunctuation 23

닫는 문자 또는 마지막 문장 부호(") 문자입니다.Closing or final quotation mark character. 유니코드 지정 "Pf"(punctuation, final quote)로 지정됩니다.Signified by the Unicode designation "Pf" (punctuation, final quote). 값은 23입니다.The value is 23.

Format Format Format Format 15

대개 렌더링되지 않고 텍스트 레이아웃이나 텍스트 처리 작업에 영향을 주는 서식 문자입니다.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. 유니코드 지정 "Cf"(other, format)로 지정됩니다.Signified by the Unicode designation "Cf" (other, format). 값은 15입니다.The value is 15.

InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation InitialQuotePunctuation 22

여는 문자 또는 시작 문장 부호 문자입니다.Opening or initial quotation mark character. 유니코드 지정 "Pi"(punctuation, initial quote)로 지정됩니다.Signified by the Unicode designation "Pi" (punctuation, initial quote). 값은 22입니다.The value is 22.

LetterNumber LetterNumber LetterNumber LetterNumber 9

5에 해당하는 로마자 "V"와 같이 10진수 대신 문자로 나타내는 숫자입니다.Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". 유니코드 지정 "Nl"(number, letter)로 지정됩니다.The indicator is signified by the Unicode designation "Nl" (number, letter). 값은 9입니다.The value is 9.

LineSeparator LineSeparator LineSeparator LineSeparator 12

텍스트 행을 구분하는 데 사용되는 문자입니다.Character that is used to separate lines of text. 유니코드 지정 "Zl"(separator, line)으로 지정됩니다.Signified by the Unicode designation "Zl" (separator, line). 값은 12입니다.The value is 12.

LowercaseLetter LowercaseLetter LowercaseLetter LowercaseLetter 1

소문자입니다.Lowercase letter. 유니코드 지정 "Ll"(letter, lowercase)로 지정됩니다.Signified by the Unicode designation "Ll" (letter, lowercase). 값은 1입니다.The value is 1.

MathSymbol MathSymbol MathSymbol MathSymbol 25

"+" 또는 "=" 같은 수학 기호 문자입니다.Mathematical symbol character, such as "+" or "= ". 유니코드 지정 "Sm"(symbol, math)으로 지정됩니다.Signified by the Unicode designation "Sm" (symbol, math). 값은 25입니다.The value is 25.

ModifierLetter ModifierLetter ModifierLetter ModifierLetter 3

이전 문자를 제한하는, 간격이 자유로운 문자인 한정자 문자입니다.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. 유니코드 지정 "Lm"(letter, modifier)으로 지정됩니다.Signified by the Unicode designation "Lm" (letter, modifier). 값은 3입니다.The value is 3.

ModifierSymbol ModifierSymbol ModifierSymbol ModifierSymbol 27

주위 문자를 제한하는 한정자 기호 문자입니다.Modifier symbol character, which indicates modifications of surrounding characters. 예를 들어 분수 기호는 이 기호의 왼쪽 숫자가 분자이고, 오른쪽 숫자가 분모임을 나타냅니다.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. 유니코드 지정 "Sk"(symbol, modifier)로 지정됩니다.The indicator is signified by the Unicode designation "Sk" (symbol, modifier). 값은 27입니다.The value is 27.

NonSpacingMark NonSpacingMark NonSpacingMark NonSpacingMark 5

기본 문자를 제한하는 간격이 없는 문자입니다.Nonspacing character that indicates modifications of a base character. 유니코드 지정 "Mn"(mark, nonspacing)으로 지정됩니다.Signified by the Unicode designation "Mn" (mark, nonspacing). 값은 5입니다.The value is 5.

OpenPunctuation OpenPunctuation OpenPunctuation OpenPunctuation 20

괄호, 대괄호 및 중괄호처럼 쌍을 이루는 문장 부호의 여는 문자입니다.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. 유니코드 지정 "Ps"(punctuation, open)로 지정됩니다.Signified by the Unicode designation "Ps" (punctuation, open). 값은 20입니다.The value is 20.

OtherLetter OtherLetter OtherLetter OtherLetter 4

대문자, 소문자, 단어의 첫 글자를 대문자로 하는 문자 또는 한정자 문자가 아닌 문자입니다.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. 유니코드 지정 "Lo"(letter, other)로 지정됩니다.Signified by the Unicode designation "Lo" (letter, other). 값은 4입니다.The value is 4.

OtherNotAssigned OtherNotAssigned OtherNotAssigned OtherNotAssigned 29

어떠한 유니코드 범주에도 할당되지 않은 문자입니다.Character that is not assigned to any Unicode category. 유니코드 지정 "Cn"(other, not assigned)으로 지정됩니다.Signified by the Unicode designation "Cn" (other, not assigned). 값은 29입니다.The value is 29.

OtherNumber OtherNumber OtherNumber OtherNumber 10

10진수나 문자 숫자가 아닌 숫자(예: 분수 1/2)입니다.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. 유니코드 지정 "No"(number, other)로 지정됩니다.The indicator is signified by the Unicode designation "No" (number, other). 값은 10입니다.The value is 10.

OtherPunctuation OtherPunctuation OtherPunctuation OtherPunctuation 24

연결 문장 부호, 대시, 여는 문장 부호, 닫는 문장 부호, 처음 따옴표 또는 마지막 따옴표가 아닌 문장 부호 문자입니다.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. 유니코드 지정 "Po"(punctuation, other)로 지정됩니다.Signified by the Unicode designation "Po" (punctuation, other). 값은 24입니다.The value is 24.

OtherSymbol OtherSymbol OtherSymbol OtherSymbol 28

수학 기호, 통화 기호 또는 한정자 기호가 아닌 기호 문자입니다.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. 유니코드 지정 "So"(symbol, other)로 지정됩니다.Signified by the Unicode designation "So" (symbol, other). 값은 28입니다.The value is 28.

ParagraphSeparator ParagraphSeparator ParagraphSeparator ParagraphSeparator 13

단락을 구분하는 데 사용되는 문자입니다.Character used to separate paragraphs. 유니코드 지정 "Zp"(separator, paragraph)로 지정됩니다.Signified by the Unicode designation "Zp" (separator, paragraph). 값은 13입니다.The value is 13.

PrivateUse PrivateUse PrivateUse PrivateUse 17

유니코드 값이 U+E000부터 U+F8FF까지의 범위에 있는 프라이빗 문자입니다.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. 유니코드 지정 "Co"(other, private use)로 지정됩니다.Signified by the Unicode designation "Co" (other, private use). 값은 17입니다.The value is 17.

SpaceSeparator SpaceSeparator SpaceSeparator SpaceSeparator 11

문자 모양은 없지만 제어 문자나 서식 문자가 아닌 공백 문자입니다.Space character, which has no glyph but is not a control or format character. 유니코드 지정 "Zs"(separator, space)로 지정됩니다.Signified by the Unicode designation "Zs" (separator, space). 값은 11입니다.The value is 11.

SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark SpacingCombiningMark 6

기본 문자를 제한하고 이 기본 문자의 문자 모양 너비에 영향을 주는 간격이 있는 문자입니다.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. 유니코드 지정 "Mc"(mark, spacing combining)로 지정됩니다.Signified by the Unicode designation "Mc" (mark, spacing combining). 값은 6입니다.The value is 6.

Surrogate Surrogate Surrogate Surrogate 16

high surrogate 또는 low surrogate 문자입니다.High surrogate or a low surrogate character. 서로게이트 코드 값은 U+D800부터 U+DFFF까지의 범위에 있습니다.Surrogate code values are in the range U+D800 through U+DFFF. 유니코드 지정 "Cs"(other, surrogate)로 지정됩니다.Signified by the Unicode designation "Cs" (other, surrogate). 값은 16입니다.The value is 16.

TitlecaseLetter TitlecaseLetter TitlecaseLetter TitlecaseLetter 2

제목 스타일 문자입니다.Titlecase letter. 유니코드 지정 "Lt"(letter, titlecase)로 지정됩니다.Signified by the Unicode designation "Lt" (letter, titlecase). 값은 2입니다.The value is 2.

UppercaseLetter UppercaseLetter UppercaseLetter UppercaseLetter 0

대문자입니다.Uppercase letter. 유니코드 지정 "Lu"(letter, uppercase)로 지정됩니다.Signified by the Unicode designation "Lu" (letter, uppercase). 값은 0입니다.The value is 0.

예제

다음 예제에서는 UppercaseLetter 범주의 문자 및 문자에 대 한 해당 코드 포인트를 표시합니다.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. UppercaseLetter 관심을 할당 하는 범주를 사용 하 여 대체 하 여 다른 범주의 문자를 표시 하도록 예제를 수정할 수는 category 변수입니다.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. 참고 일부 범주에 대 한 출력 확장이 가능 합니다.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

설명

멤버는 UnicodeCategory 열거형에서 반환 되는 Char.GetUnicodeCategoryCharUnicodeInfo.GetUnicodeCategory 메서드.A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. UnicodeCategory 열거형을 지 원하는 데 수도 Char 메서드를 같은 IsUpper(Char).The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). 이러한 메서드는 지정 된 문자 특정 유니코드 일반 범주의 구성원 인지 확인 합니다.Such methods determine whether a specified character is a member of a particular Unicode general category. 유니코드 일반 범주 문자의 문자, 10 진수 숫자, 구분 기호, 수학 기호, 문장 부호, 및 등의 형식으로 지정, 광범위 한 분류를 정의합니다.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

이 열거형은 유니코드 표준, 버전 5.0 기반으로 합니다.This enumeration is based on The Unicode Standard, version 5.0. 자세한 내용은 유니코드 문자 데이터베이스의 하위 항목인 "UCD 파일 형식"과 "일반 범주 값"을 참조하세요.For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

유니코드 표준은 다음을 정의합니다.The Unicode Standard defines the following:

서로게이트 쌍에는 여기서 첫 번째 단위 쌍의 high surrogate 인지 하 고 두 번째 하위 서로게이트는 두 명의 코드 단위 시퀀스를 구성 하는 단일 추상 문자에 대 한 코드 문자 표현입니다.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. High surrogate u+d800부터 U + DBFF 까지의 범위에 유니코드 코드 포인트를 이며 하위 서로게이트 u+dc00부터 U + DFFF 까지의 범위에는 유니코드 코드 포인트입니다.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

문자 시퀀스를 결합 하는 기본 문자와 조합 문자를 하나 이상의 조합입니다.A combining character sequence is a combination of a base character and one or more combining characters. 서로게이트 쌍을 기본 문자 또는 조합 문자를 나타냅니다.A surrogate pair represents a base character or a combining character. 조합 문자 간격이 있거나 없을 경우합니다A combining character is either spacing or nonspacing. 간격 문자를 결합 하는 반면 않습니다 간격이 없는 조합 문자를 렌더링할 때 자체적으로 간격 위치를 차지 합니다.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. 분음 부호 간격이 없는 조합 문자 예가 됩니다.Diacritics are an example of nonspacing combining characters.

한정자 문자에는 조합 문자를 같은 선행 문자의 수정을 나타내는 독립형 간격 문자입니다.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

바깥쪽 표시가 간격이 없는 조합 문자는 모든 이전 문자를 둘러싸는 및 기본 문자를 포함 합니다.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

문자 형식에는 문자는은 일반적으로 렌더링 되지 않지만 텍스트 레이아웃 또는 텍스트 처리 작업에 미치는 영향입니다.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

유니코드 표준의 일부 문장 부호를 여러 가지를 정의합니다.The Unicode Standard defines several variations to some punctuation marks. 예를 들어, 하이픈, U + 00ad (하이픈-빼기) 등 U + 00AD 하이픈을 나타내는 몇 가지 코드 값 중 하나일 수 있습니다 (사용자 지정 하이픈) 또는 U + 2010 (하이픈) 또는 U + 2011 (줄 바꿈하지 않는 하이픈).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). 대시, 공백 문자 및 따옴표도 마찬가지입니다.The same is true for dashes, space characters, and quotation marks.

유니코드 표준 표현에 관련 된 특정 스크립트나 언어에서 예를 들어, U + 0030 (숫자 0) 소수 자릿수도 코드를 할당 하 고 U + 0660 (아랍어-인도어 식 소수 자릿수 0).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

적용 대상

추가 정보