UnicodeCategory 열거형

정의

문자의 유니코드 범주를 정의합니다.Defines the Unicode category of a character.

public enum class UnicodeCategory
[System.Runtime.InteropServices.ComVisible(true)]
[System.Serializable]
public enum UnicodeCategory
type UnicodeCategory = 
Public Enum UnicodeCategory
상속
UnicodeCategory
특성

필드

ClosePunctuation 21

괄호, 대괄호 및 중괄호처럼 쌍을 이루는 문장 부호의 닫는 문자입니다.Closing character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. 유니코드 지정 "Pe"(문장 부호, 닫기)로 표시됩니다.Signified by the Unicode designation "Pe" (punctuation, close). 값은 21입니다.The value is 21.

ConnectorPunctuation 18

두 개의 문자를 연결하는 커넥터 문장 부호 문자입니다.Connector punctuation character that connects two characters. 유니코드 지정 "Pc"(punctuation, connector)로 지정됩니다.Signified by the Unicode designation "Pc" (punctuation, connector). 값은 18입니다.The value is 18.

Control 14

유니코드 값이 U+007F, U+0000 ~ U+001F 또는 U+0080 ~ U+009F까지의 범위인 제어 코드 문자입니다.Control code character, with a Unicode value of U+007F or in the range U+0000 through U+001F or U+0080 through U+009F. 유니코드 지정 "Cc"(기타, 제어)로 표시됩니다.Signified by the Unicode designation "Cc" (other, control). 값은 14입니다.The value is 14.

CurrencySymbol 26

통화 기호 문자입니다.Currency symbol character. 유니코드 지정 "Sc"(기호, 통화)로 표시됩니다.Signified by the Unicode designation "Sc" (symbol, currency). 값은 26입니다.The value is 26.

DashPunctuation 19

대시 또는 하이픈 문자입니다.Dash or hyphen character. 유니코드 지정 "Pd"(문장 부호, 대시)로 표시됩니다.Signified by the Unicode designation "Pd" (punctuation, dash). 값은 19입니다.The value is 19.

DecimalDigitNumber 8

0부터 9까지의 범위에 있는 10진수 문자입니다.Decimal digit character, that is, a character in the range 0 through 9. 유니코드 지정 "Nd"(숫자, 10진수)로 표시됩니다.Signified by the Unicode designation "Nd" (number, decimal digit). 값은 8입니다.The value is 8.

EnclosingMark 7

모든 이전 문자를 둘러싸고 기본 문자를 포함하는 공간을 차지하지 않는 결합 문자인 묶음 표시 문자입니다.Enclosing mark character, which is a nonspacing combining character that surrounds all previous characters up to and including a base character. 유니코드 지정 "Me"(표시, 묶음)로 표시됩니다.Signified by the Unicode designation "Me" (mark, enclosing). 값은 7입니다.The value is 7.

FinalQuotePunctuation 23

닫는 문자 또는 마지막 문장 부호(") 문자입니다.Closing or final quotation mark character. 유니코드 지정 "Pf"(문장 부호, 마지막 따옴표)로 표시됩니다.Signified by the Unicode designation "Pf" (punctuation, final quote). 값은 23입니다.The value is 23.

Format 15

텍스트 레이아웃 또는 텍스트 작업 프로세스에 영향을 주는 서식 문자를 처리하지만 일반적으로 렌더링되지 않습니다.Format character that affects the layout of text or the operation of text processes, but is not normally rendered. 유니코드 지정 "Cf"(other, format)로 지정됩니다.Signified by the Unicode designation "Cf" (other, format). 값은 15입니다.The value is 15.

InitialQuotePunctuation 22

여는 문자 또는 시작 문장 부호 문자입니다.Opening or initial quotation mark character. 유니코드 지정 "Pi"(문장 부호, 처음 따옴표)로 표시됩니다.Signified by the Unicode designation "Pi" (punctuation, initial quote). 값은 22입니다.The value is 22.

LetterNumber 9

5에 해당하는 로마자 "V"와 같이 10진수 대신 문자로 나타내는 숫자입니다.Number represented by a letter, instead of a decimal digit, for example, the Roman numeral for five, which is "V". 유니코드 지정 "Nl"(number, letter)로 지정됩니다.The indicator is signified by the Unicode designation "Nl" (number, letter). 값은 9입니다.The value is 9.

LineSeparator 12

텍스트 행을 구분하는 데 사용되는 문자입니다.Character that is used to separate lines of text. 유니코드 지정 "Zl"(구분 기호, 줄)로 표시됩니다.Signified by the Unicode designation "Zl" (separator, line). 값은 12입니다.The value is 12.

LowercaseLetter 1

소문자입니다.Lowercase letter. 유니코드 지정 "Ll"(문자, 소문자)로 표시됩니다.Signified by the Unicode designation "Ll" (letter, lowercase). 값은 1입니다.The value is 1.

MathSymbol 25

"+" 또는 "=" 같은 수학 기호 문자입니다.Mathematical symbol character, such as "+" or "= ". 유니코드 지정 "Sm"(symbol, math)으로 지정됩니다.Signified by the Unicode designation "Sm" (symbol, math). 값은 25입니다.The value is 25.

ModifierLetter 3

이전 문자를 제한하는, 간격이 자유로운 문자인 한정자 문자입니다.Modifier letter character, which is free-standing spacing character that indicates modifications of a preceding letter. 유니코드 지정 "Lm"(letter, modifier)으로 지정됩니다.Signified by the Unicode designation "Lm" (letter, modifier). 값이 3입니다.The value is 3.

ModifierSymbol 27

주위 문자를 제한하는 한정자 기호 문자입니다.Modifier symbol character, which indicates modifications of surrounding characters. 예를 들어 분수 기호는 이 기호의 왼쪽 숫자가 분자이고, 오른쪽 숫자가 분모임을 나타냅니다.For example, the fraction slash indicates that the number to the left is the numerator and the number to the right is the denominator. 유니코드 지정 "Sk"(symbol, modifier)로 지정됩니다.The indicator is signified by the Unicode designation "Sk" (symbol, modifier). 값은 27입니다.The value is 27.

NonSpacingMark 5

기본 문자의 수정을 나타내는 공간을 차지하지 않는 문자입니다.Nonspacing character that indicates modifications of a base character. 유니코드 지정 "Mn"(mark, nonspacing)으로 지정됩니다.Signified by the Unicode designation "Mn" (mark, nonspacing). 값은 5입니다.The value is 5.

OpenPunctuation 20

소괄호, 대괄호, 중괄호 등 쌍을 이루는 문장 부호 중 여는 문자입니다.Opening character of one of the paired punctuation marks, such as parentheses, square brackets, and braces. 유니코드 지정 "Ps"(punctuation, open)로 지정됩니다.Signified by the Unicode designation "Ps" (punctuation, open). 값은 20입니다.The value is 20.

OtherLetter 4

대문자, 소문자, 단어의 첫 글자를 대문자로 하는 문자 또는 한정자 문자가 아닌 문자입니다.Letter that is not an uppercase letter, a lowercase letter, a titlecase letter, or a modifier letter. 유니코드 지정 "Lo"(letter, other)로 지정됩니다.Signified by the Unicode designation "Lo" (letter, other). 값은 4입니다.The value is 4.

OtherNotAssigned 29

어떠한 유니코드 범주에도 할당되지 않은 문자입니다.Character that is not assigned to any Unicode category. 유니코드 지정 "Cn"(other, not assigned)으로 지정됩니다.Signified by the Unicode designation "Cn" (other, not assigned). 값은 29입니다.The value is 29.

OtherNumber 10

10진수나 문자 숫자가 아닌 숫자(예: 분수 1/2)입니다.Number that is neither a decimal digit nor a letter number, for example, the fraction 1/2. 표시기는 유니코드 지정 "No"(숫자, 기타)로 표시됩니다.The indicator is signified by the Unicode designation "No" (number, other). 값은 10입니다.The value is 10.

OtherPunctuation 24

연결선, 대시, 여는 문장 부호, 닫는 문장 부호, 처음 따옴표 또는 마지막 따옴표가 아닌 문장 부호 문자입니다.Punctuation character that is not a connector, a dash, open punctuation, close punctuation, an initial quote, or a final quote. 유니코드 지정 "Po"(문장 부호, 기타)로 표시됩니다.Signified by the Unicode designation "Po" (punctuation, other). 값은 24입니다.The value is 24.

OtherSymbol 28

수학 기호, 통화 기호 또는 한정자 기호가 아닌 기호 문자입니다.Symbol character that is not a mathematical symbol, a currency symbol or a modifier symbol. 유니코드 지정 "So"(기호, 기타)로 표시됩니다.Signified by the Unicode designation "So" (symbol, other). 값은 28입니다.The value is 28.

ParagraphSeparator 13

단락을 구분하는 데 사용되는 문자입니다.Character used to separate paragraphs. 유니코드 지정 "Zp"(구분 기호, 단락)로 표시됩니다.Signified by the Unicode designation "Zp" (separator, paragraph). 값은 13입니다.The value is 13.

PrivateUse 17

유니코드 값이 U+E000부터 U+F8FF까지의 범위에 있는 프라이빗 문자입니다.Private-use character, with a Unicode value in the range U+E000 through U+F8FF. 유니코드 지정 "Co"(기타, 사용자 지정)로 표시됩니다.Signified by the Unicode designation "Co" (other, private use). 값은 17입니다.The value is 17.

SpaceSeparator 11

문자 모양이 없지만 제어 또는 서식 문자가 아닌 공백 문자입니다.Space character, which has no glyph but is not a control or format character. 유니코드 지정 "Zs"(구분 기호, 공백)로 표시됩니다.Signified by the Unicode designation "Zs" (separator, space). 값은 11입니다.The value is 11.

SpacingCombiningMark 6

기본 문자의 수정을 나타내고 기본 문자의 문자 모양 너비에 영향을 주는 공백 문자입니다.Spacing character that indicates modifications of a base character and affects the width of the glyph for that base character. 유니코드 지정 "Mc"(mark, spacing combining)로 지정됩니다.Signified by the Unicode designation "Mc" (mark, spacing combining). 값은 6입니다.The value is 6.

Surrogate 16

상위 서로게이트 또는 하위 서로게이트 문자입니다.High surrogate or a low surrogate character. 서로게이트 코드 값은 U+D800부터 U+DFFF까지의 범위에 있습니다.Surrogate code values are in the range U+D800 through U+DFFF. 유니코드 지정 "Cs"(other, surrogate)로 지정됩니다.Signified by the Unicode designation "Cs" (other, surrogate). 값은 16입니다.The value is 16.

TitlecaseLetter 2

단어의 첫 글자를 대문자로 표시한 문자입니다.Titlecase letter. 유니코드 지정 "Lt"(letter, titlecase)로 지정됩니다.Signified by the Unicode designation "Lt" (letter, titlecase). 값은 2입니다.The value is 2.

UppercaseLetter 0

대문자입니다.Uppercase letter. 유니코드 지정 "Lu"(letter, uppercase)로 지정됩니다.Signified by the Unicode designation "Lu" (letter, uppercase). 값은 0입니다.The value is 0.

예제

다음 예제에서는 UppercaseLetter 범주의 문자 및 문자에 대 한 해당 코드 포인트를 표시합니다.The following example displays the characters and their corresponding code points for characters in the UppercaseLetter category. UppercaseLetter을 category 변수에 대 한 할당의 관심 범주로 바꿔서 다른 범주의 문자를 표시 하도록 예제를 수정할 수 있습니다.You can modify the example to display the letters in any other category by replacing UppercaseLetter with the category of interest to you in the assignment to the category variable. 참고 일부 범주에 대 한 출력 확장이 가능 합니다.Note that the output for some categories can be extensive.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      int ctr = 0;
      UnicodeCategory category = UnicodeCategory.UppercaseLetter;
      
      for (ushort codePoint = 0; codePoint < ushort.MaxValue; codePoint++) {
         Char ch = Convert.ToChar(codePoint);

         if (CharUnicodeInfo.GetUnicodeCategory(ch) == category) {
            if (ctr % 5 == 0)
               Console.WriteLine();
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint);
            ctr++;
         } 
      }
      Console.WriteLine();
      Console.WriteLine("\n{0} characters are in the {1:G} category", 
                        ctr, category);   
   }
}
Imports System.Globalization

Module Example
   Public Sub Main()
      Dim ctr As Integer = 0
      Dim category As UnicodeCategory = UnicodeCategory.UppercaseLetter
      
      For codePoint As UShort = 0 To UShort.MaxValue - 1
         Dim ch As Char = Convert.ToChar(codePoint)

         If CharUnicodeInfo.GetUnicodeCategory(ch) = category Then
            If ctr Mod 5 = 0 Then Console.WriteLine()
            Console.Write("{0} (U+{1:X4})     ", ch, codePoint)
            ctr += 1
         End If 
      Next
      Console.WriteLine()
      Console.WriteLine()
      Console.WriteLine("{0} characters are in the {1:G} category", 
                        ctr, category)   
   End Sub
End Module

설명

UnicodeCategory 열거형의 멤버는 Char.GetUnicodeCategoryCharUnicodeInfo.GetUnicodeCategory 메서드에서 반환 됩니다.A member of the UnicodeCategory enumeration is returned by the Char.GetUnicodeCategory and CharUnicodeInfo.GetUnicodeCategory methods. UnicodeCategory 열거형은 IsUpper(Char)와 같은 Char 메서드를 지 원하는 데에도 사용 됩니다.The UnicodeCategory enumeration is also used to support Char methods, such as IsUpper(Char). 이러한 메서드는 지정 된 문자 특정 유니코드 일반 범주의 구성원 인지 확인 합니다.Such methods determine whether a specified character is a member of a particular Unicode general category. 유니코드 일반 범주 문자의 문자, 10 진수 숫자, 구분 기호, 수학 기호, 문장 부호, 및 등의 형식으로 지정, 광범위 한 분류를 정의합니다.A Unicode general category defines the broad classification of a character, that is, designation as a type of letter, decimal digit, separator, mathematical symbol, punctuation, and so on.

이 열거형은 유니코드 표준, 버전 5.0 기반으로 합니다.This enumeration is based on The Unicode Standard, version 5.0. 자세한 내용은 유니코드 문자 데이터베이스의 하위 항목인 "UCD 파일 형식"과 "일반 범주 값"을 참조하세요.For more information, see the "UCD File Format" and "General Category Values" subtopics at the Unicode Character Database.

유니코드 표준은 다음을 정의합니다.The Unicode Standard defines the following:

서로게이트 쌍에는 여기서 첫 번째 단위 쌍의 high surrogate 인지 하 고 두 번째 하위 서로게이트는 두 명의 코드 단위 시퀀스를 구성 하는 단일 추상 문자에 대 한 코드 문자 표현입니다.A surrogate pair is a coded character representation for a single abstract character that consists of a sequence of two code units, where the first unit of the pair is a high surrogate and the second is a low surrogate. High surrogate u+d800부터 U + DBFF 까지의 범위에 유니코드 코드 포인트를 이며 하위 서로게이트 u+dc00부터 U + DFFF 까지의 범위에는 유니코드 코드 포인트입니다.A high surrogate is a Unicode code point in the range U+D800 through U+DBFF and a low surrogate is a Unicode code point in the range U+DC00 through U+DFFF.

문자 시퀀스를 결합 하는 기본 문자와 조합 문자를 하나 이상의 조합입니다.A combining character sequence is a combination of a base character and one or more combining characters. 서로게이트 쌍을 기본 문자 또는 조합 문자를 나타냅니다.A surrogate pair represents a base character or a combining character. 조합 문자 간격이 있거나 없을 경우합니다A combining character is either spacing or nonspacing. 간격 문자를 결합 하는 반면 않습니다 간격이 없는 조합 문자를 렌더링할 때 자체적으로 간격 위치를 차지 합니다.A spacing combining character takes up a spacing position by itself when rendered, while a nonspacing combining character does not. 분음 부호 간격이 없는 조합 문자 예가 됩니다.Diacritics are an example of nonspacing combining characters.

한정자 문자에는 조합 문자를 같은 선행 문자의 수정을 나타내는 독립형 간격 문자입니다.A modifier letter is a free-standing spacing character that, like a combining character, indicates modifications of a preceding letter.

바깥쪽 표시가 간격이 없는 조합 문자는 모든 이전 문자를 둘러싸는 및 기본 문자를 포함 합니다.An enclosing mark is a nonspacing combining character that surrounds all previous characters up to and including a base character.

문자 형식에는 문자는은 일반적으로 렌더링 되지 않지만 텍스트 레이아웃 또는 텍스트 처리 작업에 미치는 영향입니다.A format character is a character that is not normally rendered but that affects the layout of text or the operation of text processes.

유니코드 표준의 일부 문장 부호를 여러 가지를 정의합니다.The Unicode Standard defines several variations to some punctuation marks. 예를 들어, 하이픈, U + 00ad (하이픈-빼기) 등 U + 00AD 하이픈을 나타내는 몇 가지 코드 값 중 하나일 수 있습니다 (사용자 지정 하이픈) 또는 U + 2010 (하이픈) 또는 U + 2011 (줄 바꿈하지 않는 하이픈).For example, a hyphen can be one of several code values that represent a hyphen, such as U+002D (hyphen-minus) or U+00AD (soft hyphen) or U+2010 (hyphen) or U+2011 (nonbreaking hyphen). 대시, 공백 문자 및 따옴표도 마찬가지입니다.The same is true for dashes, space characters, and quotation marks.

유니코드 표준 표현에 관련 된 특정 스크립트나 언어에서 예를 들어, U + 0030 (숫자 0) 소수 자릿수도 코드를 할당 하 고 U + 0660 (아랍어-인도어 식 소수 자릿수 0).The Unicode Standard also assigns codes to representations of decimal digits that are specific to a given script or language, for example, U+0030 (digit zero) and U+0660 (Arabic-Indic digit zero).

적용 대상

추가 정보