mbrtowc

현재 로캘의 멀티바이트 문자를 해당하는 와이드 문자로 변환합니다. 이때 멀티바이트 문자의 중간에서 변환을 다시 시작할 수 있습니다.

구문

size_t mbrtowc(
   wchar_t *wchar,
   const char *mbchar,
   size_t count,
   mbstate_t *mbstate
);

매개 변수

wchar
변환된 와이드 문자열(wchar_t 형식)을 받을 와이드 문자의 주소입니다. 반환 와이드 문자가 필요하지 않으면 이 값은 null 포인터일 수 있습니다.

mbchar
바이트 시퀀스(멀티바이트 문자)의 주소입니다.

count
검사할 바이트 수입니다.

mbstate
변환 상태 개체에 대한 포인터입니다. 이 값이 null 포인터이면 함수는 정적 내부 변환 상태 개체를 사용합니다. 내부 mbstate_t 개체는 스레드로부터 안전하지 않으므로 항상 고유한 mbstate 인수를 전달하는 것이 좋습니다.

반환 값

다음 값 중 하나:

0 null 포인터가 아닌 경우 wchar null 와이드 문자를 나타내는 멀티바이트 문자가 다음 count 또는 더 적은 바이트에 저장wchar됩니다.

1- count포함 다음 count 또는 더 적은 바이트는 유효한 멀티바이트 문자를 완료합니다. 반환되는 값은 멀티바이트 문자를 완성하는 바이트 수입니다. Null 포인터가 아닌 경우 wchar 해당 와이드 문자가 저장wchar됩니다.

(size_t) (-1) 인코딩 오류가 발생했습니다. 다음 count 또는 그 이하의 바이트는 완전하고 유효한 멀티바이트 문자에 영향을 주지 않습니다. 이 경우 errno는 EILSEQ로 설정되며 mbstate에서 변환 이동 상태가 지정되지 않습니다.

(size_t) (-2) 다음 count 바이트는 불완전하지만 잠재적으로 유효한 멀티바이트 문자에 기여하며 모든 count 바이트가 처리되었습니다. wchar에는 값이 저장되지 않지만 mbstate는 업데이트되므로 함수가 다시 시작됩니다.

설명

mbchar이 null 포인터이면 함수는 다음 호출과 같습니다.

mbrtowc(NULL, "", 1, &mbstate)

이 경우 인수 및 count 인수의 wchar 값은 무시됩니다.

null 포인터가 아닌 경우 mbchar 함수는 바이트를 검사 count 하여 다음 멀티바 mbchar 이트 문자를 완료하는 데 필요한 바이트 수를 확인합니다. 다음 문자가 유효한 경우 해당 멀티바이트 문자는 null 포인터가 아닌 경우 저장 wchar 됩니다. 문자가 해당하는 와이드 null 문자이면 mbstate의 결과 상태는 초기 변환 상태가 됩니다.

함수는 mbrtowc 다시 시작 가능성에 따라 다릅니다mbtowc_mbtowc_l. 같거나 다른 다시 시작 가능 함수에 대한 후속 호출에서는 변환 상태가 mbstate에 저장됩니다. 다시 시작할 수 있는 함수와 다시 시작할 수 없는 함수를 함께 사용할 때는 결과가 정의되지 않습니다. 예를 들어 wcsrlen 대신 후속 wcslen 호출을 사용하는 경우 애플리케이션은 wcsrtombs 대신 wcstombs을 사용해야 합니다.

기본적으로 이 함수의 전역 상태는 애플리케이션으로 범위가 지정됩니다. 이 동작을 변경하려면 CRT의 전역 상태를 참조하세요.

예시

멀티바이트 문자를 해당하는 와이드 문자로 변환합니다.

// crt_mbrtowc.cpp

#include <stdio.h>
#include <mbctype.h>
#include <string.h>
#include <locale.h>
#include <wchar.h>

#define BUF_SIZE 100

int Sample(char* szIn, wchar_t* wcOut, int nMax)
{
    mbstate_t   state = {0}; // Initial state
    size_t      nConvResult,
                nmbLen = 0,
                nwcLen = 0;
    wchar_t*    wcCur = wcOut;
    wchar_t*    wcEnd = wcCur + nMax;
    const char* mbCur = szIn;
    const char* mbEnd = mbCur + strlen(mbCur) + 1;
    char*       szLocal;

    // Sets all locale to French_Canada.1252
    szLocal = setlocale(LC_ALL, "French_Canada.1252");
    if (!szLocal)
    {
        printf("The fuction setlocale(LC_ALL, \"French_Canada.1252\") failed!\n");
        return 1;
    }

    printf("Locale set to: \"%s\"\n", szLocal);

    // Sets the code page associated current locale's code page
    // from a previous call to setlocale.
    if (_setmbcp(_MB_CP_SBCS) == -1)
    {
        printf("The fuction _setmbcp(_MB_CP_SBCS) failed!");
        return 1;
    }

    while ((mbCur < mbEnd) && (wcCur < wcEnd))
    {
        //
        nConvResult = mbrtowc(wcCur, mbCur, 1, &state);
        switch (nConvResult)
        {
            case 0:
            {  // done
                printf("Conversion succeeded!\nMultibyte String: ");
                printf(szIn);
                printf("\nWC String: ");
                wprintf(wcOut);
                printf("\n");
                mbCur = mbEnd;
                break;
            }

            case -1:
            {  // encoding error
                printf("The call to mbrtowc has detected an encoding error.\n");
                mbCur = mbEnd;
                break;
            }

            case -2:
            {  // incomplete character
                if   (!mbsinit(&state))
                {
                    printf("Currently in middle of mb conversion, state = %x\n", state);
                    // state will contain data regarding lead byte of mb character
                }

                ++nmbLen;
                ++mbCur;
                break;
            }

            default:
            {
                if   (nConvResult > 2) // The multibyte should never be larger than 2
                {
                    printf("Error: The size of the converted multibyte is %d.\n", nConvResult);
                }

                ++nmbLen;
                ++nwcLen;
                ++wcCur;
                ++mbCur;
            break;
            }
        }
    }

   return 0;
}

int main(int argc, char* argv[])
{
    char    mbBuf[BUF_SIZE] = "AaBbCc\x9A\x8B\xE0\xEF\xF0xXyYzZ";
    wchar_t wcBuf[BUF_SIZE] = {L''};

    return Sample(mbBuf, wcBuf, BUF_SIZE);
}

샘플 출력

Locale set to: "French_Canada.1252"
Conversion succeeded!
Multibyte String: AaBbCcÜïα∩≡xXyYzZ
WC String: AaBbCcÜïα∩≡xXyYzZ

요구 사항

루틴에서 반환된 값 필수 헤더
mbrtowc <wchar.h>

참고 항목

데이터 변환
Locale
멀티바이트 문자 시퀀스 해석