포함된 데이터베이스 데이터 정렬

아티클
08/21/2023

적용 대상:SQL Server Azure SQL Managed Instance

대/소문자 구분, 악센트 구분 및 사용 중인 기본 언어를 포함하여 다양한 속성이 텍스트 데이터의 정렬 순서 및 같음 의미 체계에 영향을 줍니다. 이러한 특성은 데이터에 대한 데이터 정렬 선택을 통해 SQL Server에 표현됩니다. 데이터 정렬 자체에 대한 자세한 내용은 데이터 정렬 및 유니코드 지원을 참조하세요.

데이터 정렬은 사용자 테이블에 저장된 데이터뿐만 아니라 메타데이터, 임시 개체, 변수 이름 등을 포함하여 SQL Server에서 처리하는 모든 텍스트에 적용됩니다. 이러한 처리는 포함된 데이터베이스와 포함되지 않은 데이터베이스에서 다릅니다. 이 변경은 많은 사용자에게 영향을 미치지 않지만 인스턴스 독립성과 균일성을 제공하는 데 도움이 됩니다. 그러나 이로 인해 포함된 데이터베이스와 포함되지 않은 데이터베이스 모두에 액세스하는 세션에 대한 문제뿐만 아니라 약간의 혼란이 발생할 수도 있습니다.

포함된 데이터베이스의 데이터 정렬 동작은 포함되지 않은 데이터베이스의 데이터 정렬 동작과 미묘하게 다릅니다. 이 동작은 일반적으로 인스턴스 독립성과 단순성을 제공하는 데 유용합니다. 일부 사용자는 특히 세션이 포함된 데이터베이스와 포함되지 않은 데이터베이스에 모두 액세스할 때 문제가 있을 수 있습니다.

이 문서에서는 변경 내용을 명확히 설명하고 변경으로 인해 문제가 발생할 수 있는 영역을 검사합니다.

참고 항목

Azure SQL Database의 경우 포함된 데이터베이스에 대한 데이터 정렬은 다릅니다. 데이터베이스 데이터 정렬 및 카탈로그 데이터 정렬은 데이터베이스를 만들 때 설정할 수 있으며 업데이트할 수 없습니다. 데이터(COLLATE)에 대한 데이터 정렬 및 시스템 메타데이터 및 개체 식별자(CATALOG_COLLATION)에 대한 카탈로그 데이터 정렬을 지정합니다. 자세한 내용은 CREATE DATABASE를 참조하세요.

포함되지 않은 데이터베이스

모든 데이터베이스에는 기본 데이터 정렬이 있습니다(데이터베이스를 만들거나 변경할 때 설정할 수 있음). 이러한 데이터 정렬은 데이터베이스의 모든 메타데이터에 사용되며 데이터베이스 내 모든 문자열 열의 기본값으로 사용됩니다. 사용자는 절을 사용하여 특정 열에 대해 다른 데이터 정렬을 COLLATE 선택할 수 있습니다.

예 1

예를 들어 베이징에서 작업하는 경우 중국어 데이터 정렬을 사용할 수 있습니다.

ALTER DATABASE MyDB COLLATE Chinese_Simplified_Pinyin_100_CI_AS;

이제 열을 만들면 이 열의 기본 데이터 정렬은 중국어 데이터 정렬이 되지만 원하는 경우 다른 데이터 정렬을 선택할 수 있습니다.

CREATE TABLE MyTable  
      (mycolumn1 nvarchar,  
      mycolumn2 nvarchar COLLATE Frisian_100_CS_AS);  
GO  
SELECT name, collation_name  
FROM sys.columns  
WHERE name LIKE 'mycolumn%' ;  
GO

결과 집합은 다음과 같습니다.

name            collation_name  
--------------- ----------------------------------  
mycolumn1       Chinese_Simplified_Pinyin_100_CI_AS  
mycolumn2       Frisian_100_CS_AS

이는 비교적 간단해 보이지만 몇 가지 문제가 발생합니다. 열의 데이터 정렬은 테이블이 만들어지는 데이터베이스에 따라 달라지므로 저장 tempdb되는 임시 테이블을 사용할 때 문제가 발생합니다. 일반적으로 데이터 정렬은 인스턴스의 tempdb 데이터 정렬과 일치하며 데이터베이스 데이터 정렬과 일치하지 않아도 됩니다.

예제 2

예를 들어 Latin1_General 데이터 정렬이 있는 인스턴스에서 사용되는 경우 위의 (중국어) 데이터베이스를 고려합니다.

CREATE TABLE T1 (T1_txt nvarchar(max)) ;  
GO  
CREATE TABLE #T2 (T2_txt nvarchar(max)) ;  
GO

얼핏 보면 두 테이블이 동일한 스키마를 가지고 있는 것처럼 보이지만 데이터베이스의 데이터 정렬이 다르기 때문에 실제로는 값이 호환되지 않습니다.

SELECT T1_txt, T2_txt  
FROM T1   
JOIN #T2   
    ON T1.T1_txt = #T2.T2_txt

결과 집합은 다음과 같습니다.

메시지 468, 수준 16, 상태 9, 줄 2

"Latin1_General_100_CI_AS_KS_WS_SC"과 "Chinese_Simplified_Pinyin_100_CI_AS" 간의 데이터 정렬 충돌을 동일한 연산에서 해결할 수 없습니다.

임시 테이블을 명시적으로 정렬하여 이 문제를 해결할 수 있습니다. SQL Server를 사용하면 절에 대한 키워드를 DATABASE_DEFAULT 제공하여 이 작업을 좀 더 쉽게 수행할 수 COLLATE 있습니다.

CREATE TABLE T1 (T1_txt nvarchar(max)) ;  
GO  
CREATE TABLE #T2 (T2_txt nvarchar(max) COLLATE DATABASE_DEFAULT);  
GO  
SELECT T1_txt, T2_txt  
FROM T1   
JOIN #T2   
    ON T1.T1_txt = #T2.T2_txt ;

이제 오류 없이 실행됩니다.

변수를 사용한 데이터 정렬 종속 동작도 확인할 수 있습니다. 다음 함수를 살펴보세요.

CREATE FUNCTION f(@x INT) RETURNS INT  
AS BEGIN   
      DECLARE @I INT = 1  
      DECLARE @İ INT = 2  
      RETURN @x * @i  
END;

이 함수는 조금 특이한 함수입니다. 대/소문자를 구분하는 데이터 정렬 @i 에서 return 절에서 둘 중 하나 @I 또는 @İ에 바인딩할 수 없습니다. 대/소문자를 구분하지 않는 Latin1_General 데이터 정렬 @i 에서 바인딩하고 @I함수가 반환합니다 1. 그러나 대/소문자를 구분하지 않는 터키어 데이터 정렬 @i 에서 바인딩하고 함수는 2를 반환합니다 @İ. 이렇게 하면 서로 다른 데이터 정렬을 사용하여 인스턴스 간에 이동하는 데이터베이스에 큰 피해를 줄 수 있습니다.

포함된 데이터베이스

포함된 데이터베이스의 디자인 목표는 데이터베이스를 자체 포함으로 만드는 것이므로 인스턴스 및 tempdb 데이터 정렬에 대한 의존도를 끊어야 합니다. 이러한 목표를 위해 포함된 데이터베이스에는 카탈로그 데이터 정렬이라는 개념이 도입되었습니다. 카탈로그 데이터 정렬은 시스템 메타데이터 및 임시 개체에 사용됩니다. 자세한 내용은 아래와 같습니다.

포함된 데이터베이스에서 카탈로그 데이터 정렬은 Latin1_General_100_CI_AS_WS_KS_SC. 이 데이터 정렬은 SQL Server의 모든 인스턴스에 포함된 모든 데이터베이스에 대해 동일하며 변경할 수 없습니다.

데이터베이스 데이터 정렬은 유지되지만 사용자 데이터의 기본 데이터 정렬로만 사용됩니다. 기본적으로 데이터베이스 데이터 정렬은 model 데이터베이스 데이터 정렬과 같지만 포함되지 않은 데이터베이스와 마찬가지로 사용자가 또는 ALTER DATABASE 명령을 통해 CREATE 변경할 수 있습니다.

절에서 COLLATE 새 키워드CATALOG_DEFAULT를 사용할 수 있습니다. 포함된 데이터베이스와 포함되지 않은 데이터베이스 모두에서 메타데이터의 현재 데이터 정렬에 대한 바로 가기로 사용됩니다. 즉, 포함되지 않은 데이터베이스에서 CATALOG_DEFAULT는 메타데이터가 데이터베이스 데이터 정렬로 정렬되기 때문에 현재 데이터베이스 데이터 정렬을 반환합니다. 포함된 데이터베이스에서는 사용자가 카탈로그 데이터 정렬과 일치하지 않도록 데이터베이스 데이터 정렬을 변경할 수 있으므로 이러한 두 값이 다를 수 있습니다.

포함되지 않은 데이터베이스와 포함된 데이터베이스 모두에서 다양한 개체의 동작은 다음 표에 요약되어 있습니다.

상품	포함되지 않은 데이터베이스	포함된 데이터베이스
사용자 데이터(기본값)	DATABASE_DEFAULT	DATABASE_DEFAULT
임시 데이터(기본값)	`tempdb` 데이터 정렬을	DATABASE_DEFAULT
메타데이터	DATABASE_DEFAULT/CATALOG_DEFAULT	CATALOG_DEFAULT
임시 메타데이터	`tempdb` 데이터 정렬을	CATALOG_DEFAULT
Variables	인스턴스 데이터 정렬	CATALOG_DEFAULT
Goto 레이블	인스턴스 데이터 정렬	CATALOG_DEFAULT
커서 이름	인스턴스 데이터 정렬	CATALOG_DEFAULT

앞에서 설명한 임시 테이블 예제에서 이 데이터 정렬 동작은 대부분의 임시 테이블에서 사용되는 명시적 COLLATE 절이 필요하지 않은 것을 확인할 수 있습니다. 포함된 데이터베이스에서 이 코드는 데이터베이스와 인스턴스 데이터 정렬이 다르더라도 오류 없이 실행됩니다.

CREATE TABLE T1 (T1_txt nvarchar(max)) ;  
GO  
CREATE TABLE #T2 (T2_txt nvarchar(max));  
GO  
SELECT T1_txt, T2_txt  
FROM T1   
JOIN #T2   
    ON T1.T1_txt = #T2.T2_txt ;

이는 모두 T1_txtT2_txt 포함된 데이터베이스의 데이터베이스 데이터 정렬에서 데이터 정렬되기 때문에 작동합니다.

포함된 컨텍스트와 포함되지 않은 컨텍스트 간 교차

포함된 데이터베이스의 세션이 포함된 상태로 유지되는 한 연결된 데이터베이스 내에 남아 있어야 합니다. 이 경우 동작은 매우 간단합니다. 그러나 세션이 포함된 컨텍스트와 포함되지 않은 컨텍스트 간에 교차하는 경우 두 규칙 집합을 브리지해야 하므로 동작이 더 복잡해집니다. 사용자가 다른 데이터베이스에 연결할 수 있으므로 부분적으로 포함된 데이터베이스에서 이 오류가 발생할 수 있습니다 USE . 이 경우 데이터 정렬 규칙의 차이는 다음 원칙에 의해 처리됩니다.

일괄 처리에 대한 데이터 정렬 동작은 일괄 처리가 시작되는 데이터베이스에 의해 결정됩니다.

이 결정은 초기 USE명령을 포함하여 모든 명령이 실행되기 전에 결정됩니다. 즉, 포함된 데이터베이스에서 일괄 처리가 시작되지만 첫 번째 명령이 USE 포함되지 않은 데이터베이스에 대한 경우 포함된 데이터 정렬 동작은 일괄 처리에 계속 사용됩니다. 이 점을 고려하면 예를 들어 변수에 대한 참조가 다음과 같은 여러 가지 결과를 생성할 수 있습니다.

참조는 정확히 하나의 일치 항목을 찾을 수 있습니다. 이 경우 참조는 오류 없이 작동합니다.
참조가 이전에 있었던 현재 데이터 정렬에서 일치 항목을 찾을 수 없습니다. 이런 경우 변수가 분명히 만들어졌음에도 불구하고 변수가 없음을 나타내는 오류가 발생합니다.
참조가 원래는 구별되었던 여러 개의 일치 항목을 찾습니다. 이 경우에도 오류가 발생합니다.

몇 가지 예제를 사용하여 이를 설명합니다. 이를 위해 데이터베이스 데이터 정렬이 기본 데이터 정렬로 설정된 부분적으로 MyCDB 포함된 데이터베이스가 Latin1_General_100_CI_AS_WS_KS_SC 가정합니다. 인스턴스 데이터 정렬 이 Latin1_General_100_CS_AS_WS_KS_SC 가정합니다. 두 데이터 정렬은 대/소문자 구분만 다릅니다.

예 1

다음 예에서는 참조가 일치하는 항목을 정확히 하나 찾는 경우를 보여 줍니다.

USE MyCDB;  
GO  
  
CREATE TABLE #a(x int);  
INSERT INTO #a VALUES(1);  
GO  
  
USE master;  
GO  
  
SELECT * FROM #a;  
GO  
  
Results:

결과 집합은 다음과 같습니다.

x  
-----------  
1

이 경우 식별된 #a 대/소문자를 구분하지 않는 카탈로그 데이터 정렬과 대/소문자를 구분하는 인스턴스 데이터 정렬 모두에서 바인딩되며 코드가 작동합니다.

예제 2

다음 예제에서는 참조가 이전에 있던 현재 데이터 정렬에서 일치 항목을 찾지 못하는 경우를 보여 줍니다.

USE MyCDB;  
GO  
  
CREATE TABLE #a(x int);  
INSERT INTO #A VALUES(1);  
GO

여기서는 #A 대/소문자를 구분하지 #a 않는 기본 데이터 정렬에 바인딩하고 삽입이 작동합니다.

결과 집합은 다음과 같습니다.

(1 row(s) affected)

그러나 스크립트를 계속 진행하면...

USE master;  
GO  
  
SELECT * FROM #A;  
GO

대/소문자를 구분하는 인스턴스 데이터 정렬에서 바인딩 #A 하는 동안 오류가 발생합니다.

결과 집합은 다음과 같습니다.

메시지 208, 수준 16, 상태 0, 줄 2

개체 이름 '#A'이(가) 잘못되었습니다.

예 3

다음 예제에서는 참조가 원래 고유했던 여러 일치 항목을 찾는 경우를 보여 줍니다. 먼저(인스턴스와 대/소문자 구분 데이터 정렬이 동일)에서 시작하여 tempdb 다음 문을 실행합니다.

USE tempdb;  
GO  
  
CREATE TABLE #a(x int);  
GO  
CREATE TABLE #A(x int);  
GO  
INSERT INTO #a VALUES(1);  
GO  
INSERT INTO #A VALUES(2);  
GO

테이블은 이 데이터 정렬에서 고유하므로 성공합니다.

결과 집합은 다음과 같습니다.

(1 row(s) affected)  
(1 row(s) affected)

그러나 포함된 데이터베이스로 이동하면 더 이상 이러한 테이블에 바인딩할 수 없습니다.

USE MyCDB;  
GO  
SELECT * FROM #a;  
GO

결과 집합은 다음과 같습니다.

 Msg 12800, Level 16, State 1, Line 2  
  
 The reference to temp table name #a is ambiguous and cannot be resolved. Possible candidates are #a and #A.

다음 단계

포함된 데이터베이스

포함된 데이터베이스 데이터 정렬

포함되지 않은 데이터베이스

예 1

예제 2

포함된 데이터베이스

포함된 컨텍스트와 포함되지 않은 컨텍스트 간 교차

예 1

예제 2

예 3

다음 단계

피드백

피드백

추가 리소스