전체 텍스트 검색의 동작 변경

이 항목에서는 전체 텍스트 검색의 동작 변경 내용에 대해 설명합니다. 동작 변경 내용은 이전 버전의 SQL Server와 비교해서 SQL Server 2012의 기능이 작동하고 상호 작용하는 방법에 영향을 줍니다.

전체 텍스트 검색의 동작 변경 내용SQL Server 2012

SQL Server 2012는 미국 영어(LCID 1033) 및 영국 영어(LCID 2057)에 대해 새로운 버전의 단어 분리기 및 형태소 분석기를 설치합니다. 하지만 이전 동작을 유지하려는 경우 이러한 구성 요소의 이전 버전으로 전환할 수 있습니다. 자세한 내용은 미국 영어 및 영국 영어에 사용되는 단어 분리기 변경을 참조하십시오.

새 단어 분리기 및 형태소 분석기 설치됨

SQL Server 2012는 전체 텍스트 검색 및 의미 체계 검색에서 사용되는 모든 단어 분리기 및 형태소 분석기를 업데이트합니다. 인덱스 내용과 쿼리 결과 사이에 일관성을 유지하기 위해 기존 전체 텍스트 인덱스를 다시 채우는 것이 좋습니다.

  1. 영어에 대한 새로운 단어 분리기가 있습니다. 이전 동작을 유지해야 하는 경우 미국 영어 및 영국 영어에 사용되는 단어 분리기 변경을 참조하십시오.

  2. SQL Server의 이전 릴리스에 포함된 덴마크어, 폴란드어 및 터키어에 대한 타사 단어 분리기는 Microsoft 구성 요소로 대체되었습니다. 새 구성 요소는 기본적으로 활성화됩니다.

  3. 체코어 및 그리스어에 대한 새로운 단어 분리기가 있습니다. SQL Server 전체 텍스트 검색의 이전 릴리스에는 이 두 언어에 대한 지원이 포함되지 않았습니다.

새 단어 분리기 및 형태소 분석기의 동작 변경

전체 텍스트 인덱스를 채우고 쿼리할 때 새 구성 요소는 이전 구성 요소와 다른 결과를 반환할 수 있습니다. 다음 표에서는 영어 결과에서 예상할 수 있는 몇 가지 차이점을 보여 줍니다.

단어 분석기와 형태소 분석기의 이전 동작을 유지해야 하는 경우 다음 항목을 참조하십시오.

경우에 따라 새 구성 요소는 더 많은 결과를 반환합니다.

용어

이전 단어 분리기 및 형태소 분석기의 결과

새 단어 분리기 및 형태소 분석기의 결과

cat-dog

cat

dog

cat

cat-dog

dog

cat@dog.com

cat

com

dog

cat

cat@dog.com

com

dog

12/11/2011

(여기서 용어는 날짜)

12/11/2011

dd20111211

11

12

12/11/2011

2011

dd20111211

경우에 따라 새 구성 요소는 유사한 결과를 반환합니다.

용어

이전 단어 분리기 및 형태소 분석기의 결과

새 단어 분리기 및 형태소 분석기의 결과

100$

100$

nn100$

100$

nn100usd

022

022

nn022

022

nn22

10:49AM

(여기서 용어는 시간)

10:49am

tt1049

10:49am

tt24104900

경우에 따라 새 구성 요소는 더 적은 결과 또는 응용 프로그램에서 예상되지 않을 수 있는 결과를 반환합니다.

용어

이전 단어 분리기 및 형태소 분석기의 결과

새 단어 분리기 및 형태소 분석기의 결과

jěˊÿqℭžl

(여기서 용어는 유효한 영어 문자가 아님)

‘jěˊÿqℭžl’

je yq zl

table's

table’s

table

table’s

cat-

cat

cat-

cat

v-z(여기서 v 및 z는 의미 없는 단어)

(결과 없음)

v-z

$100 000 USD

$100

000

nn000

nn100$

usd

$100 000 usd

nn100000usd

beautiful U.S land

beautiful

land

u.s

us

beautiful

land

Mt. Kent and Mt Challenger

challenger

kent

mt

mt.

mt

kent

challenger

SQL Server 2008 전체 텍스트 검색의 동작 변경 내용

SQL Server 2008 및 이후 버전에서는 전체 텍스트 엔진이 관계형 데이터베이스에 서버 쿼리 및 저장소 엔진 인프라의 일부로서 데이터베이스 서비스로 통합되어 있습니다. 새로운 전체 텍스트 검색 아키텍처는 다음과 같은 목표를 달성합니다.

  • 저장과 관리가 통합됩니다. 이제 전체 텍스트 검색이 SQL Server에 내장된 저장 및 관리 기능과 직접 통합되었으며 MSFTESQL 서비스는 사라졌습니다. 

    • 전체 텍스트 인덱스가 파일 시스템이 아닌 데이터베이스 파일 그룹 내에 저장됩니다. 데이터베이스에 대한 백업 만들기와 같은 관리 작업은 전체 텍스트 인덱스에 자동으로 영향을 줍니다.

    • 이제 전체 텍스트 카탈로그는 파일 그룹에 속하지 않는 가상 개체이며, 전체 텍스트 인덱스의 그룹을 나타내는 논리적인 개념입니다. 따라서 여러 가지 카탈로그 관리 기능이 더 이상 사용되지 않으며, 이로 인해 일부 기능이 크게 변경되었습니다. 자세한 내용은 SQL Server 2012 이후에는 지원되지 않는 데이터베이스 엔진 기능전체 텍스트 검색의 주요 변경 내용을 참조하십시오.

      [!참고]

      전체 텍스트 카탈로그를 지정하는 SQL Server 2005 Transact-SQL DDL 문은 올바르게 작동합니다.

  • 쿼리 처리가 통합되었습니다. 새로운 전체 텍스트 검색 쿼리 프로세서는 데이터베이스 엔진의 일부이며 SQL Server 쿼리 프로세서와 완벽하게 통합되어 있습니다. 따라서 쿼리 최적화 프로그램에서 전체 텍스트 쿼리 조건자를 인식하여 자동으로 최대한 효율적으로 실행합니다.

  • 관리 및 문제 해결 기능이 향상되었습니다. 통합된 전체 텍스트 검색에서는 전체 텍스트 인덱스, 특정 단어 분리기의 출력, 중지 단어 구성 등의 검색 구조를 분석하는 데 도움이 되는 도구를 제공합니다.

  • 의미 없는 단어 및 의미 없는 단어 파일 대신 중지 단어 및 중지 목록이 사용됩니다. 중지 목록은 중지 단어에 대한 관리 태스크를 지원하고 서로 다른 서버 인스턴스와 환경 사이의 무결성을 높여 주는 데이터베이스 개체입니다. 자세한 내용은 전체 텍스트 검색에 사용할 중지 단어와 중지 목록 구성 및 관리을 참조하십시오.

  • SQL Server 2008 및 이후 버전에는 SQL Server 2005에 있는 언어 중 다수에 대한 새로운 단어 분리기가 포함되어 있습니다. 영어, 한국어, 태국어 및 중국어(모든 형태 포함)에 대한 단어 분리기만 동일하게 유지됩니다. 다른 언어의 경우에는 SQL Server 2005 데이터베이스를 SQL Server 2008 또는 이후 버전으로 업그레이드할 때 전체 텍스트 카탈로그를 가져온 경우 전체 텍스트 카탈로그의 전체 텍스트 인덱스에 사용된 하나 이상의 언어에 새로운 단어 분리기가 연결될 수 있습니다. 이러한 단어 분리기는 가져온 단어 분리기와 약간 다르게 작동할 수 있습니다. 쿼리와 전체 텍스트 인덱스 내용 간에 일관성을 유지하는 방법은 SQL Server 2005에서 전체 텍스트 검색 업그레이드를 참조하십시오.

  • 새로운 FDHOST Launcher(MSSQLFDLauncher) 서비스가 추가되었습니다. 자세한 내용은 전체 텍스트 검색 시작을 참조하십시오.

  • 전체 텍스트 인덱싱은 varbinary(max) 열과 함께 작동하는 것과 동일한 방식으로 FILESTREAM 열과 함께 작동합니다. FILESTREAM 테이블에는 각 FILESTREAM BLOB에 대한 파일 이름 확장명을 포함하는 열이 있어야 합니다. 자세한 내용은 전체 텍스트 검색을 사용한 쿼리, 검색 필터 구성 및 관리sys.fulltext_document_types(Transact-SQL)를 참조하십시오.

    전체 텍스트 엔진은 FILESTREAM BLOB의 내용을 인덱싱합니다. 이미지와 같은 인덱싱 파일은 유용하지 않을 수도 있습니다. FILESTREAM BLOB이 업데이트되면 인덱스가 다시 작성됩니다.

참고 항목

개념

전체 텍스트 검색(SQL Server)

SQL Server 2005에서 전체 텍스트 검색 업그레이드

전체 텍스트 검색 시작

관련 자료

전체 텍스트 검색의 이전 버전과의 호환성