Omówienie wyszukiwania pełnotekstowego

Kwerendy pełnotekstowe wyszukiwanie lingwistyczne przeciwko danych tekstowych w indeksy pełnotekstowe przez działający na wyrazy i frazy na podstawie reguł określonego języka, takich jak angielski lub japoński.Kwerendy pełnego tekstu może zawierać proste wyrazów i fraz lub wiele form wyrazu lub frazy.

Wyszukiwanie pełnotekstowe ma zastosowanie w całej zakres scenariuszy biznesowych, takich jak e firm — wyszukiwanie elementów w witrynie sieci web; prawa przedsiębiorstw — wyszukiwanie historie przypadek w repozytorium danych prawnych; lub działów Zasoby ludzkie — pasujących zadanie opisy przechowywane życiorysów.Basic administracyjnych i rozwoju zadań przeszukiwanie pełnego tekstu są równoważne niezależnie od scenariuszy biznesowych.Jednak w scenariuszu danej działalności indeksu pełnotekstowego i kwerend może być honed do spełnienia celów biznesowych.Na przykład dla wydajności DSI oznacza optymalne wykorzystanie e biznesu mogą być ważniejsze niż klasyfikacji wyniki, odwołaj dokładności (liczbę istniejących dopasowań faktycznie zwracane przez zapytanie pełnotekstowe) lub obsługi wielu języków.Dla firmy prawniczej zwracanie wszystkich możliwych trafień (zastępująca całkowita informacji) może być najbardziej ważnym zagadnieniem.

Omówienie sposobów konfigurowania bazy danych i wyszukiwanie pełnotekstowe

Dla dowolnego scenariusza administrator bazy danych wykonuje następujące podstawowe czynności, aby skonfigurować kolumn tabela w bazie danych dla przeszukiwanie pełnego tekstu:

  1. Utwórz wykaz pełnotekstowy.

  2. W każdej tabela, którą chcesz przeszukać Utwórz indeks pełnotekstowy przez:

    1. Zidentyfikowanie każdej kolumny tekstu, które chcesz dołączyć do indeksu pełnotekstowego.

    2. Jeśli dana kolumna zawiera dokumenty przechowywane jako dane binarne (varbinary, varbinary(max), lub image danych), należy określić kolumny tabela ( kolumny typu), które identyfikują typ każdego dokumentu w kolumnie indeksowany.

    3. Określić język, który ma przeszukiwanie pełnego tekstu na dokumenty kolumna.

    4. Wybierz mechanizm śledzenia zmian, którego chcesz użyć na indeks pełnotekstowy do śledzenia zmian w tabela bazowa i jej kolumn.

Wyszukiwanie pełnotekstowe obsługuje wiele języków, korzystając z następujących lingwistyczne składników: moduły dzielenia wyrazów i programy szukające rdzeni, stoplists, zawierające pliki stopwords (znane również jako słowa ignorowane) i tezaurusa.Pliki tezaurusa i w niektórych przypadkach stoplists wymagają konfiguracja przez administrator bazy danych.Plik tezaurusa danego obsługuje wszystkie indeksy pełnotekstowe używające odpowiedniego języka i danym stoplist może być skojarzona z tylu indeksy pełnotekstowe dowolnie.

Aby uzyskać więcej informacji, zobacz Administrowanie wyszukiwania pełnotekstowego.

Omówienie kwerend pełnego tekstu

Po dodaniu kolumny do indeksu pełnotekstowego aplikacji i użytkowników można uruchomić kwerendy pełnego tekstu na tekst w kolumnach.Te kwerendy można wyszukiwać dowolne z następujących czynności:

  • Jeden lub więcej słów lub fraz (termin proste)

  • Wyraz lub frazę, w którym wyrazy zaczynają się od określonego tekstu (termin prefiks)

  • Słowa ignorowanego formularze określone słowo (termin generacji)

  • Wyraz lub frazę do innego wyrazu lub frazy (termin bliskości)

  • Synonim formularze określone słowo (tezaurusa)

  • Wyrazy lub zwroty za pomocą ważonych wartości (termin ważonej)

Wszystkie kwerendy pełnego tekstu użyć niewielki zestaw Transact-SQL predykatów (ZAWIERA i FREETEXT) i funkcje (CONTAINSTABLE i FREETEXTTABLE).Jednakże celów wyszukiwania scenariusza biznesowego danego wpływ dokładne struktury kwerendy pełnego tekstu; na przykład:

  • e biznesu — wyszukiwanie produktu z witryna sieci web:

    SELECT product_id FROM products WHERE CONTAINS(product_description, ”Snap Happy 100EZ” OR FORMSOF(THESAURUS,’Snap Happy’) OR ‘100EZ’) AND product_cost<200 …
    
  • Scenariusz rekrutacji — wyszukiwanie zadanie kandydatów, które posiadają doświadczenie w pracy z SQL Server:

    SELECT candidate_name,SSN FROM candidates WHERE CONTAINS(candidate_resume,”SQL Server”) AND candidate_division =DBA
    

Aby uzyskać więcej informacji, zobacz Kwerenda SQL Server przy użyciu wyszukiwania pełnotekstowego.

Porównanie podobne do wyszukiwania pełnotekstowego

In contrast to full-text search, the LIKE Transact-SQL predicate works on character patterns only.Ponadto nie można używać w predykacie LIKE kwerendy sformatowane dane binarne.Ponadto PODOBNYCH zapytanie dużej ilości danych tekstowych niestrukturalnych jest znacznie mniejsza niż równoważne zapytanie pełnotekstowe wobec tych samych danych.PODOBNEGO zapytanie milionów wierszy tekstu danych może trwać minut zwrotu; zapytanie pełnotekstowe może podjąć tylko sekund lub mniej przeciwko te same dane w zależności od liczby wierszy zwracanych.