Szemantikai keresés a Azure Cognitive Search

Fontos

A szemantikai keresés nyilvános előzetes verzióban érhető el kiegészítő használati feltételek mellett. Elérhető a Azure Portal, REST API és a bétaverziós SZOFTVERDK-okkal. Ezek a funkciók számlázhatók. További információ: Rendelkezésre állás és díjszabás.

A szemantikai keresés lekérdezéshez kapcsolódó képességek gyűjteménye, amely szemantikai relevanciával és nyelvérthetőséggel hozza létre a keresési eredményeket. Ez a cikk részletesen bemutatja a szemantikai keresést, és részletesen bemutatja az egyes funkciókat és a közös munkát. A beágyazott videó ismerteti a technológiát, a végén pedig a rendelkezésre állást és a díjszabást.

A szemantikai keresés prémium szintű funkció. A háttérinformációkhoz ezt a cikket javasoljuk, de ha inkább az első lépéseket ajánlja, kövesse az alábbi lépéseket:

A szemantikai keresés olyan funkciók gyűjteménye, amelyek javítják a keresési eredmények minőségét. Ha engedélyezve van a keresési szolgáltatásban, kétféleképpen bővíti ki a lekérdezés-végrehajtási folyamatot. Először hozzáadja a másodlagos rangsort a kezdeti eredményhalmazhoz képest, és a legszemantikailag releváns eredményeket népszerűsíti a lista tetején. Másodszor pedig kinyeri és visszaadja a válaszban a feliratokat és válaszokat, amelyeket a keresési oldalon megjelenítve javíthatja a felhasználó keresési élményét.

Szolgáltatás Leírás
Szemantikai újra rangsorolás A kontextus vagy szemantikai jelentés alapján számítja ki az új relevanciapontszámokat a meglévő eredmények alapján.
Szemantikai feliratok és kiemelések Mondatokat és kifejezéseket von ki egy dokumentumból, amely a legjobban összegzi a tartalmat, és kiemeli a kulcsrészeket az egyszerű vizsgálat érdekében. Az eredményeket összegző feliratok akkor hasznosak, ha az egyes tartalommezők túl sűrűk az eredményoldalhoz. A kiemelt szöveg emeli a legfontosabb kifejezéseket és kifejezéseket, így a felhasználók gyorsan megállapíthatják, hogy egy adott találat miért minősül relevánsnak.
Szemantikai válaszok Egy szemantikai lekérdezés által visszaadott nem kötelező és további alstrukturálás. Közvetlen választ ad egy kérdéshez hasonló lekérdezésre. Megköveteli, hogy a dokumentumok a válasz jellemzőivel rendelkeznek.
Helyesírás-ellenőrzés Kijavítja az elgépeléseket, mielőtt a lekérdezési kifejezések elérnék a keresőmotort.

A szemantikai rangsorolás működése

A szemantikai rangsor a kontextust és a kapcsolódóságot keres a kifejezések között, és olyan egyezéseket ad meg, amelyek a lekérdezés alapján érthetőbbek. A Language Understanding összegzéseket, feliratokat és válaszokat keres a tartalomban, és tartalmazza őket a válaszban, amely aztán megjeleníthető a keresési eredmények oldalán a hatékonyabb keresési élmény érdekében.

Az összegzéshez és a rangsoroláshoz a legképezettségfokos modellek használhatók. A felhasználók által a kereséstől elvárt gyors teljesítmény fenntartása érdekében a szemantikai összesítés és rangsorolás csak az első 50 találatra lesz alkalmazva, az alapértelmezett hasonlóságpontozási algoritmus pontszáma alapján. Ha ezeket az eredményeket használja dokumentumként, a szemantikai rangsorolás az egyezés szemantikai erőssége alapján újrapontosul.

A mögöttes technológia a Bing Microsoft Researchtől és a Microsoft Researchtől függ, és bővítményként Cognitive Search az infrastruktúrába. A szemantikai kereséshez szükséges kutatásokkal és AI-befektetésekkel kapcsolatos további információkért lásd: How AI from Bing is powering Azure Cognitive Search (Microsoft Research Blog).

Az alábbi videó áttekintést nyújt a képességekről.

Műveletek sorrendje

A szemantikai keresés összetevői mindkét irányba kiterjesztik a meglévő lekérdezés-végrehajtási folyamatot. Ha engedélyezi a helyesírás-javítást, a helyesírás-ellenőrző kijavítja az elírásokat a lekérdezés kezdetekor, mielőtt a kifejezések elérnék a keresőmotort.

Szemantikai összetevők a lekérdezések végrehajtásakor

A lekérdezések végrehajtása a szokásos módon folytatódik a fordított indexek kifejezéselemzésével, elemzésével és vizsgálatával. A motor jogkivonat-egyeztetés használatával lekéri a dokumentumokat, és pontoz az eredményeket az alapértelmezett hasonlóságpontozási algoritmussal. A pontszámok a lekérdezési kifejezések és az indexben található egyező kifejezések nyelvi hasonlósága alapján vannak kiszámítva. Ha definiálta őket, a pontozási profilok is alkalmazva vannak ebben a szakaszban. Az eredmények ezután a szemantikai keresési alrendszernek vannak átkultálva.

Az előkészítési lépésben a rendszer a kezdeti eredményhalmazból visszaadott dokumentum corpus elemét a mondat és a bekezdés szintjén elemzi, hogy megtalálja az egyes dokumentumokat összegző szakaszokat. A kulcsszókereséssel ellentétben ez a lépés gépi olvasás és szövegértés segítségével értékeli ki a tartalmat. A tartalomfeldolgozás ezen szakasza során a szemantikai lekérdezés feliratokat és válaszokat ad vissza. A szemantikai keresés a nyelvi ábrázolás segítségével nyeri ki és emeli ki azokat a kulcsrészeket, amelyek a legjobban összegzi az eredményeket. Ha a keresési lekérdezés kérdés – és válaszokat kér – a válasz tartalmazni fog egy szöveges szakaszt is, amely a legjobban válaszolja meg a kérdést a keresési lekérdezésben kifejezettek szerint.

A feliratok és a válaszok esetén is a meglévő szöveg lesz használva a megfogalmazásban. A szemantikai modellek nem hoznak létre új mondatokat vagy kifejezéseket a rendelkezésre álló tartalomból, és nem alkalmaznak logikát új következtetések levonásához. Röviden, a rendszer soha nem ad vissza olyan tartalmat, amely még nem létezik.

Az eredmények ezután a lekérdezési kifejezések fogalmi hasonlósága alapján újrapontosulnak.

Ha szemantikai képességeket használ a lekérdezésekben, kis módosításokat kell eszközelnie a keresési kérésen, de nincs szükség további konfigurálásra vagy újraindexelésre.

Szemantikai képességek és korlátozások

A szemantikai keresés egy újabb technológia, ezért fontos elvárni, hogy mit képes és mit nem. A következővel javíthatja a keresés minőségét:

  • Olyan egyezések népszerűsítése, amelyek szemantikailag közelebb vannak az eredeti lekérdezés szándékhoz.

  • Sztringek keresése minden eredményben, amely feliratként használható, és lehetséges válaszok, amelyek megjeleníthetőek a keresési eredmények oldalán.

Nem tudja újrafuttatni a lekérdezést a teljes corpusban, hogy szemantikailag releváns eredményeket találjon. A szemantikai keresés újra rangsorolja a meglévő eredményhalmazt, amely az alapértelmezett rangsorolási algoritmus szerint az első 50 találatból áll. A szemantikai keresés továbbá nem hozhat létre új információkat vagy sztringeket. A feliratok és válaszok a tartalomból lesznek kinyerve, így ha az eredmények nem tartalmaznak válaszhoz hasonló szöveget, a nyelvi modellek nem hoznak létre ilyen szöveget.

Bár a szemantikai keresés nem minden forgatókönyvben előnyös, bizonyos tartalmaknak jelentős előnye lehet a képességeiből. A szemantikai keresés nyelvi modelljei olyan kereshető tartalmakon működnek a legjobban, amelyek információban gazdagok és prózai struktúrában strukturálhatók. A tudásbázisok, online dokumentációk vagy leíró tartalmakat tartalmazó dokumentumok a legnagyobb előnyöket látják a szemantikai keresési képességekben.

Rendelkezésre állás és díjszabás

A szemantikai keresés a regisztrációs regisztráción keresztül érhető el. A szemantikai keresésre és a helyesírás-ellenőrzésre is van egy regisztráció.

Szolgáltatás Szint Régió Regisztráció Díjszabás
Szemantikai keresés (rang, feliratok, kiemelések, válaszok) Standard szint (S1, S2, S3) USA északi középső régiója, USA nyugati régiója, USA 2. nyugati régiója, USA 2. keleti régiója, Észak-Európa, Nyugat-Európa Kötelező Cognitive Search oldal
Helyesírás-ellenőrzés Alapszintű és magasabb Mind None Nincs (ingyenes)

A szemantikai keresés díjai fel vannak emelve, ha a lekérdezési kérések tartalmazzák a "queryType=szemantic" sztringet, és a keresési sztring nem üres (például "search=pet friendly hotels in New York". Ha a keresési sztring üres ("search=*"), akkor sem számítunk fel díjat, ha a queryType értéke "szemantikai".

A véletlen használattal és díjakkal szembeni teljes védelem érdekében letilthatja a szemantikai keresést a Keresési szolgáltatás Szolgáltatás létrehozása vagy frissítése API-jával. A funkció letiltás után a szemantikai lekérdezési típust is magában foglaló kérések el lesznek utasítva.

  • A REST API 2021. 04. 01. 01., előzetes verzió biztosítja ezt a lehetőséget

  • A funkciók letiltásához tulajdonosi vagy közreműködői engedélyek szükségesek

PUT https://management.azure.com/subscriptions/{{subscriptionId}}/resourcegroups/{{resource-group}}/providers/Microsoft.Search/searchServices/{{search-service-name}}?api-version=2021-04-01-Preview
    {
      "location": "{{region}}",
      "sku": {
        "name": "standard"
      },
      "properties": {
        "semanticSearch": "disabled"
      }
    }

A szemantikai keresés újra engedélyezéséhez futtassa újra a fenti kérést, és a "semanticSearch" beállítást "ingyenes" (alapértelmezett) vagy "standard" (standard) értékre állítva.

Tipp

A REST API hívások hitelesítése a Azure Active Directory. A biztonsági alapelv és a kérés beállításával kapcsolatos útmutatásért tekintse meg az Azure REST API-k Postmannel (2021)való beállításával kapcsolatos blogbejegyzést. Az előző példát a blogbejegyzésben található utasítások és Postman-gyűjtemény használatával teszteltük.

Következő lépések

Regisztráljon az előzetes verzióra egy olyan keresési szolgáltatásra, amely megfelel az előző szakaszban feljegyzett szolgáltatási szintnek és regionális követelményeknek.

A kérés feldolgozása akár két munkanapot is igényel. Ha a szolgáltatás készen áll, hozzon létre egy szemantikai lekérdezést, amely kiértékeli a tartalom teljesítményét.