Mi az Azure AI Search?

Az Azure AI Search (korábbi nevén "Azure Cognitive Search") a hagyományos és generatív AI-keresési alkalmazásokban a felhasználók által birtokolt tartalmakkal szemben nagy léptékben biztosít biztonságos információlekérést.

Az információk lekérése minden olyan alkalmazás számára alapvető fontosságú, amely szöveget és vektorokat jelenít meg. Gyakori forgatókönyvek például a katalógus- vagy dokumentumkeresés, az adatfeltárás és az egyre inkább csevegési stílusú alkalmazások a védett földelési adatokkal szemben. Keresési szolgáltatás létrehozásakor a következő képességeket használhatja:

  • Keresőprogram vektoros kereséshez, teljes szöveges és hibrid kereséshez keresési indexen keresztül
  • Részletes indexelés integrált adattömbökkel és vektorizálással (előzetes verzió), szöveg lexikális elemzése és opcionális AI-bővítés tartalomkinyeréshez és átalakításhoz
  • Részletes lekérdezési szintaxis vektoros lekérdezésekhez, szöveges kereséshez, hibrid lekérdezésekhez, zavaros kereséshez, automatikus kiegészítéshez, geokereséshez és egyéb
  • Azure-skálázás, biztonság és elérés
  • Azure-integráció az adatrétegben, a gépi tanulási rétegben, az Azure AI-szolgáltatásokban és az Azure OpenAI-ban

Architektúra szerint a keresési szolgáltatás a nem indexelt adatokat tartalmazó külső adattárak és az ügyfélalkalmazás között helyezkedik el, amely lekérdezési kérelmeket küld egy keresési indexnek, és kezeli a választ.

Azure AI Search-architektúra

Az ügyfélalkalmazásban a keresési felület az Azure AI Search API-ival van definiálva, és tartalmazhat relevanciahangolást, szemantikai rangsorolást, automatikus kiegészítést, szinonimaegyezést, homályos egyeztetést, mintaegyezést, szűrést és rendezést.

Az Azure-platformon az Azure AI Search integrálható más Azure-szolgáltatásokkal olyan indexelők formájában, amelyek automatizálják az Azure-adatforrásokból történő adatbetöltést/-lekérést, valamint az Azure AI-szolgáltatásokból származó, fogyasztható AI-t( például kép- és természetes nyelvi feldolgozást), vagy az Azure Machine-Tanulás vagy az Azure Functionsbe csomagolt egyéni AI-t.

Keresési szolgáltatáson belül

A keresési szolgáltatásban a két elsődleges számítási feladat az indexelés és a lekérdezés.

  • Az indexelés olyan beviteli folyamat, amely betölti a tartalmat a keresési szolgáltatásba, és kereshetővé teszi azt. A bejövő szöveg belsőleg tokenekké lesz feldolgozva, és invertált indexekben van tárolva, a bejövő vektorok pedig vektorindexekben vannak tárolva. Az Azure AI Search által indexelhető dokumentumformátum a JSON. Feltöltheti az összegyűjtött JSON-dokumentumokat, vagy indexelővel lekérheti és szerializálhatja az adatokat a JSON-ban.

    Az alkalmazott AI egy képességkészleten keresztül kibővíti az indexelést kép- és nyelvi modellekkel. Ha képeket vagy nagyméretű strukturálatlan szöveget tartalmaz a forrásdokumentumban, csatolhat olyan képességeket, amelyek OCR-t végeznek, leírják a képeket, a szerkezetet következtetik, szöveget fordítanak le stb. Olyan készségeket is csatolhat, amelyek adatrészletezést és vektorizálást végeznek.

  • A lekérdezés akkor fordulhat elő, ha egy index kereshető tartalommal van feltöltve, amikor az ügyfélalkalmazás lekérdezési kéréseket küld egy keresési szolgáltatásnak, és kezeli a válaszokat. Minden lekérdezés végrehajtása egy ön által vezérelt keresési indexen keresztül történik.

    A szemantikai rangsor a lekérdezések végrehajtásának kiterjesztése. Nyelvi megértést ad a keresési eredmények feldolgozásához, így a szemantikailag legrelevánsabb találatok a legfelülre mutatnak.

Az Azure AI Search a következő alkalmazásforgatókönyvekhez használható:

  • A hagyományos teljes szöveges kereséshez és a következő generációs vektorok hasonlóságának kereséséhez használható. Adja vissza a generatív AI-alkalmazásokat olyan információlekéréssel, amely kihasználja a kulcsszó- és hasonlósági keresés erejét. Mindkét mód használata a legrelevánsabb eredmények lekéréséhez.

  • Heterogén tartalom összevonása egy felhasználó által definiált és feltöltött keresési indexbe, amely vektorokból és szövegből áll. Ön a tulajdonosa, és szabályozza, hogy mi kereshető.

  • Adatrészletezés és vektorizálás integrálása generatív AI- és RAG-alkalmazásokhoz.

  • Részletes hozzáférés-vezérlés alkalmazása a dokumentum szintjén.

  • Indexelési és lekérdezési számítási feladatok kiszervezése egy dedikált keresési szolgáltatásra.

  • Egyszerűen implementálhatja a kereséssel kapcsolatos funkciókat: relevanciahangolás, részletes navigáció, szűrők (beleértve a térbeli keresést), szinonimák leképezése és automatikus kiegészítés.

  • Alakítsa át az Azure Blob Storage-ban vagy az Azure Cosmos DB-ben tárolt nagyméretű, nem közömbös szöveg- vagy képfájlokat vagy alkalmazásfájlokat kereshető adattömbökké. Ez az indexelés során olyan kognitív készségekkel érhető el, amelyek külső feldolgozást adnak hozzá az Azure AI-ből.

  • Nyelvi vagy egyéni szövegelemzés hozzáadása. Ha nem angol nyelvű tartalommal rendelkezik, az Azure AI Search támogatja a Lucene-elemzőket és a Microsoft természetes nyelvi processzorokat is. Az elemzőket úgy is konfigurálhatja, hogy a nyers tartalom speciális feldolgozását érje el, például szűrje ki az ékezeteket, vagy felismerje és megőrizze a sztringek mintáit.

Az egyes funkciókkal kapcsolatos további információkért lásd az Azure AI Search funkcióit

Az első lépések

A funkciók az Azure Portalon, az egyszerű REST API-kon vagy az Azure SDK-kon, például az Azure SDK for .NET-en keresztül érhetők el. Az Azure Portal támogatja a szolgáltatásfelügyeletet és a tartalomkezelést az indexek és képességkészletek prototípus-készítési és lekérdezési eszközeivel.

Az alapvető keresési funkciók végpontok közötti feltárása négy lépésben végezhető el:

  1. Válasszon egy réteget és egy régiót. Előfizetésenként egy ingyenes keresési szolgáltatás engedélyezett. Az összes gyorsútmutató elvégezhető az ingyenes szinten. További kapacitáshoz és képességekhez számlázható rétegre lesz szüksége.

  2. Keresési szolgáltatás létrehozása az Azure Portalon.

  3. Kezdje az Adatok importálása varázslóval. Válasszon ki egy beépített mintát vagy egy támogatott adatforrást az indexek percek alatt történő létrehozásához, betöltéséhez és lekérdezéséhez.

  4. Fejezze be a Kereséskezelőt egy portálügyféllel az imént létrehozott keresési index lekérdezéséhez.

Másik lehetőségként létrehozhat, betölthet és lekérdezhet egy keresési indexet atomi lépésekben:

  1. Keresési index létrehozása a portál, a REST API, a .NET SDK vagy egy másik SDK használatával. Az indexséma határozza meg a kereshető tartalom struktúráját.

  2. Töltsön fel tartalmakat a "leküldéses" modell használatával, hogy JSON-dokumentumokat küldjön le bármely forrásból, vagy használja a "lekéréses" modellt (indexelőket), ha a forrásadatok támogatott típusúak.

  3. Index lekérdezése a Portál keresőprogramjával, a REST API-val, a .NET SDK-val vagy egy másik SDK-val.

Tipp.

Összetett vagy egyéni megoldásokkal kapcsolatos segítségért forduljon egy olyan partnerhez, aki mély szakértelemmel rendelkezik az Azure AI Search technológiában.

Keresési beállítások összehasonlítása

Az ügyfelek gyakran kérdezik meg, hogy az Azure AI Search hogyan hasonlít össze más kereséssel kapcsolatos megoldásokkal. Az alábbi táblázat összefoglalja a fő eltéréseket.

Más szolgáltatás Fő eltérések
Microsoft Search Microsoft Keresés a Microsoft 365 által hitelesített felhasználók számára készült, akiknek tartalmakat kell lekérdezni a SharePointban. Az Azure AI Search lekéri a tartalmakat az Azure-ban és bármely JSON-adatkészletben.
Bing A Bing API-k lekérdezik Bing.com indexeit az egyező kifejezésekhez. Az Azure AI Search a tartalommal feltöltött indexek között keres. Ön szabályozza az adatbetöltést és a sémát.
Adatbázis-keresés Az Azure SQL teljes szöveges kereséssel és vektorkereséssel rendelkezik. Az Azure Cosmos DB szöveges kereséssel és vektorkereséssel is rendelkezik. Az Azure AI Search vonzó alternatívává válik, ha olyan funkciókra van szüksége, mint a relevancia finomhangolása vagy a heterogén forrásokból származó tartalmak. Az erőforrás-kihasználás is egy lényeges különbség. Az indexelés és a lekérdezések számításigényes. A dbMS-ből való keresés kiszervezése megőrzi a rendszererőforrásokat a tranzakciófeldolgozáshoz.
Dedikált keresési megoldás Feltéve, hogy a teljes spektrumú, dedikált keresés mellett döntött, a végső kategorikus összehasonlítás a keresési technológiák között van. A felhőszolgáltatók körében az Azure AI Search a legerősebb a vektoros, kulcsszó- és hibrid számítási feladatokhoz az Azure-beli tartalmakon keresztül, olyan alkalmazások esetében, amelyek elsősorban az információlekérésre és a tartalomnavigációra is támaszkodnak.

A legfőbb előnyök közé tartoznak az alábbiak:

  • Mondatok, képek, grafikonok és egyebek tárolására, indexelására és keresésére szolgáló vektorok beágyazása.
  • A keresési lekérdezésekhez szemantikailag hasonló információkat kereshet, még akkor is, ha a keresési kifejezések nem pontosak.
  • Használja a hibrid keresést a kulcsszó- és vektorkeresés legjobb kihasználásához.
  • Relevanciahangolás szemantikai rangsorolással és pontozási profilokkal.
  • Adatintegráció (crawlerek) az indexelési rétegben.
  • Azure AI-integráció olyan átalakításokhoz, amelyek kereshetővé teszik a tartalomszöveget és a vektorokat.
  • A Microsoft Entra biztonságos a megbízható kapcsolatokhoz, és az Azure Private Link a privát kapcsolatokhoz az internet nélküli forgatókönyvekben.
  • Teljes keresési élmény: Nyelvi és egyéni szövegelemzés 56 nyelven. A lekérdezések és a javasolt eredmények és szinonimák szűrése, automatikus kiegészítése.
  • Azure-skálázás, megbízhatóság és globális elérés.