Gyorsítótárazás engedélyezése növekményes bővítéshez az Azure AI Searchben

Fontos

Ez a funkció nyilvános előzetes verzióban, kiegészítő használati feltételek mellett érhető el. Az előzetes REST API támogatja ezt a funkciót.

Ez a cikk bemutatja, hogyan vehet fel gyorsítótárazást egy bővítési folyamathoz, hogy anélkül módosíthatja az alsóbb rétegbeli bővítés lépéseit, hogy minden alkalommal újra kellene építenie. Alapértelmezés szerint a képességkészlet állapot nélküli, és összetételének bármely részének módosítása az indexelő teljes újrafuttatását igényli. A bővítőgyorsítótár használatával az indexelő meghatározhatja, hogy a dokumentumfa mely részeit kell frissíteni a képességkészletben vagy az indexelődefiníciókban észlelt változások alapján. A meglévő feldolgozott kimenetek megmaradnak és újra felhasználhatók, ahol csak lehetséges.

A gyorsítótárazott tartalom az Ön által megadott fiókadatok alapján kerül az Azure Storage-ba. A névvel ellátott ms-az-search-indexercache-<alpha-numerc-string>tároló az indexelő futtatásakor jön létre. A keresési szolgáltatás által felügyelt belső összetevőnek kell tekinteni, és nem módosítható.

Előfeltételek

  • Azure Storage a gyorsítótárazott gazdagítások tárolásához. A tárfióknak általános célú v2-nek kell lennie.

  • Csak blobindexelés esetén, ha szinkronizált dokumentum eltávolítására van szüksége mind a gyorsítótárból, mind az indexből, amikor blobokat töröl az adatforrásból, engedélyezze a törlési szabályzatot az indexelőben. A szabályzat nélkül a gyorsítótárból való dokumentumtörlés nem támogatott.

Ismernie kell az indexelők beállítását. Kezdje az indexelő áttekintésével, majd folytassa a készségkészletekkel a bővítési folyamatok megismeréséhez. A főbb fogalmakkal kapcsolatos további háttérért lásd a növekményes bővítést.

Figyelemfelhívás

Ha a SharePoint Online indexelőt (előzetes verzió) használja, kerülje a növekményes bővítést. Bizonyos körülmények között a gyorsítótár érvénytelenné válik, és az indexelő alaphelyzetbe állítását és futtatását igényli, ha úgy dönt, hogy újra betölti.

Engedélyezés új indexelőkön

Az indexelők gazdagítási gyorsítótárának engedélyezéséhez használhatja az Azure Portalt, az előzetes verziójú API-kat vagy a béta Azure SDK-kat.

  1. A bal oldalon válassza az Indexelők lehetőséget, majd az Indexelő hozzáadása lehetőséget.

  2. Adjon meg egy indexelőnevet és egy meglévő indexet, adatforrást és készségkészletet.

  3. Engedélyezze a növekményes gyorsítótárazást, és állítsa be az Azure Storage-fiókot.

    Screenshot of the portal option for enrichment cache.

Engedélyezés meglévő indexelőkön

Az olyan meglévő indexelők esetében, amelyek már rendelkeznek képességkészletekkel, a következő lépésekkel adhat hozzá gyorsítótárazást. Egyszeri műveletként állítsa alaphelyzetbe és futtassa újra az indexelőt teljes egészében a gyorsítótár betöltéséhez.

1. lépés: Az indexelő definíciójának lekérése

Kezdje egy érvényes, munkaindexelővel, amely ezeket az összetevőket tartalmazza: adatforrás, képességkészlet, index. API-ügyfél használatával küldjön get Indexer kérést az indexelő lekéréséhez. Ha az előzetes verziójú API-t használja a GET indexelőhöz, a rendszer automatikusan hozzáad egy null értékű "cache" tulajdonságot a definícióhoz.

GET https://[YOUR-SEARCH-SERVICE].search.windows.net/indexers/[YOUR-INDEXER-NAME]?api-version=2021-04-30-Preview
    Content-Type: application/json
    api-key: [YOUR-ADMIN-KEY]

2. lépés: A gyorsítótár tulajdonságának beállítása

Az indexdefinícióban módosítsa a "gyorsítótárat", hogy tartalmazza a következő kötelező és nem kötelező tulajdonságokat:

  • (Kötelező) storageConnectionString Azure Storage-kapcsolati sztring kell beállítani.
  • (Nem kötelező) enableReprocessing logikai tulajdonság (true alapértelmezés szerint) azt jelzi, hogy a növekményes bővítés engedélyezve van. Állítsa be, false ha fel szeretné függeszteni a növekményes feldolgozást, miközben más erőforrás-igényes műveletek, például az új dokumentumok indexelése folyamatban vannak, majd visszavált a későbbire true .
POST https://[service name].search.windows.net/indexers?api-version=2021-04-30-Preview
    {
        "name": "<YOUR-INDEXER-NAME>",
        "targetIndexName": "<YOUR-INDEX-NAME>",
        "dataSourceName": "<YOUR-DATASOURCE-NAME>",
        "skillsetName": "<YOUR-SKILLSET-NAME>",
        "cache" : {
            "storageConnectionString" : "<YOUR-STORAGE-ACCOUNT-CONNECTION-STRING>",
            "enableReprocessing": true
        },
        "fieldMappings" : [],
        "outputFieldMappings": [],
        "parameters": []
    }

3. lépés: Az indexelő alaphelyzetbe állítása

Az indexelő alaphelyzetbe állítása a meglévő indexelők növekményes bővítésekor szükséges annak biztosítása érdekében, hogy minden dokumentum konzisztens állapotban legyen. Ehhez a feladathoz használhatja a portált vagy egy API-ügyfelet.

POST https://[YOUR-SEARCH-SERVICE].search.windows.net/indexers/[YOUR-INDEXER-NAME]/reset?api-version=2021-04-30-Preview
    Content-Type: application/json
    api-key: [YOUR-ADMIN-KEY]

4. lépés: Az indexelő mentése

Frissítse az Indexelőt (2021-04-30-Preview) egy PUT-kéréssel, amelyben a kérés törzse tartalmazza a "gyorsítótárat".

PUT https://[YOUR-SEARCH-SERVICE].search.windows.net/indexers/[YOUR-INDEXER-NAME]?api-version=2021-04-30-Preview
    Content-Type: application/json
    api-key: [YOUR-ADMIN-KEY]
    {
        "name" : "<YOUR-INDEXER-NAME>",
        ...
        "cache": {
            "storageConnectionString": "<YOUR-STORAGE-ACCOUNT-CONNECTION-STRING>",
            "enableReprocessing": true
        }
    }

Ha most újabb GET kérést ad ki az indexelőre, a szolgáltatás válasza tartalmaz egy ID tulajdonságot a gyorsítótár-objektumban. Az alfanumerikus sztring hozzá van fűzve a tároló nevéhez, amely tartalmazza az indexelő által feldolgozott dokumentumok összes gyorsítótárazott eredményét és köztes állapotát. Az azonosítóval egyedileg nevezhető el a gyorsítótár a Blob Storage-ban.

    "cache": {
        "ID": "<ALPHA-NUMERIC STRING>",
        "enableReprocessing": true,
        "storageConnectionString": "DefaultEndpointsProtocol=https;AccountName=<YOUR-STORAGE-ACCOUNT>;AccountKey=<YOUR-STORAGE-KEY>;EndpointSuffix=core.windows.net"
    }

5. lépés: Az indexelő futtatása

Az indexelő futtatásához használhatja a portált vagy az API-t. A portálon az indexelők listájában válassza ki az indexelőt, és válassza a Futtatás lehetőséget. A portál használatának egyik előnye, hogy figyelheti az indexelő állapotát, megfigyelheti a feladat időtartamát és a dokumentumok feldolgozásának időtartamát. A portáloldalak néhány percenként frissülnek.

Másik lehetőségként a REST használatával futtathatja az indexelőt:

POST https://[YOUR-SEARCH-SERVICE].search.windows.net/indexers/[YOUR-INDEXER-NAME]/run?api-version=2020-06-30-Preview
Content-Type: application/json
api-key: [YOUR-ADMIN-KEY]

Feljegyzés

Az indexelő alaphelyzetbe állítása és újrafuttatása teljes újraépítést eredményez, hogy a tartalom gyorsítótárazható legyen. Minden kognitív bővítés újrafut az összes dokumentumon. A gazdagított tartalom gyorsítótárból való újrafelhasználása a gyorsítótár betöltése után kezdődik.

Gyorsítótárazott kimenet ellenőrzése

Keresse meg a gyorsítótárat az Azure Storage-ban a Blob-tároló alatt. A tároló neve .ms-az-search-indexercache-<some-alphanumeric-string>

A gyorsítótárat egy indexelő hozza létre és használja. Tartalma nem olvasható emberi tartalommal.

Annak ellenőrzéséhez, hogy a gyorsítótár működik-e, módosítsa a képességkészletet, és futtassa az indexelőt, majd hasonlítsa össze a végrehajtási idő és a dokumentumszám előtti és utáni metrikákat.

A képelemzést és a beolvasott dokumentumok optikai karakterfelismerését (OCR) tartalmazó készségkészletek jó teszteseteket tesznek lehetővé. Ha módosít egy alsóbb rétegbeli szöveget, vagy bármilyen olyan készséget, amely nem képpel kapcsolatos, az indexelő lekérheti az összes korábban feldolgozott kép- és OCR-tartalmat a gyorsítótárból, és csak a szerkesztés által jelzett szöveggel kapcsolatos módosításokat frissítheti és feldolgozhatja. Az indexelő végrehajtási dokumentumainak számában, rövidebb végrehajtási időkben és kevesebb díjban számíthat kevesebb dokumentumra.

A cog-search-demo oktatóanyagokban használt fájlkészlet hasznos teszteset, mivel 14 különböző formátumú JPG, PNG, HTML, DOCX, PPTX és más típusú fájlt tartalmaz. es A növekményes bővítés megvalósíthatósági teszteléséhez váltson en át vagy másik nyelvre a szövegfordítási jártasságban.

Gyakori hibák

A következő hiba akkor fordul elő, ha elfelejtette megadni az előzetes verziójú API-verziót a kérelemben:

"The request is invalid. Details: indexer : A resource without a type name was found, but no expected type was specified. To allow entries without type information, the expected type must also be specified when the model is specified."

Ha hiányzik egy indexelő követelmény, 400-ra vonatkozó hibás kérési hiba is bekövetkezik. A hibaüzenet megadja a hiányzó függőségeket.

Következő lépések

A növekményes bővítés olyan indexelőkre alkalmazható, amelyek készségkészleteket tartalmaznak, és újrafelhasználható tartalmakat biztosítanak mind az indexek, mind a tudástárak számára. Az alábbi hivatkozások további információt nyújtanak a gyorsítótárazással és a képességkészletekkel kapcsolatban.