Tippek az AI-bővítéshez az Azure AI Searchben

Ez a cikk tippeket tartalmaz az AI-bővítés és az indexelés során használt készségkészletek használatának megkezdéséhez.

1. tipp: Egyszerű kezdés és kicsi kezdés

Az Adatok importálása varázsló és az Adatok importálása és vektorizálása varázsló az Azure Portalon egyaránt támogatja az AI-bővítést. Kód írása nélkül létrehozhatja és megvizsgálhatja a bővítési folyamatban használt összes objektumot: indexet, indexelőt, adatforrást és képességkészletet.

Az egyszerű kezdés másik módja egy olyan adatforrás létrehozása, amely csak néhány dokumentumot vagy sort tartalmaz egy táblában, amely az indexelendő dokumentumokra jellemző. A kis adatkészlet a legjobb módszer a problémák megtalálásának és megoldásának sebességének növelésére. Futtassa a mintát a végpontok közötti folyamaton, és ellenőrizze, hogy az eredmények megfelelnek-e az igényeinek. Ha elégedett az eredményekkel, készen áll arra, hogy további fájlokat adjon hozzá az adatforráshoz.

2. tipp: Annak megtekintése, hogy mi működik akkor is, ha hiba történt

Néha egy kis hiba leállítja az indexelőt a sávjaiban. Ez akkor jó, ha egyenként tervezi megoldani a problémákat. Előfordulhat azonban, hogy figyelmen kívül szeretne hagyni egy adott típusú hibát, így az indexelő folytathatja a műveletet, így láthatja, hogy mely folyamatok működnek valójában.

Ha a fejlesztés során figyelmen kívül szeretné hagyni a hibákat, állítsa be maxFailedItems a maxFailedItemsPerBatch -1 értéket az indexelő definíciójának részeként.

{
  // rest of your indexer definition
   "parameters":
   {
      "maxFailedItems":-1,
      "maxFailedItemsPerBatch":-1
   }
}

Feljegyzés

Ajánlott eljárásként állítsa be az és maxFailedItemsPerBatch a maxFailedItems 0 értéket az éles számítási feladatokhoz

3. tipp: Hibakeresési munkamenet használata a problémák elhárításához

A hibakeresési munkamenet egy vizualizációszerkesztő, amely egy képességkészlet függőségi gráfját, bemeneteit és kimeneteit, valamint definícióit jeleníti meg. Úgy működik, hogy egyetlen dokumentumot tölt be a keresési indexből az aktuális indexelővel és képességkészlet-konfigurációval. Ezután futtathatja a teljes készségkészletet, amely egyetlen dokumentumra terjed ki. A hibakeresési munkameneten belül azonosíthatja és megoldhatja a hibákat, érvényesítheti a módosításokat, és véglegesítheti a módosításokat egy szülőképesség-halmazban. Útmutató: Oktatóanyag: hibakeresési munkamenetek.

4. tipp: A várt tartalom nem jelenik meg

Ha hiányzik a tartalom, ellenőrizze, hogy vannak-e elvetett dokumentumok az Azure Portalon. A keresési szolgáltatás oldalán nyissa meg az Indexelőket , és tekintse meg a Docs sikeres oszlopát . Az indexelőzményekre kattintva áttekintheti az egyes hibákat.

Ha a probléma a fájlmérettel kapcsolatos, a következőhöz hasonló hibaüzenet jelenhet meg: a "Blob <fájlnév>" fájlmérete <> bájt, amely meghaladja az aktuális szolgáltatási szint dokumentumkinyerésének maximális méretét." További információ az indexelők korlátairól: Szolgáltatáskorlátok.

A tartalom nem jelenésének második oka lehet a kapcsolódó bemeneti/kimeneti leképezési hibák. A kimeneti cél neve például "Kapcsolatok", de az indexmező neve kisbetűs "személyek". A rendszer 201 sikeres üzenetet adhat vissza a teljes folyamathoz, ezért úgy gondolja, hogy az indexelés sikeres volt, amikor valójában egy mező üres.

5. tipp: A feldolgozás kiterjesztése a maximális futási idő után

A képelemzés még az egyszerű esetekben is nagy számítási igényű, így ha a képek különösen nagyok vagy összetettek, a feldolgozási idő meghaladhatja a maximálisan megengedett időt.

A képességkészletekkel rendelkező indexelők esetében a képességkészletek végrehajtása a legtöbb szint esetében 2 órán belül van leképezve. Ha a képességkészlet feldolgozása ezen időszakon belül nem fejeződik be, az indexelőt 2 órás ismétlődő ütemezés szerint állíthatja be, hogy az indexelő ott dolgozza fel a feldolgozást, ahol abbahagyta.

Az ütemezett indexelés az utolsó ismert jó dokumentumban folytatódik. Ismétlődő ütemezés esetén az indexelő több órán vagy napon keresztül végig tudja haladni a rendszerkép-hátralékon, amíg az összes feldolgozatlan rendszerkép feldolgozásra nem kerül. Az ütemezés szintaxisáról további információt az Indexelő ütemezése című témakörben talál.

Feljegyzés

Ha egy indexelő egy adott ütemezésre van állítva, de minden futtatáskor újra és újra megismétli ugyanazt a dokumentumot, az indexelő ritkábban (legfeljebb 24 óránként egyszer) fog futni, amíg ismét sikeresen nem halad. = Ha úgy véli, hogy kijavította azt a hibát, amely miatt az indexelő elakadt egy adott ponton, elvégezheti az indexelő igény szerinti futtatását, és ha ez sikeresen halad, az indexelő ismét visszatér a megadott ütemezési időközre.

6. tipp: Az indexelési átviteli sebesség növelése

Párhuzamos indexeléshez ossza el az adatokat több tárolóba vagy több virtuális mappába ugyanabban a tárolóban. Ezután hozzon létre több adatforrás- és indexelőpárt. Minden indexelő használhatja ugyanazt a képességkészletet, és ugyanabba a célkeresési indexbe írhat, így a keresési alkalmazásnak nem kell tisztában lennie ezzel a particionálással.

Lásd még