Gyors útmutató: Azure Cognitive Search kognitív készségkészlet létrehozása a Azure PortalQuickstart: Create an Azure Cognitive Search cognitive skillset in the Azure portal

A készségkészlet egy olyan mesterséges intelligencia-alapú szolgáltatás, amely mély tanulási modellekkel gyűjti az információkat és a szerkezetet a nagy, nem megkülönböztetett szöveg-vagy képfájlokból, így a tartalom indexelhető és kereshető az Azure Cognitive Searchban.A skillset is an AI-based feature that uses deep learning models to extract information and structure from large undifferentiated text or image files, making the content both indexable and searchable in Azure Cognitive Search.

Ebben a rövid útmutatóban a készségkészlet létrehozásához egyesíti az Azure-felhőben lévő szolgáltatásokat és az adatszolgáltatásokat.In this quickstart, you'll combine services and data in the Azure cloud to create the skillset. Ha minden megtörtént, a Azure Portal az adatimportálás varázsló futtatásával egyesítheti azt.Once everything is in place, you'll run the Import data wizard in the Azure portal to pull it all together. A végeredmény egy olyan kereshető index, amely az AI-feldolgozás által létrehozott adatokkal van feltöltve, amelyet a portálon (Search Explorer) lehet lekérdezni.The end result is a searchable index populated with data created by AI processing that you can query in the portal (Search explorer).

ElőfeltételekPrerequisites

A Kezdés előtt a következő előfeltételek vonatkoznak:Before you begin, have the following prerequisites in place:

Megjegyzés

Ez a rövid útmutató az AI-hoz készült Azure Cognitive Services is használja.This quickstart also uses Azure Cognitive Services for the AI. Mivel a számítási feladatok olyan kicsik, Cognitive Services a jelenetek mögött, akár 20 tranzakcióra is felhasználható.Because the workload is so small, Cognitive Services is tapped behind the scenes for free processing for up to 20 transactions. Ez azt jelenti, hogy ezt a gyakorlatot anélkül végezheti el, hogy további Cognitive Services erőforrást kellene létrehoznia.This means that you can complete this exercise without having to create an additional Cognitive Services resource.

Az adatai beállításaSet up your data

A következő lépésekben hozzon létre egy BLOB-tárolót az Azure Storage-ban a heterogén tartalmú fájlok tárolásához.In the following steps, set up a blob container in Azure Storage to store heterogeneous content files.

  1. Töltsön le mintaadatokat, amelyek különböző típusú fájlok kis készletéből állnak.Download sample data consisting of a small file set of different types. Bontsa ki a fájlokat.Unzip the files.

  2. Hozzon létre egy Azure Storage-fiókot , vagy keressen egy meglévő fiókot.Create an Azure storage account or find an existing account.

    • Válassza ki ugyanazt a régiót, mint az Azure Cognitive Search a sávszélességgel kapcsolatos költségek elkerülése érdekében.Choose the same region as Azure Cognitive Search to avoid bandwidth charges.

    • Ha később szeretné kipróbálni a Knowledge Store szolgáltatást, akkor válassza a StorageV2 (általános célú v2) fiók típusát, egy másik útmutatóban.Choose the StorageV2 (general purpose V2) account type if you want to try out the knowledge store feature later, in another walkthrough. Egyéb esetben válassza a tetszőleges típust.Otherwise, choose any type.

  3. Nyissa meg a blob Services-lapokat, és hozzon létre egy tárolót.Open the Blob services pages and create a container. Használhatja az alapértelmezett nyilvános hozzáférési szintet.You can use the default public access level.

  4. A tárolóban kattintson a feltöltés gombra, és töltse fel az első lépésben letöltött minta fájlokat.In container, click Upload to upload the sample files you downloaded in the first step. Figyelje meg, hogy számos tartalomtípust tartalmaz, beleértve a képeket és az alkalmazás fájljait, amelyek nem teljes szöveges kereshetők a natív formátumokban.Notice that you have a wide range of content types, including images and application files that are not full text searchable in their native formats.

    Forrásfájlok az Azure Blob Storage-ban

Most már készen áll az adatimportálás varázsló áthelyezésére.You are now ready to move on the Import data wizard.

Az adatimportálás varázsló futtatásaRun the Import data wizard

  1. Jelentkezzen be az Azure Portalra az Azure-fiókjával.Sign in to the Azure portal with your Azure account.

  2. Keresse meg a keresési szolgáltatást , és az Áttekintés lapon kattintson az adatimportálás parancsra a parancssávban, és állítsa be a kognitív dúsítást négy lépésben.Find your search service and on the Overview page, click Import data on the command bar to set up cognitive enrichment in four steps.

    Adatok importálása parancs

1. lépés – adatforrás létrehozásaStep 1 - Create a data source

  1. A Kapcsolódás az adataihoz lapon válassza az Azure Blob Storage lehetőséget, majd válassza ki a létrehozott Storage-fiókot és-tárolót.In Connect to your data, choose Azure Blob storage, select the Storage account and container you created. Adjon nevet az adatforrásnak, a többi beállításnál pedig használja az alapértelmezett értékeket.Give the data source a name, and use default values for the rest.

    Azure Blob-konfiguráció

    Folytassa a következő oldallal.Continue to the next page.

2. lépés – kognitív képességek hozzáadásaStep 2 - Add cognitive skills

Ezután konfigurálja az AI-bővítést az OCR, a képelemzés és a természetes nyelvi feldolgozás meghívásához.Next, configure AI enrichment to invoke OCR, image analysis, and natural language processing.

  1. Ebben a rövid útmutatóban az ingyenes Cognitive Services erőforrást használjuk.For this quickstart, we are using the Free Cognitive Services resource. A mintaadatok 14 fájlból állnak, így az Cognitive Services 20 tranzakció ingyenes kiosztása elegendő ehhez a rövid útmutatóhoz.The sample data consists of 14 files, so the free allotment of 20 transaction on Cognitive Services is sufficient for this quickstart.

    Csatolás Cognitive Services csatolása alapszolgáltatáshoz

  2. Bontsa ki a bővítések hozzáadása lehetőséget, és adjon meg négy választ.Expand Add enrichments and make four selections.

    Képelemzési képességek hozzáadásának engedélyezése az OCR számára a varázsló oldalán.Enable OCR to add image analysis skills to wizard page.

    Állítsa be a részletességet lapokra a szöveg kisebb adattömbökbe való bontásához.Set granularity to Pages to break up text into smaller chunks. Számos szöveges ismeret legfeljebb 5 KB-os bemenetre korlátozódik.Several text skills are limited to 5-KB inputs.

    Válassza az entitások felismerése (személyek, szervezetek, helyszínek) és a képelemzési képességek elemet.Choose entity recognition (people, organizations, locations) and image analysis skills.

    Csatolás Cognitive Services készségkészlet-szolgáltatások kiválasztása

    Folytassa a következő oldallal.Continue to the next page.

3. lépés – az index konfigurálásaStep 3 - Configure the index

Az index tartalmazza a kereshető tartalmat, az adatimportálás varázsló általában az adatforrás mintavételezésével hozza létre a sémát.An index contains your searchable content and the Import data wizard can usually create the schema for you by sampling the data source. Ebben a lépésben tekintse át a generált sémát, és esetleg módosítsa a beállításokat.In this step, review the generated schema and potentially revise any settings. Az alábbi alapértelmezett séma lett létrehozva a bemutató blob adatkészlethez.Below is the default schema created for the demo Blob data set.

Ebben a rövid útmutatóban a varázsló észszerű alapértelmezett beállításokat határoz meg:For this quickstart, the wizard does a good job setting reasonable defaults:

  • Az alapértelmezett mezők a meglévő Blobok tulajdonságain, valamint a dúsítási kimenetet tartalmazó új mezőkön alapulnak (például:,, people organizations locations ).Default fields are based on properties for existing blobs plus new fields to contain enrichment output (for example, people, organizations, locations). Az adattípusok a metaadatokból és az adatok mintavételezésével vannak kikövetkeztetve.Data types are inferred from metadata and by data sampling.

  • Az alapértelmezett dokumentum kulcsa metadata_storage_path (kiválasztva, mert a mező egyedi értékeket tartalmaz).Default document key is metadata_storage_path (selected because the field contains unique values).

  • Az alapértelmezett attribútumok megkereshetők és kereshetők.Default attributes are Retrievable and Searchable. A kereshető szöveg teljes szöveges keresést tesz lehetővé a mezőkben.Searchable allows full text search a field. Lekérhető értékek: a mezőértékek visszaadhatók az eredményekben.Retrievable means field values can be returned in results. A varázsló feltételezi, hogy ezek a mezők lekérhető és kereshetők, mert egy készségkészlet keresztül hozta létre őket.The wizard assumes you want these fields to be retrievable and searchable because you created them via a skillset.

    Indexmezők

Figyelje meg a lekérdezhető attribútumon a mező alapján a sztrájk és a kérdés jelölését content .Notice the strike-through and question mark on the Retrievable attribute by the content field. Szöveg – nagy méretű blob-dokumentumok esetén a content mező a fájl nagy részét tartalmazza, amely akár több ezer sorra is futhat.For text-heavy blob documents, the content field contains the bulk of the file, potentially running into thousands of lines. Az ehhez hasonló mező nem a keresési eredményekben, hanem a bemutatóban kizárható.A field like this is unwieldy in search results and you should exclude it for this demo.

Ha azonban meg kell adnia a fájl tartalmát az ügyfél kódjához, győződjön meg arról, hogy a beolvasható marad lehetőség ki van választva.However, if you need to pass file contents to client code, make sure that Retrievable stays selected. Ellenkező esetben érdemes lehet törölni ezt az attribútumot, content Ha a kinyert elemek (például,, stb people organizations locations .) elegendőek.Otherwise, consider clearing this attribute on content if the extracted elements (such as people, organizations, locations, and so forth) are sufficient.

A mezők beolvasható való megjelölése nem jelenti azt, hogy a mezőnek jelen kell lennie a keresési eredmények között.Marking a field as Retrievable does not mean that the field must be present in the search results. A keresési eredmények összetételét pontosan vezérelheti a $Select lekérdezési paraméterrel, hogy megadja, hogy mely mezők szerepeljenek hozzá.You can precisely control search results composition by using the $select query parameter to specify which fields to include. A Text-nagy méretű mezőkhöz hasonlóan content a $Select paraméter a felügyelhető keresési eredmények az alkalmazás emberi felhasználói számára való biztosítására szolgáló megoldás, miközben az ügyfél kódjának hozzáférése van az összes szükséges információhoz a lekérhető attribútum használatával.For text-heavy fields like content, the $select parameter is your solution for providing manageable search results to the human users of your application, while ensuring client code has access to all the information it needs via the Retrievable attribute.

Folytassa a következő oldallal.Continue to the next page.

4. lépés – az indexelő konfigurálásaStep 4 - Configure the indexer

Az indexelő az indexelési folyamatot irányító magas szintű erőforrás.The indexer is a high-level resource that drives the indexing process. Meghatározza az adatforrás nevét, a célként megadott indexet és a végrehajtás gyakoriságát.It specifies the data source name, a target index, and frequency of execution. Az adatimportálás varázsló több objektumot hoz létre, és ezek mindig egy indexelő, amelyet többször is futtathat.The Import data wizard creates several objects, and of them is always an indexer that you can run repeatedly.

  1. Az Indexelő lapon fogadja el az alapértelmezett nevet, majd kattintson az egyszeres ütemterv lehetőségre, hogy azonnal fusson.In the Indexer page, you can accept the default name and click the Once schedule option to run it immediately.

    Az indexelő definíciója

  2. Kattintson a Submit (Küldés ) gombra az indexelő létrehozásához és egyidejű futtatásához.Click Submit to create and simultaneously run the indexer.

Figyelő állapotaMonitor status

A kognitív képességek indexelése hosszabb időt vesz igénybe, mint a szokásos szöveges indexelés, különösen az OCR és a képelemzés.Cognitive skills indexing takes longer to complete than typical text-based indexing, especially OCR and image analysis. A folyamat figyeléséhez nyissa meg az Áttekintés lapot, és kattintson a lap közepén található Indexelő elemre.To monitor progress, go to the Overview page and click Indexers in the middle of page.

Azure Cognitive Search értesítés

A figyelmeztetések a tartalomtípusok széles köre miatt normálisak.Warnings are normal given the wide range of content types. Egyes tartalomtípusok nem érvényesek bizonyos szakismeretekhez és alacsonyabb szinten, mint az Indexelő korlátainakmegtapasztalása.Some content types aren't valid for certain skills and on lower tiers it's common to encounter indexer limits. A 32 000 karakterből álló csonkolt értesítések például az ingyenes szinten indexelő korlátot képeznek.For example, truncation notifications of 32,000 characters are an indexer limit on the Free tier. Ha a bemutatót egy magasabb szintű szinten futtatta, sok csonkolt figyelmeztetés fog elindulni.If you ran this demo on a higher tier, many truncation warnings would go away.

A figyelmeztetések és hibák vizsgálatához kattintson a figyelmeztetési állapotra az indexelő listában a végrehajtási Előzmények lap megnyitásához.To check warnings or errors, click on the Warning status on the Indexers list to open the Execution History page.

Ezen az oldalon kattintson ismét a figyelmeztetési állapot elemre az alább láthatóhoz hasonló figyelmeztetések listájának megtekintéséhez.On that page, click Warning status again to view the list of warnings similar to the one shown below.

Indexelő figyelmeztetési lista

A részletek akkor jelennek meg, amikor egy adott állapotjelző sorra kattint.Details appear when you click a specific status line. Ez a figyelmeztetés azt mondja, hogy az egyesítés leállt a maximális küszöb elérése után (ez az adott PDF-fájl nagy).This warning says that that merging stopped after reaching a maximum threshold (this particular PDF is large).

Figyelmeztetés részletei

Lekérdezés a Keresési ablakbanQuery in Search explorer

Az index létrehozása után lekérdezéseket futtathat az eredmények visszaküldéséhez.After an index is created, you can run queries to return results. A portálon használja a keresési Explorert ehhez a feladathoz.In the portal, use Search explorer for this task.

  1. A keresési szolgáltatás Irányítópult lapján kattintson a parancssávon található Keresési ablak elemre.On the search service dashboard page, click Search explorer on the command bar.

  2. A létrehozott index kiválasztásához kattintson az Index módosítása lehetőségre az oldal tetején.Select Change Index at the top to select the index you created.

  3. Adja meg a keresési karakterláncot az index lekérdezéséhez, például: search=Microsoft&$select=people,organizations,locations,imageTags .Enter a search string to query the index, such as search=Microsoft&$select=people,organizations,locations,imageTags.

Az eredményeket JSON-ként adja vissza, amely részletes és nehezen olvasható, különösen az Azure-blobokból származó nagyméretű dokumentumokban.Results are returned as JSON, which can be verbose and hard to read, especially in large documents originating from Azure blobs. Néhány tipp az eszközön való kereséshez a következő technikákat tartalmazza:Some tips for searching in this tool include the following techniques:

  • Hozzáfűzéssel $select adja meg, hogy mely mezők szerepeljenek az eredmények között.Append $select to specify which fields to include in results.
  • A CTRL-F billentyűkombinációval keresheti meg az adott tulajdonságokat vagy kifejezéseket a JSON-n belül.Use CTRL-F to search within the JSON for specific properties or terms.

A lekérdezési karakterláncok megkülönböztetik a kis-és nagybetűket, így ha "ismeretlen mező" üzenetet kap, a név és az eset ellenőrzéséhez ellenőrizze a mezők vagy az index definícióját (JSON) .Query strings are case-sensitive so if you get an "unknown field" message, check Fields or Index Definition (JSON) to verify name and case.

Keresési ablak – példa

Legfontosabb ismeretekTakeaways

Most létrehozta az első készségkészlet, és fontos fogalmakat tanult meg, amelyek hasznosak lehetnek a saját adataival bővített keresési megoldások prototípusához.You've now created your first skillset and learned important concepts useful for prototyping an enriched search solution using your own data.

Az általunk közvetíteni kívánt legfontosabb alapelvek egyike az Azure-adatforrásoktól való függőség.Some key concepts that we hope you picked up include the dependency on Azure data sources. Egy készségkészlet egy indexelő van kötve, és az indexelő az Azure és a forrás-specifikus.A skillset is bound to an indexer, and indexers are Azure and source-specific. Bár ez a rövid útmutató az Azure Blob Storage-ot használja, más Azure-adatforrások használata is lehetséges.Although this quickstart uses Azure Blob storage, other Azure data sources are possible. További információ: Indexelő az Azure Cognitive Searchban.For more information, see Indexers in Azure Cognitive Search.

Egy másik fontos szempont, hogy a képességek többek között a tartalomtípusok és a heterogén tartalom használata esetén is kimaradnak.Another important concept is that skills operate over content types, and when working with heterogeneous content, some inputs will be skipped. Emellett előfordulhat, hogy a nagyméretű fájlok vagy mezők túllépik a szolgáltatási szintek indexelő korlátait.Also, large files or fields might exceed the indexer limits of your service tier. A figyelmeztetések az események bekövetkezésekor normálisan jelennek meg.It's normal to see warnings when these events occur.

A kimenet egy keresési indexre van irányítva, és az indexelés során és az index egyes mezőiben létrehozott név-érték párok között van leképezés.Output is directed to a search index, and there is a mapping between name-value pairs created during indexing and individual fields in your index. Belsőleg a portál jegyzeteket állít be és definiál egy képességcsoportot, amellyel megalapozza a műveletek sorrendjét és az általános folyamatot.Internally, the portal sets up annotations and defines a skillset, establishing the order of operations and general flow. Ezeket a lépéseket a rendszer elrejti a portálon, ám az alapelvek ismerete fontos, amikor hozzálát a kód írásához.These steps are hidden in the portal, but when you start writing code, these concepts become important.

Végezetül megtanulta, hogy az index lekérdezésével ellenőrizheti a tartalmat.Finally, you learned that can verify content by querying the index. A végén az Azure Cognitive Search egy kereshető indexet tartalmaz, amelyet az egyszerű vagy teljes kibővített lekérdezési szintaxishasználatával lehet lekérdezni.In the end, what Azure Cognitive Search provides is a searchable index, which you can query using either the simple or fully extended query syntax. A bővített mezőket tartalmazó index ugyanúgy működik, akár az összes többi.An index containing enriched fields is like any other. Ha standard vagy Egyéni elemzőket, pontozási profilokat, szinonimákat, sokoldalú szűrőket, Geo-keresést vagy bármely más Azure Cognitive Search funkciót szeretne beépíteni, akkor természetesen megteheti.If you want to incorporate standard or custom analyzers, scoring profiles, synonyms, faceted filters, geo-search, or any other Azure Cognitive Search feature, you can certainly do so.

Az erőforrások eltávolításaClean up resources

Ha a saját előfizetésében dolgozik, érdemes az egyes projektek végén eldöntenie, hogy szüksége lesz-e még a létrehozott erőforrásokra.When you're working in your own subscription, it's a good idea at the end of a project to identify whether you still need the resources you created. A továbbra is futó erőforrások költségekkel járhatnak.Resources left running can cost you money. Az erőforrásokat törölheti egyesével, vagy az erőforráscsoport törlésével eltávolíthatja a benne lévő összes erőforrást is.You can delete resources individually or delete the resource group to delete the entire set of resources.

A bal oldali navigációs panelen a minden erőforrás vagy erőforráscsoport hivatkozás használatával megkeresheti és kezelheti az erőforrásokat a portálon.You can find and manage resources in the portal, using the All resources or Resource groups link in the left-navigation pane.

Ha ingyenes szolgáltatást használ, ne feledje, hogy Ön legfeljebb három indexet, indexelő és adatforrást használhat.If you are using a free service, remember that you are limited to three indexes, indexers, and data sources. A portálon törölheti az egyes elemeket, hogy a korlát alatt maradjon.You can delete individual items in the portal to stay under the limit.

Következő lépésekNext steps

Szakértelmével a portál, a .NET SDK vagy a REST API használatával hozhat létre.You can create skillsets using the portal, .NET SDK, or REST API. Az ismeretek megismeréséhez próbálja ki a REST API a Poster és a több mintaadatok használatával.To further your knowledge, try the REST API using Postman and more sample data.

Tipp

Ha szeretné megismételni ezt a gyakorlatot, vagy próbáljon meg egy másik AI-bővítési bemutatót használni, törölje az indexelő a portálon.If you want to repeat this exercise or try a different AI enrichment walkthrough, delete the indexer in the portal. Az indexelő törlése visszaállítja az ingyenes napi tranzakció számlálóját a Cognitive Services feldolgozáshoz.Deleting the indexer resets the free daily transaction counter back to zero for Cognitive Services processing.