Az AI bemutatása az Azure-ban Cognitive SearchIntroduction to AI in Azure Cognitive Search

Az AI-bővítés az Azure Cognitive Search a képekből, blobokból és egyéb strukturálatlan adatforrásokból származó szöveg kinyerésére szolgáló funkciója – a tartalom gazdagítása, hogy azok kereshetőek legyenek egy indexben vagy egy Tudásbázisban.AI enrichment is a capability of Azure Cognitive Search indexing used to extract text from images, blobs, and other unstructured data sources - enriching the content to make it more searchable in an index or knowledge store. A kinyerést és a dúsítást az indexelési folyamathoz csatolt kognitív képességek valósítják meg.Extraction and enrichment are implemented through cognitive skills attached to an indexing pipeline. A szolgáltatásba beépített kognitív képességek a következő kategóriákba sorolhatók:Cognitive skills built into the service fall into these categories:

  • A természetes nyelvi feldolgozási képességek közé tartozik az entitások felismerése, a nyelvfelismerés, a kulcsfontosságú kifejezés kinyerése, a szöveg-manipuláció és a hangulat észlelése.Natural language processing skills include entity recognition, language detection, key phrase extraction, text manipulation, and sentiment detection. Ezekkel a képességekkel a strukturálatlan szöveg feltételezheti, hogy az indexben kereshető és szűrhető mezőkként leképezett új űrlapok is megadhatók.With these skills, unstructured text can assume new forms, mapped as searchable and filterable fields in an index.

  • A képfeldolgozási képességek közé tartozik az optikai karakterfelismerés (OCR) és a vizuális funkciókazonosítása, például az arc észlelése, a képek értelmezése, a képfelismerés (híres személyek és tereptárgyak) vagy az attribútumok, például a színek vagy a képek tájolása.Image processing skills include Optical Character Recognition (OCR) and identification of visual features, such as facial detection, image interpretation, image recognition (famous people and landmarks) or attributes like colors or image orientation. Az Azure Cognitive Search összes lekérdezési funkciójának használatával szöveget hozhat létre a képtartalom ábrázolásával.You can create text-representations of image content, searchable using all the query capabilities of Azure Cognitive Search.

Dúsítási folyamat diagramjaEnrichment pipeline diagram

Az Azure Cognitive Search kognitív képességei az előre betanított gépi tanulási modelleken alapulnak Cognitive Services API-k: Computer Vision és text Analysis.Cognitive skills in Azure Cognitive Search are based on pre-trained machine learning models in Cognitive Services APIs: Computer Vision and Text Analysis.

A természetes nyelv és a képfeldolgozás az adatfeldolgozási fázisban történik, és az eredmények egy dokumentum összeállításának részévé válnak az Azure Cognitive Search kereshető indexében.Natural language and image processing is applied during the data ingestion phase, with results becoming part of a document's composition in a searchable index in Azure Cognitive Search. Az adatforrások Azure-adatkészletként vannak kialakítva, majd egy indexelési folyamaton keresztül leküldve, amely a szükséges beépített képességekkel rendelkezik.Data is sourced as an Azure data set and then pushed through an indexing pipeline using whichever built-in skills you need. Az architektúra bővíthető, így ha a beépített képességek nem elegendőek, létrehozhat és csatolhat Egyéni képességeket az egyéni feldolgozás integrálásához.The architecture is extensible so if the built-in skills are not sufficient, you can create and attach custom skills to integrate custom processing. Ilyenek például a pénzügy, a tudományos publikációk vagy az orvostudomány egy adott tartományhoz tartozó egyéni entitás-modul vagy dokumentum-osztályozó.Examples might be a custom entity module or document classifier targeting a specific domain such as finance, scientific publications, or medicine.

Megjegyzés

Ha a hatókört a feldolgozás gyakoriságának növelésével, további dokumentumok hozzáadásával vagy további AI-algoritmusok hozzáadásával bővíti, akkor a számlázható Cognitive Services erőforrást kell csatolnia.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Az API-k Cognitive Services-ben való meghívásakor felmerülő díjak, valamint a képek kinyerése a dokumentum repedésének részeként az Azure Cognitive Searchban.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. A dokumentumokból való szöveg kinyerése díjmentes.There are no charges for text extraction from documents.

A beépített készségek elvégzése a meglévő Cognitive Services utólagos elszámolású díjszabás szerinttörténik.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. A rendszerkép kibontásának díjszabását az Azure Cognitive Search díjszabási oldalántalálja.Image extraction pricing is described on the Azure Cognitive Search pricing page.

Mikor kell használni a kognitív képességeketWhen to use cognitive skills

Érdemes megfontolni a beépített kognitív ismeretek használatát, ha a nyers tartalma strukturálatlan szöveg, képtartalom vagy olyan tartalom, amely nyelvi észlelést és fordítást igényel.You should consider using built-in cognitive skills if your raw content is unstructured text, image content, or content that needs language detection and translation. Ha a mesterséges intelligenciát a beépített kognitív ismeretek használatával szeretné feloldani, a keresési és adatelemzési alkalmazásaiban megnövelheti a tartalmat, és növelheti annak értékét és hasznosságát.Applying AI through the built-in cognitive skills can unlock this content, increasing its value and utility in your search and data science apps.

Emellett érdemes lehet egyéni képességet is felvennie, ha olyan nyílt forráskódú, harmadik féltől származó vagy első féltől származó kóddal rendelkezik, amelyet be szeretne építeni a folyamatba.Additionally, you might consider adding a custom skill if you have open-source, third-party, or first-party code that you'd like to integrate into the pipeline. A különböző dokumentumtípusok kiugró jellemzőit azonosító besorolási modellek ebbe a kategóriába tartoznak, de a tartalomhoz hozzáadott csomagok is felhasználhatók.Classification models that identify salient characteristics of various document types fall into this category, but any package that adds value to your content could also be used.

További információ a beépített képességekrőlMore about built-in skills

A beépített képességekkel összeállított készségkészlet jól illeszkedik a következő alkalmazási forgatókönyvekhez:A skillset that's assembled using built-in skills is well suited for the following application scenarios:

  • A teljes szöveges keresést végezni kívánó beolvasott dokumentumok (JPEG).Scanned documents (JPEG) that you want to make full-text searchable. A JPEG-fájlok szövegének azonosításához, kinyeréséhez és betöltéséhez egy optikai karakterfelismerési (OCR) képességet is csatolhat.You can attach an optical character recognition (OCR) skill to identify, extract, and ingest text from JPEG files.

  • Kombinált képpel és szöveggel rendelkező PDF-fájlok.PDFs with combined image and text. A PDF-fájlokban lévő szöveg kinyerhető az indexelés során a dúsítási lépések használata nélkül, de a képek és a természetes nyelvi feldolgozás hozzáadása gyakran jobb eredményt eredményezhet, mint a szabványos indexelés.Text in PDFs can be extracted during indexing without the use of enrichment steps, but the addition of image and natural language processing can often produce a better outcome than a standard indexing provides.

  • Többnyelvű tartalom, amelyre alkalmazni kívánja a nyelvi észlelést és a szöveges fordítást.Multi-lingual content against which you want to apply language detection and possibly text translation.

  • Strukturálatlan vagy részben strukturált dokumentumok, amelyek olyan tartalmat tartalmaznak, amely a nagyobb dokumentumban rejtett jelentéssel vagy kontextussal rendelkezik.Unstructured or semi-structured documents containing content that has inherent meaning or context that is hidden in the larger document.

    A Blobok különösen gyakran tartalmaznak egy olyan nagy méretű tartalmat, amely egyetlen "mező"be van csomagolva.Blobs in particular often contain a large body of content that is packed into a singled "field". Ha rendszerképeket és természetes nyelvi feldolgozási képességeket csatol egy indexelő alkalmazáshoz, létrehozhat olyan új adatokat, amelyek a nyers tartalomban is fennmaradnak, de másképp nem különálló mezőkként.By attaching image and natural language processing skills to an indexer, you can create new information that is extant in the raw content, but not otherwise surfaced as distinct fields. Néhány használatra kész, beépített kognitív képesség, amely segítséget nyújt a kulcsfontosságú kifejezés kinyeréséhez, a hangulat elemzéséhez és az entitások felismeréséhez (személyek, szervezetek és helyszínek).Some ready-to-use built-in cognitive skills that can help: key phrase extraction, sentiment analysis, and entity recognition (people, organizations, and locations).

    Emellett a beépített készségek is használhatók a tartalom átstrukturálása a szöveg felosztása, egyesítése és alakja műveletekkel.Additionally, built-in skills can also be used restructure content through text split, merge, and shape operations.

További információ az egyéni képességekrőlMore about custom skills

Az egyéni képességek olyan összetettebb forgatókönyveket is támogatnak, mint például az űrlapok felismerése vagy az egyéni entitások észlelése az Ön által megadott és az Egyéni szakértelem webes felületénbeburkolt modell használatával.Custom skills can support more complex scenarios, such as recognizing forms, or custom entity detection using a model that you provide and wrap in the custom skill web interface. Az egyéni képességek számos példája például az űrlap-felismerő, a Bing Entity Search APIintegrációja és az egyéni entitások felismerése.Several examples of custom skills include Forms Recognizer, integration of the Bing Entity Search API, and custom entity recognition.

A dúsítási folyamat összetevőiComponents of an enrichment pipeline

A dúsítási folyamat olyan Indexelő eszközökön alapul, amelyek az adatforrásokat térképezik fel, és a végpontok közötti index feldolgozását biztosítják.An enrichment pipeline is based on indexers that crawl data sources and provide end-to-end index processing. A szaktudás mostantól az indexelő anyagokhoz van csatolva, a dokumentumok elfogása és gazdagítása az Ön által meghatározott készségkészlet szerint.Skills are now attached to indexers, intercepting and enriching documents according to the skillset you define. Az indexelés után az Azure Cognitive Search által támogatott összes lekérdezési típusonkeresztül érheti el a tartalmat.Once indexed, you can access content via search requests through all query types supported by Azure Cognitive Search. Ha még nem ismeri az indexeket, ez a szakasz végigvezeti a lépéseken.If you are new to indexers, this section walks you through the steps.

1. lépés: a kapcsolatok és a dokumentumok repedésének fázisaStep 1: Connection and document cracking phase

A folyamat elején strukturálatlan szöveggel vagy nem szöveges tartalommal (például kép és beolvasott dokumentum JPEG-fájlok) rendelkezik.At the start of the pipeline, you have unstructured text or non-text content (such as image and scanned document JPEG files). Az adattáraknak olyan Azure-beli adattárolási szolgáltatásban kell lenniük, amely egy indexelő segítségével érhető el.Data must exist in an Azure data storage service that can be accessed by an indexer. Az indexelő "kiváló" forrás dokumentumokat gyűjthetnek a forrásadatokből származó szöveg kinyeréséhez.Indexers can "crack" source documents to extract text from source data.

A dokumentum repedésének fázisaDocument cracking phase

A támogatott források közé tartozik az Azure Blob Storage, az Azure Table Storage, a Azure SQL Database és az Azure Cosmos DB.Supported sources include Azure blob storage, Azure table storage, Azure SQL Database, and Azure Cosmos DB. A szöveges tartalmat a következő fájltípusokból lehet kinyerni: PDF-fájlok, Word-, PowerPoint-és CSV-fájlok.Text-based content can be extracted from the following file types: PDFs, Word, PowerPoint, CSV files. A teljes listát lásd: támogatott formátumok.For the full list, see Supported formats.

2. lépés: a kognitív képességek és a gazdagodás fázisaStep 2: Cognitive skills and enrichment phase

A gazdagodás az atomi műveleteket végző kognitív képességeken keresztül történik.Enrichment is through cognitive skills performing atomic operations. Ha például egy PDF-fájlból szöveges tartalmat használ, alkalmazhatja az entitás-felismerési nyelvfelismerés vagy a fő kifejezés kinyerése lehetőséget, hogy az indexben olyan új mezőket hozzon létre, amelyek nem érhetők el natív módon a forrásban.For example, once you have text content from a PDF, you can apply entity recognition language detection, or key phrase extraction to produce new fields in your index that are not available natively in the source. A folyamat során használt szaktudás gyűjteményét teljes egészében készségkészletnevezzük.Altogether, the collection of skills used in your pipeline is called a skillset.

Dúsítási fázisEnrichment phase

A készségkészlet a beépített kognitív képességek vagy az Ön által biztosított egyéni képességek , valamint a készségkészlet való kapcsolódás alapján történik.A skillset is based on built-in cognitive skills or custom skills you provide and connect to the skillset. A készségkészlet minimális vagy nagyon összetett lehet, és nem csak a feldolgozás típusát, hanem a műveletek sorrendjét is meghatározhatja.A skillset can be minimal or highly complex, and determines not only the type of processing, but also the order of operations. A készségkészlet és az indexelő részeként definiált mező-hozzárendelések teljes mértékben a dúsítási folyamatot határozzák meg.A skillset plus the field mappings defined as part of an indexer fully specifies the enrichment pipeline. További információ ezekről a darabokról: Készségkészlet definiálása.For more information about pulling all of these pieces together, see Define a skillset.

Belsőleg a folyamat gazdagított dokumentumok gyűjteményét hozza létre.Internally, the pipeline generates a collection of enriched documents. Eldöntheti, hogy a bővített dokumentumok mely részeit kell leképezni a keresési index indexelhető mezőihez.You can decide which parts of the enriched documents should be mapped to indexable fields in your search index. Ha például alkalmazotta a fő kifejezéseket és az entitás-felismerési képességeket, akkor ezek az új mezők a dúsított dokumentum részévé válnak, és az index mezőire képezhetők le.For example, if you applied the key phrases extraction and the entity recognition skills, then those new fields would become part of the enriched document, and they can be mapped to fields on your index. A bemeneti/kimeneti formációkkal kapcsolatos további tudnivalókért tekintse meg a megjegyzéseket .See Annotations to learn more about input/output formations.

KnowledgeStore elem hozzáadása a dúsítások mentéséhezAdd a knowledgeStore element to save enrichments

Keresési REST API-Version = 2019-05 -06 – az előzetes verzió kibővíti a szakértelmével-t egy olyan knowledgeStore-definícióval, amely egy Azure Storage-kapcsolattal és-vetítéssel foglalkozik, amely leírja a dúsítások tárolási módját.Search REST api-version=2019-05-06-Preview extends skillsets with a knowledgeStore definition that provides an Azure storage connection and projections that describe how the enrichments are stored.

Ha egy tudásbázist ad hozzá egy készségkészlet, lehetővé teszi a teljes szöveges kereséstől eltérő forgatókönyvek megjelenítését a bővítések számára.Adding a knowledge store to a skillset gives you the ability to project a representation of your enrichments for scenarios other than full text search. További információ: Knowledge Store (előzetes verzió).For more information, see Knowledge store (preview).

3. lépés: a keresési index és a lekérdezésen alapuló hozzáférésStep 3: Search index and query-based access

A feldolgozás befejezésekor egy olyan keresési index található, amely az Azure Cognitive Searchban teljes mértékben kereshető dokumentumokból áll.When processing is finished, you have a search index consisting of enriched documents, fully text-searchable in Azure Cognitive Search. Az index lekérdezése , hogy a fejlesztők és a felhasználók hogyan érhetik el a folyamat által generált dúsított tartalmat.Querying the index is how developers and users access the enriched content generated by the pipeline.

Index keresési ikonnalIndex with search icon

Az index olyan, mint bármely más, amelyet az Azure Cognitive Search hoz létre: kiegészítheti az egyéni elemzőket, a fuzzy keresési lekérdezések meghívását, a szűrt keresés hozzáadását, illetve a keresési eredmények átalakítására szolgáló pontozási profilokkal való kísérletezést.The index is like any other you might create for Azure Cognitive Search: you can supplement with custom analyzers, invoke fuzzy search queries, add filtered search, or experiment with scoring profiles to reshape the search results.

Az indexek olyan index-sémából jönnek létre, amely meghatározza az adott indexhez csatolt mezőket, attribútumokat és egyéb szerkezeteket, például a pontozási profilokat és a szinonimákat.Indexes are generated from an index schema that defines the fields, attributes, and other constructs attached to a specific index, such as scoring profiles and synonym maps. Az indexek definiálása és feltöltése után a rendszer növekményes módon indexelheti az új és a frissített forrásdokumentum-dokumentumokat.Once an index is defined and populated, you can index incrementally to pick up new and updated source documents. Bizonyos módosítások teljes újraépítést igényelnek.Certain modifications require a full rebuild. Kis adatkészletet kell használnia, amíg a séma kialakítása nem stabil.You should use a small data set until the schema design is stable. A további tudnivalókért lásd az indexek újraépítését ismertető cikket.For more information, see How to rebuild an index.

Alapfunkciók és -fogalmakKey features and concepts

FogalomConcept LeírásDescription HivatkozásokLinks
KészségkészletSkillset A legfelső szintű névvel ellátott erőforrás, amely a szaktudás gyűjteményét tartalmazza.A top-level named resource containing a collection of skills. A készségkészlet a dúsítási folyamat.A skillset is the enrichment pipeline. Egy indexelő indexelése során hívja meg.It is invoked during indexing by an indexer. Lásd: Készségkészlet megadásaSee Define a skillset
Kognitív képességekCognitive skill Egy dúsítási folyamat atomi átalakítása.An atomic transformation in an enrichment pipeline. Gyakran előfordul, hogy egy olyan összetevő, amely kinyeri vagy kikövetkezteti a struktúrát, így fokozza a bemeneti adatok megértését.Often, it is a component that extracts or infers structure, and therefore augments your understanding of the input data. Szinte minden esetben a kimenet Text-alapú, a feldolgozás pedig természetes nyelvi feldolgozás vagy képfeldolgozás, amely a képbemenetek szövegét kinyeri vagy hozza létre.Almost always, the output is text-based and the processing is natural language processing or image processing that extracts or generates text from image inputs. A szaktudás kimenete egy index egy mezőjéhez rendelhető hozzá, vagy az alsóbb rétegbeli dúsítás bemenetként használható.Output from a skill can be mapped to a field in an index, or used as an input for a downstream enrichment. A szaktudás előre definiált és a Microsoft által biztosított, vagy egyéni: Ön által létrehozott és telepített.A skill is either predefined and provided by Microsoft, or custom: created and deployed by you. Beépített kognitív képességekBuilt-in cognitive skills
AdatbányászatData extraction A feldolgozás széles körét fedi le, de az AI-bővítésre is vonatkozik, az entitás-felismerési képesség általában az adatok (entitások) olyan forrásból való kinyerésére szolgál, amely nem biztosítja az adott információt natív módon.Covers a broad range of processing, but pertaining to AI enrichment, the entity recognition skill is most typically used to extract data (an entity) from a source that doesn't provide that information natively. Lásd: entitás-felismerési szakértelem és dokumentum-kinyerési képesség (előzetes verzió)See Entity Recognition Skill and Document Extraction Skill (preview)
KépfeldolgozásImage processing Kikövetkezteti a szöveget egy képből, például felismerhetővé teszi a tereptárgyak felismerését vagy szöveg kinyerését egy képből.Infers text from an image, such as the ability to recognize a landmark, or extracts text from an image. Gyakori példák a beolvasott dokumentumokból (JPEG-fájlokból) származó karakterek feloldására szolgáló OCR-t, illetve az utca nevének felismerését egy utcai aláírást tartalmazó fényképen.Common examples include OCR for lifting characters from a scanned document (JPEG) file, or recognizing a street name in a photograph containing a street sign. Lásd: képelemzési szakértelem vagy OCR-képességSee Image Analysis Skill or OCR Skill
Természetes nyelvek feldolgozásaNatural language processing Szöveg-feldolgozás a szöveges bemenetekkel kapcsolatos információkhoz és adatokhoz.Text processing for insights and information about text inputs. A nyelvfelismerés, a hangulat elemzése és a kulcsfontosságú kifejezés kinyerése a természetes nyelvi feldolgozás alá eső képességek.Language detection, sentiment analysis, and key phrase extraction are skills that fall under natural language processing. Lásd: kulcsszókeresés skill, nyelvfelismerés skill, text Translation skill (előzetes verzió), Hangulatelemzés skillSee Key Phrase Extraction Skill, Language Detection Skill, Text Translation Skill (preview), Sentiment Analysis Skill
DokumentumleképezésDocument cracking Szöveges tartalom kinyerésének vagy létrehozásának folyamata a nem szöveges forrásokból az indexelés során.The process of extracting or creating text content from non-text sources during indexing. Az optikai karakterfelismerés (OCR) egy példa, de általában az alapszintű indexelő funkcióra hivatkozik, mivel az indexelő Kinyeri a tartalmat az alkalmazás fájljaiból.Optical character recognition (OCR) is an example, but generally it refers to core indexer functionality as the indexer extracts content from application files. A forrásfájl helyét biztosító adatforrás és az indexelő definíciója, amely a mezők leképezéseit biztosítja, a dokumentumok repedésének kulcsfontosságú tényezői.The data source providing source file location, and the indexer definition providing field mappings, are both key factors in document cracking. Lásd: Indexelő – áttekintésSee Indexers overview
AlakításábanShaping Összevonhatja a szöveges töredékeket egy nagyobb struktúrába, vagy megfordíthatja a nagyobb szöveges adattömböket egy kezelhető méretre a további alsóbb rétegbeli feldolgozás érdekében.Consolidate text fragments into a larger structure, or conversely break down larger text chunks into a manageable size for further downstream processing. Lásd: formáló képesség, szöveges egyesítési szakértelem, szöveg felosztása készségSee Shaper Skill, Text Merger Skill, Text Split Skill
Továbbfejlesztett dokumentumokEnriched documents Egy átmeneti belső struktúra, amely a feldolgozás során keletkezik, és a végső kimenet egy keresési indexben jelenik meg.A transitory internal structure, generated during processing, with final output reflected in a search index. A készségkészlet határozza meg, hogy mely dúsítások vannak elvégezve.A skillset determines which enrichments are performed. A mező-hozzárendelések határozzák meg, hogy mely adatelemek legyenek hozzáadva az indexhez.Field mappings determine which data elements are added to the index. Ha szeretné, létrehozhat egy tudásbázist, amellyel megőrizheti és felderítheti a dúsított dokumentumokat olyan eszközökkel, mint a Storage Explorer, a Power BI vagy bármely más eszköz, amely az Azure Blob Storage-hoz csatlakozik.Optionally, you can create a knowledge store to persist and explore enriched documents using tools like Storage Explorer, Power BI, or any other tool that connects to Azure Blob storage. Lásd: Knowledge Store (előzetes verzió)See Knowledge store (preview)
IndexelőIndexer Egy webbejáró, amely Kinyeri a kereshető adatokat és metaadatokat egy külső adatforrásból, és feltölti az indexet az index és az adatforrása közötti mező-mező leképezések alapján.A crawler that extracts searchable data and metadata from an external data source and populates an index based on field-to-field mappings between the index and your data source for document cracking. Az AI-bővítésekhez az indexelő meghívja a készségkészlet, és tartalmazza azokat a mező-hozzárendeléseket, amelyek a dúsítási kimenetet társítják az index mezőihez.For AI enrichments, the indexer invokes a skillset, and contains the field mappings associating enrichment output to target fields in the index. Az indexelő definíciója a feldolgozási műveletek összes utasítását és hivatkozását tartalmazza, a folyamat pedig az indexelő futtatásakor lesz meghívva.The indexer definition contains all of the instructions and references for pipeline operations, and the pipeline is invoked when you run the indexer. A további beállításokkal újra felhasználhatja a meglévő feldolgozott tartalmakat, és csak a megváltoztatott lépéseket és képességeket hajthatja végre.With additional configuration, you can re-use existing processed content and execute only those steps and skills that are changed. Lásd: Indexelő és növekményes bővítés (előzetes verzió).See Indexers and Incremental enrichment (preview).
AdatforrásData Source Az indexelő által az Azure-ban támogatott típusok külső adatforráshoz való kapcsolódásra használt objektum.An object used by an indexer to connect to an external data source of supported types on Azure. Lásd: Indexelő – áttekintésSee Indexers overview
IndexIndex Egy megőrzött keresési index az Azure Cognitive Searchban, amely egy olyan index-sémából épül, amely meghatározza a mező szerkezetét és használatát.A persisted search index in Azure Cognitive Search, built from an index schema that defines field structure and usage. Lásd: alapszintű index létrehozásaSee Create a basic index
TudástárKnowledge store Olyan Storage-fiók, amelyben a keresési indexen kívül a dúsított dokumentumok formázható és kiterjeszthetőkA storage account where the enriched documents can be shaped and projected in addition to the search index Lásd: a Knowledge Store bemutatásaSee Introduction to knowledge store
GyorsítótárCache Egy olyan Storage-fiók, amely egy dúsítási folyamat által létrehozott gyorsítótárazott kimenetet tartalmaz.A storage account that contains cached output created by an enrichment pipeline. A gyorsítótár engedélyezése megőrzi a meglévő kimenetet, amelyet a készségkészlet vagy a dúsítási folyamat más összetevőinek módosításai nem érintenek.Enabling the cache preserves existing output that is unaffected by changes to a skillset or other components of the enrichment pipeline. Lásd: növekményes dúsításSee Incremental enrichment

Hogyan kezdjek hozzá?Where do I start?

1. lépés: Azure Cognitive Search-erőforrás létrehozásaStep 1: Create an Azure Cognitive Search resource

2. lépés: próbálja ki néhány rövid útmutatót és példát a gyakorlati tapasztalatokraStep 2: Try some quickstarts and examples for hands-on experience

Javasoljuk, hogy az ingyenes szolgáltatás tanulási célokra legyen elérhető, azonban az ingyenes tranzakciók száma napi 20 dokumentumra korlátozódik.We recommend the Free service for learning purposes, however the number of free transactions is limited to 20 documents per day. Ha a gyors üzembe helyezést és az oktatóanyagot egy nap alatt szeretné futtatni, használjon kisebb fájlméretet (10 dokumentumot), hogy mindkét gyakorlatban illeszkedjen, vagy törölje a gyors útmutatóban vagy oktatóanyagban használt indexelő, hogy a számlálót nulla értékre állítsa.To run both the quickstart and tutorial in one day, use a smaller file set (10 documents) so that you can fit in both exercises, or delete the indexer you used in the quickstart or tutorial to rest the counter to zero.

3. lépés: az API áttekintéseStep 3: Review the API

A REST api-version=2019-05-06 a kéréseken vagy a .NET SDK-ban is használható.You can use REST api-version=2019-05-06 on requests or the .NET SDK. Ha a Knowledge Store-t vizsgálja, használja helyette az előzetes verziójú REST API (api-version=2019-05-06-Preview).If you are exploring knowledge store, use the preview REST API instead (api-version=2019-05-06-Preview).

Ez a lépés a REST API-kkal hozza létre az AI-gazdagító megoldást.This step uses the REST APIs to build an AI enrichment solution. Az AI-bővítéshez csak két API van hozzáadva vagy kibővítve.Only two APIs are added or extended for AI enrichment. Más API-k ugyanazzal a szintaxissal rendelkeznek, mint az általánosan elérhető verziók.Other APIs have the same syntax as the generally available versions.

REST APIREST API LeírásDescription
Adatforrás létrehozásaCreate Data Source Egy olyan erőforrás, amely egy külső adatforrást azonosít, amely a dúsított dokumentumok létrehozásához használt forrásadatokat biztosít.A resource identifying an external data source providing source data used to create enriched documents.
Készségkészlet létrehozása (API-Version = 2019-05-06)Create Skillset (api-version=2019-05-06) Ez az API kifejezetten az AI-bővítésre vonatkozik.This API is specific to AI enrichment. Ez egy olyan erőforrás, amely összehangolja a beépített készségek használatát és a dúsítási folyamat során használt Egyéni kognitív képességeket az indexelés során.It is a resource coordinating the use of built-in skills and custom cognitive skills used in an enrichment pipeline during indexing.
Index létrehozásaCreate Index Egy Azure Cognitive Search indexet kifejező séma.A schema expressing an Azure Cognitive Search index. Az indexben található mezők a forrásadatok mezőire vagy a dúsítási fázisban előállított mezőkre (például az entitások felismerése által létrehozott szervezeti nevekre vonatkozó mezőre) vonatkoznak.Fields in the index map to fields in source data or to fields manufactured during the enrichment phase (for example, a field for organization names created by entity recognition).
Indexelő létrehozása (API-Version = 2019-05-06)Create Indexer (api-version=2019-05-06) Az indexelés során használt összetevőket meghatározó erőforrás: beleértve az adatforrást, a készségkészlet, a forrás-és a közbenső adatstruktúrákat a célként megadott indexbe, valamint magát az indexet.A resource defining components used during indexing: including a data source, a skillset, field associations from source and intermediary data structures to target index, and the index itself. Az indexelő futtatása az adatfeldolgozáshoz és a dúsításhoz használt trigger.Running the indexer is the trigger for data ingestion and enrichment. A kimenet egy olyan keresési index, amely az index sémán alapul, és a forrásadatok alapján van feltöltve, és a szakértelmével-n keresztül dúsított.The output is a search index based on the index schema, populated with source data, enriched through skillsets. Ez a meglévő API a készségkészlet tulajdonság bevonásával kognitív keresési helyzetekben bővíthető.This existing API is extended for cognitive search scenarios with the inclusion of a skillset property.

Ellenőrzőlista: egy tipikus munkafolyamatChecklist: A typical workflow

  1. Az Azure-forrásadatok részhalmaza egy reprezentatív mintának.Subset your Azure source data into a representative sample. Az indexelés időt vesz igénybe, hogy egy kisebb, reprezentatív adatkészletet hozzon létre, majd fokozatosan felépítse a megoldás idejére.Indexing takes time so start with a small, representative data set and then build it up incrementally as your solution matures.

  2. Hozzon létre egy adatforrás-objektumot az Azure Cognitive Searchban, és adjon meg egy kapcsolódási karakterláncot az adatok lekéréséhez.Create a data source object in Azure Cognitive Search to provide a connection string for data retrieval.

  3. Hozzon létre egy készségkészlet a gazdagodás lépéseivel.Create a skillset with enrichment steps.

  4. Adja meg az index sémát.Define the index schema. A mezők gyűjteménye mezőket tartalmaz a forrásadatokből.The Fields collection includes fields from source data. Emellett további mezőket kell kimutatnia, amelyekkel megtarthatja a gazdagodás során létrehozott tartalomhoz generált értékeket.You should also stub out additional fields to hold generated values for content created during enrichment.

  5. Az adatforrásra, a készségkészlet és az indexre hivatkozó Indexelő definiálása.Define the indexer referencing the data source, skillset, and index.

  6. Az indexelő alkalmazásban adja hozzá a outputFieldMappings.Within the indexer, add outputFieldMappings. Ez a szakasz a készségkészlet (a 3. lépésben) lévő kimeneteket a tárgymutató sémájának bemenet mezőibe (a 4. lépésben) képezi le.This section maps output from the skillset (in step 3) to the inputs fields in the index schema (in step 4).

  7. Küldje el az imént létrehozott Indexer -kérést (egy post-kérést a kérelem törzsében lévő indexelő definícióval), hogy kifejezze az indexelő az Azure Cognitive Searchban.Send Create Indexer request you just created (a POST request with an indexer definition in the request body) to express the indexer in Azure Cognitive Search. Ez a lépés az indexelő futtatásának módja, a folyamat meghívása.This step is how you run the indexer, invoking the pipeline.

  8. Lekérdezések futtatása az eredmények kiértékeléséhez és a kód módosítása a szakértelmével, a séma vagy az indexelő konfigurációjának frissítéséhez.Run queries to evaluate results and modify code to update skillsets, schema, or indexer configuration.

  9. Az Indexelő alaphelyzetbe állítása a folyamat újraépítése előtt.Reset the indexer before rebuilding the pipeline.

További információ az adott kérdésekről vagy problémákról: hibaelhárítási tippek.For more information about specific questions or problems, see Troubleshooting tips.

Következő lépésekNext steps