Snelstartgids: een Azure Cognitive Search cognitieve-vaardigheids maken in de Azure PortalQuickstart: Create an Azure Cognitive Search cognitive skillset in the Azure portal

Een vaardig heden is een AI-functie waarmee informatie en structuur worden geëxtraheerd uit grote niet-gedifferentieerde tekst-of afbeeldings bestanden, en kan worden geïndexeerd en doorzoekbaar is voor Zoek opdrachten in volledige tekst in azure Cognitive Search.A skillset is an AI feature that extracts information and structure from large undifferentiated text or image files, and makes it indexable and searchable for full text search queries in Azure Cognitive Search.

In deze Quick Start combineert u services en gegevens in de Azure-Cloud om de vaardig heden te maken.In this quickstart, you'll combine services and data in the Azure cloud to create the skillset. Zodra alles aanwezig is, voert u de wizard gegevens importeren in de portal uit om het allemaal samen te halen.Once everything is in place, you'll run the Import data wizard in the portal to pull it all together. Het eind resultaat is een Doorzoek bare index die is gevuld met gegevens die door de AI-verwerking zijn gemaakt en die u in de portal kunt doorzoeken (Search Explorer).The end result is a searchable index populated with data created by AI processing that you can query in the portal (Search explorer).

Als u nog geen abonnement op Azure hebt, maak dan een gratis account aan voordat u begint.If you don't have an Azure subscription, create a free account before you begin.

Services maken en gegevens ladenCreate services and load data

Deze Snelstartgids maakt gebruik van Azure Cognitive Search, Azure Blob Storageen Azure COGNITIVE Services voor de AI.This quickstart uses Azure Cognitive Search, Azure Blob storage, and Azure Cognitive Services for the AI.

Omdat de werk belasting zo klein is, wordt Cognitive Services op de achtergrond getikt om gratis verwerking te bieden voor Maxi maal 20 trans acties.Because the workload is so small, Cognitive Services is tapped behind the scenes to provide free processing for up to 20 transactions. Voor een dergelijke kleine gegevensset kunt u het maken of koppelen van een Cognitive Services resource overs Laan.For such a small data set, you can skip creating or attaching a Cognitive Services resource.

  1. Download de voorbeeldgegevens die bestaan uit een kleine set van verschillende typen bestanden.Download sample data consisting of a small file set of different types. Pak de bestanden uit.Unzip the files.

  2. Een Azure Storage-account maken of een bestaand account zoeken.Create an Azure storage account or find an existing account.

    Kies dezelfde regio als Azure Cognitive Search om bandbreedte kosten te voor komen.Choose the same region as Azure Cognitive Search to avoid bandwidth charges.

    Kies het account type StorageV2 (algemeen gebruik v2) als u de Knowledge Store-functie later in een andere walkthrough wilt proberen.Choose the StorageV2 (general purpose V2) account type if you want to try out the knowledge store feature later, in another walkthrough. Anders kiest u een wille keurig type.Otherwise, choose any type.

  3. Open de pagina's van de BLOB Services en maak een container.Open the Blob services pages and create a container. U kunt het standaard niveau voor open bare toegang gebruiken.You can use the default public access level.

  4. Klik in container op uploaden om de voorbeeld bestanden te uploaden die u in de eerste stap hebt gedownload.In container, click Upload to upload the sample files you downloaded in the first step. Merk op dat u een breed scala aan inhouds typen hebt, waaronder afbeeldingen en toepassings bestanden die niet in volledige tekst kunnen worden doorzocht in de oorspronkelijke indeling.Notice that you have a wide range of content types, including images and application files that are not full text searchable in their native formats.

    Bronbestanden in Azure-blobopslag

  5. Een Azure Cognitive Search-service maken of een bestaande service zoeken.Create an Azure Cognitive Search service or find an existing service. U kunt een gratis service voor deze Quick Start gebruiken.You can use a free service for this quickstart.

U bent nu klaar om door te gaan met de wizard gegevens importeren.You are now ready to move on the Import data wizard.

De wizard gegevens importeren uitvoerenRun the Import data wizard

Klik op de pagina overzicht van de zoek service op gegevens importeren op de opdracht balk om een cognitieve verrijking in te stellen in vier stappen.In the search service Overview page, click Import data on the command bar to set up cognitive enrichment in four steps.

Opdracht Gegevens importeren

Stap 1: een gegevens bron makenStep 1 - Create a data source

  1. Kies in verbinding maken met uw gegevens Azure Blob-opslag, selecteer het opslag account en de container die u hebt gemaakt.In Connect to your data, choose Azure Blob storage, select the Storage account and container you created. Geef een naam op voor de gegevensbron en gebruik standaardwaarden voor de rest.Give the data source a name, and use default values for the rest.

    Azure-blobconfiguratie

    Ga door naar de volgende pagina.Continue to the next page.

Stap 2: cognitieve vaardig heden toevoegenStep 2 - Add cognitive skills

Configureer vervolgens AI-verrijking om OCR, afbeeldings analyse en natuurlijke taal verwerking aan te roepen.Next, configure AI enrichment to invoke OCR, image analysis, and natural language processing.

  1. Voor deze Snelstartgids gebruiken we de gratis Cognitive Services-resource.For this quickstart, we are using the Free Cognitive Services resource. De voorbeeld gegevens bestaan uit 14 bestanden. de gratis toewijzing van 20 trans acties op Cognitive Services is voldoende voor deze Quick Start.The sample data consists of 14 files, so the free allotment of 20 transaction on Cognitive Services is sufficient for this quickstart.

    Cognitive Services toevoegen

  2. Vouw verrijkingen toevoegen uit en maak vier selecties.Expand Add enrichments and make four selections.

    Schakel OCR in om de vaardig heden voor afbeeldings analyse toe te voegen aan de wizard pagina.Enable OCR to add image analysis skills to wizard page.

    Stel granulariteit in op pagina's om tekst in kleinere segmenten op te splitsen.Set granularity to Pages to break up text into smaller chunks. Verschillende tekst vaardigheden zijn beperkt tot vijf KB-invoer.Several text skills are limited to 5-KB inputs.

    Kies entiteits herkenning (personen, organisaties, locaties) en vaardig heden voor afbeeldings analyse.Choose entity recognition (people, organizations, locations) and image analysis skills.

    Cognitive Services toevoegen

    Ga door naar de volgende pagina.Continue to the next page.

Stap 3: de index configurerenStep 3 - Configure the index

Een index bevat uw Doorzoek bare inhoud en de wizard gegevens importeren kan meestal het schema voor u maken door de gegevens bron te bemonsteren.An index contains your searchable content and the Import data wizard can usually create the schema for you by sampling the data source. In deze stap controleert u het gegenereerde schema en kunt u alle instellingen wijzigen.In this step, review the generated schema and potentially revise any settings. Hieronder ziet u het standaard schema dat is gemaakt voor de demo-BLOB-gegevensset.Below is the default schema created for the demo Blob data set.

De wizard biedt goede standaardinstellingen voor deze snelstart:For this quickstart, the wizard does a good job setting reasonable defaults:

  • Standaard velden zijn gebaseerd op Eigenschappen voor bestaande blobs plus nieuwe velden die een verrijkings uitvoer (bijvoorbeeld people organizations,, locations) bevatten.Default fields are based on properties for existing blobs plus new fields to contain enrichment output (for example, people, organizations, locations). Gegevens typen worden afgeleid van meta gegevens en door middel van gegevens bemonstering.Data types are inferred from metadata and by data sampling.

  • De standaard document sleutel is metadata_storage_path (geselecteerd omdat het veld unieke waarden bevat).Default document key is metadata_storage_path (selected because the field contains unique values).

  • Standaard kenmerken kunnen worden opgehaald en doorzoekbaar.Default attributes are Retrievable and Searchable. Doorzoekbaar staat het zoeken in volledige tekst in een veld toe.Searchable allows full text search a field. Ophalenbaar betekent dat veld waarden in resultaten kunnen worden geretourneerd.Retrievable means field values can be returned in results. De wizard gaat ervan uit dat deze velden ophaalbaar en doorzoekbaar moeten zijn omdat u ze hebt gemaakt via een set vaardigheden.The wizard assumes you want these fields to be retrievable and searchable because you created them via a skillset.

    Indexvelden

Let op het doorgehaalde vinkje en het vraagteken in de kolom Ophaalbaar voor het veld content.Notice the strikethrough and question mark on the Retrievable attribute by the content field. Voor blob-documenten met veel tekst bevat het veld content het grootste deel van het bestand, mogelijk wel duizenden regels.For text-heavy blob documents, the content field contains the bulk of the file, potentially running into thousands of lines. Een veld zoals dit is in Zoek resultaten onhandiger en u moet dit voor deze demo uitsluiten.A field like this is unwieldy in search results and you should exclude it for this demo.

Als u echter bestands inhoud wilt door geven aan client code, moet u ervoor zorgen dat ophalen is geselecteerd.However, if you need to pass file contents to client code, make sure that Retrievable stays selected. Als dat niet het geval is, kunt u dit kenmerk uitschakelen als de geëxtraheerde organizationselementen locations(zoals people,,, enzovoort) voldoende zijn. contentOtherwise, consider clearing this attribute on content if the extracted elements (such as people, organizations, locations, and so forth) are sufficient.

Als u een veld markeert als Ophaalbaar, betekent niet dat het veld aanwezig moet zijn in de lijst met zoekresultaten.Marking a field as Retrievable does not mean that the field must be present in the search results. U kunt de samenstelling van zoekresultaten nauwkeurig beheren met behulp van de queryparameter $select door op te geven welke velden u wilt opnemen.You can precisely control search results composition by using the $select query parameter to specify which fields to include. Voor velden met veel tekst zoals content, is de parameter $select de oplossing voor het aanbieden van beheersbare zoekresultaten aan de gebruikers van uw toepassing, terwijl clientcode via het kenmerk Ophaalbaar toegang heeft tot alle gegevens die nodig zijn.For text-heavy fields like content, the $select parameter is your solution for providing manageable search results to the human users of your application, while ensuring client code has access to all the information it needs via the Retrievable attribute.

Ga door naar de volgende pagina.Continue to the next page.

Stap 4: de Indexeer functie configurerenStep 4 - Configure the indexer

De indexeerfunctie is een belangrijke resource die het indexeerproces aandrijft.The indexer is a high-level resource that drives the indexing process. Hiermee specificeert u de naam van de gegevensbron, een doelindex en de uitvoerfrequentie.It specifies the data source name, a target index, and frequency of execution. De wizard gegevens importeren maakt verschillende objecten, en ze zijn altijd een Indexeer functie die u herhaaldelijk kunt uitvoeren.The Import data wizard creates several objects, and of them is always an indexer that you can run repeatedly.

  1. Op de pagina Indexeer functie kunt u de standaard naam accepteren en op de optie voor het eenmalige schema klikken om deze direct uit te voeren.In the Indexer page, you can accept the default name and click the Once schedule option to run it immediately.

    Definitie van de indexeerfunctie

  2. Klik op Verzenden om de indexeerfunctie te maken en tegelijkertijd uit te voeren.Click Submit to create and simultaneously run the indexer.

Monitor statusMonitor status

Het indexeren van cognitieve vaardig heden duurt langer dan gebruikelijk indexering op basis van tekst, met name voor het uitvoeren van een OCR-en afbeeldings analyse.Cognitive skills indexing takes longer to complete than typical text-based indexing, especially OCR and image analysis. Als u de voortgang wilt bewaken, gaat u naar de pagina overzicht en klikt u op Indexeer functies in het midden van de pagina.To monitor progress, go to the Overview page and click Indexers in the middle of page.

Azure Cognitive Search-melding

Waarschuwingen zijn normaal gezien het grote aantal inhouds typen.Warnings are normal given the wide range of content types. Sommige inhouds typen zijn niet geldig voor bepaalde vaardig heden en op lagere lagen om de indexerings limietente ondervinden.Some content types aren't valid for certain skills and on lower tiers its common to encounter indexer limits. Afgekapte meldingen van 32.000 tekens zijn bijvoorbeeld een indexerings limiet voor de gratis laag.For example, truncation notifications of 32,000 characters are an indexer limit on the Free tier. Als u deze demo op een hogere laag hebt uitgevoerd, gaan veel afgekapte waarschuwingen weg.If you ran this demo on a higher tier, many truncation warnings would go away.

Als u de waarschuwingen of fouten wilt controleren, klikt u op de waarschuwings status in de lijst Indexeer functies om de pagina uitvoerings geschiedenis te openen.To check warnings or errors, click on the Warning status on the Indexers list to open the Execution History page.

Klik op die pagina opnieuw op waarschuwings status om de lijst met waarschuwingen weer te geven, zoals hieronder wordt weer gegeven.On that page, click Warning status again to view the list of warnings similar to the one shown below.

Lijst met indexerings waarschuwingen

Details worden weer gegeven wanneer u op een specifieke status regel klikt.Details appear when you click a specific status line. Deze waarschuwing geeft aan dat het samen voegen is gestopt na het bereiken van een maximum drempel (deze specifieke PDF is groot).This warning says that that merging stopped after reaching a maximum threshold (this particular PDF is large).

Waarschuwings Details

Query uitvoeren in Search ExplorerQuery in Search explorer

Nadat een index is gemaakt, kunt u query's uitvoeren om resultaten te retour neren.After an index is created, you can run queries to return results. Gebruik in de portal Search Explorer voor deze taak.In the portal, use Search explorer for this task.

  1. Klik op de dashboardpagina van de zoekservice op Search Explorer in de opdrachtbalk.On the search service dashboard page, click Search explorer on the command bar.

  2. Selecteer bovenaan Index wijzigen om de index die u hebt gemaakt te selecteren.Select Change Index at the top to select the index you created.

  3. Voer een zoekopdracht in om een query op de index toe te passen, zoals search=Microsoft&$select=people,organizations,locations,imageTags.Enter a search string to query the index, such as search=Microsoft&$select=people,organizations,locations,imageTags.

Resultaten worden geretourneerd als JSON, wat kan worden uitgebreid en moeilijk te lezen zijn, met name in grote documenten die afkomstig zijn van Azure-blobs.Results are returned as JSON, which can be verbose and hard to read, especially in large documents originating from Azure blobs. Enkele tips voor het zoeken in dit hulp programma zijn de volgende technieken:Some tips for searching in this tool include the following techniques:

  • Toevoegen $select om op te geven welke velden moeten worden meegenomen in de resultaten.Append $select to specify which fields to include in results.
  • Gebruik CTRL-F om binnen de JSON te zoeken naar specifieke eigenschappen of termen.Use CTRL-F to search within the JSON for specific properties or terms.

Query reeksen zijn hoofdletter gevoelig, dus als u het bericht ' onbekend veld ' ontvangt, controleert u de velden of de index definitie (JSON) om de naam en case te controleren.Query strings are case-sensitive so if you get an "unknown field" message, check Fields or Index Definition (JSON) to verify name and case.

Voorbeeld Search Explorer

Opgedane kennisTakeaways

U hebt nu uw eerste vaardig heden gemaakt en belang rijke concepten geleerd die nuttig zijn voor het prototypen van een verrijkte Zoek oplossing met behulp van uw eigen gegevens.You've now created your first skillset and learned important concepts useful for prototyping an enriched search solution using your own data.

Een van de belangrijke concepten die we wilden overbrengen, is de afhankelijkheid van Azure-gegevensbronnen.Some key concepts that we hope you picked up include the dependency on Azure data sources. Een vaardig heden is gebonden aan een Indexeer functie en Indexeer functies zijn Azure en zijn specifiek voor de bron.A skillset is bound to an indexer, and indexers are Azure and source-specific. Hoewel deze snelstart Azure Blob-opslag gebruikt, zijn andere Azure-gegevensbronnen ook mogelijk.Although this quickstart uses Azure Blob storage, other Azure data sources are possible. Zie Indexeer functies in Azure Cognitive Searchvoor meer informatie.For more information, see Indexers in Azure Cognitive Search.

Een ander belang rijk concept is dat vaardig heden over inhouds typen werken en wanneer ze met heterogene inhoud werken, worden sommige invoer overgeslagen.Another important concept is that skills operate over content types, and when working with heterogeneous content, some inputs will be skipped. Het is ook mogelijk dat grote bestanden of velden de indexerings limieten van uw servicelaag overschrijden.Also, large files or fields might exceed the indexer limits of your service tier. Het is normaal dat er waarschuwingen worden weer gegeven wanneer deze gebeurtenissen optreden.It's normal to see warnings when these events occur.

Uitvoer wordt omgeleid naar een zoek index en er is een toewijzing tussen naam/waarde-paren die tijdens het indexeren en afzonderlijke velden in uw index worden gemaakt.Output is directed to a search index, and there is a mapping between name-value pairs created during indexing and individual fields in your index. Intern stelt de portal aantekeningen in en definieert een set vaardigheden, waarmee de volgorde van bewerkingen en de algemene stroom wordt bepaald.Internally, the portal sets up annotations and defines a skillset, establishing the order of operations and general flow. Deze stappen zijn verborgen in de portal, maar wanneer u begint met het schrijven van code worden deze concepten belangrijk.These steps are hidden in the portal, but when you start writing code, these concepts become important.

Ten slotte hebt u geleerd dat inhoud kan worden gecontroleerd door de index te doorzoeken.Finally, you learned that can verify content by querying the index. In het eind, wat Azure Cognitive Search biedt, is een Doorzoek bare index, die u kunt opvragen met de eenvoudige of een volledig uitgebreide query syntaxis.In the end, what Azure Cognitive Search provides is a searchable index, which you can query using either the simple or fully extended query syntax. Een index met verrijkte velden werkt zoals elke andere index.An index containing enriched fields is like any other. Als u standaard of aangepaste analysefuncties, Score profielen, synoniemen, facet filters, Geo-search of andere Azure Cognitive Search-functie wilt opnemen, kunt u dit zeker doen.If you want to incorporate standard or custom analyzers, scoring profiles, synonyms, faceted filters, geo-search, or any other Azure Cognitive Search feature, you can certainly do so.

Resources opschonenClean up resources

Wanneer u in uw eigen abonnement werkt, is het een goed idee om aan het einde van een project te bepalen of u de resources die u hebt gemaakt, nog nodig hebt.When you're working in your own subscription, it's a good idea at the end of a project to identify whether you still need the resources you created. Resources die actief blijven, kunnen u geld kosten.Resources left running can cost you money. U kunt resources afzonderlijk verwijderen, maar u kunt ook de resourcegroep verwijderen als u de volledige resourceset wilt verwijderen.You can delete resources individually or delete the resource group to delete the entire set of resources.

U kunt resources vinden en beheren in de portal met behulp van de koppeling alle resources of resource groepen in het navigatie deel venster aan de linkerkant.You can find and manage resources in the portal, using the All resources or Resource groups link in the left-navigation pane.

Als u een gratis service gebruikt, moet u er rekening mee houden dat u bent beperkt tot drie indexen, Indexeer functies en gegevens bronnen.If you are using a free service, remember that you are limited to three indexes, indexers, and data sources. U kunt afzonderlijke items in de Portal verwijderen om de limiet te blijven.You can delete individual items in the portal to stay under the limit.

Volgende stappenNext steps

U kunt vaardig heden maken met behulp van de portal, de .NET-SDK of de REST API.You can create skillsets using the portal, .NET SDK, or REST API. Probeer het REST API met behulp van Postman en meer voorbeeld gegevens om uw kennis te verfijnen.To further your knowledge, try the REST API using Postman and more sample data.

Tip

Als u deze oefening wilt herhalen of als u een andere AI-verrijkings scenario wilt proberen, verwijdert u de Indexeer functie in de portal.If you want to repeat this exercise or try a different AI enrichment walkthrough, delete the indexer in the portal. Als u de Indexeer functie verwijdert, wordt de gratis dagelijkse transactie teller weer ingesteld op nul voor Cognitive Services verwerking.Deleting the indexer resets the free daily transaction counter back to zero for Cognitive Services processing.