Guida introduttiva: Creare un set di competenze cognitive di Ricerca cognitiva di Azure nel portale di AzureQuickstart: Create an Azure Cognitive Search cognitive skillset in the Azure portal

Un set di competenze è una funzionalità di intelligenza artificiale che estrae le informazioni e la struttura da file di testo o immagine non differenziati di grandi dimensioni e le rende indicizzabili e ricercabili per le query di ricerca full-text in Ricerca cognitiva di Azure.A skillset is an AI feature that extracts information and structure from large undifferentiated text or image files, and makes it indexable and searchable for full text search queries in Azure Cognitive Search.

In questa guida di avvio rapido verranno combinati servizi e dati nel cloud di Azure per creare il set di competenze.In this quickstart, you'll combine services and data in the Azure cloud to create the skillset. Si userà quindi la procedura guidata Importa dati nel portale per riunire tutti i dati ottenuti.Once everything is in place, you'll run the Import data wizard in the portal to pull it all together. Il risultato finale è un indice ricercabile popolato con i dati creati dall'elaborazione di intelligenza artificiale su cui è possibile eseguire query nel portale (Esplora ricerche).The end result is a searchable index populated with data created by AI processing that you can query in the portal (Search explorer).

Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare.If you don't have an Azure subscription, create a free account before you begin.

Creare i servizi e caricare i datiCreate services and load data

Questa guida di avvio rapido usa Ricerca cognitiva di Azure, Archiviazione BLOB di Azure e Servizi cognitivi di Azure per l'intelligenza artificiale.This quickstart uses Azure Cognitive Search, Azure Blob storage, and Azure Cognitive Services for the AI.

Poiché il carico di lavoro è molto ridotto, Servizi cognitivi lavora dietro le quinte per offrire un'elaborazione gratuita per un massimo di 20 transazioni al giorno quando vengono richiamate da Ricerca cognitiva di Azure.Because the workload is so small, Cognitive Services is tapped behind the scenes to provide free processing for up to 20 transactions daily when invoked from Azure Cognitive Search. Se i usano i dati di esempio forniti, è possibile evitare di creare o collegare una risorsa di Servizi cognitivi.As long as you use the sample data we provide, you can skip creating or attaching a Cognitive Services resource.

  1. Scaricare i dati di esempio costituiti da un piccolo set di file di tipi diversi.Download sample data consisting of a small file set of different types. Decomprimere i file.Unzip the files.

  2. Creare un account di archiviazione di Azure o trovare un account esistente nella sottoscrizione corrente.Create an Azure storage account or find an existing account under your current subscription.

    Scegliere la stessa area di Ricerca cognitiva di Azure.Choose the same region as Azure Cognitive Search. Scegliere il tipo di account Archiviazione V2 (utilizzo generico V2) se si vuole provare la funzionalità dell'archivio conoscenze in un secondo momento, in un'altra procedura dettagliata.Choose the StorageV2 (general purpose V2) account type if you want to try out the knowledge store feature later, in another walkthrough. In caso contrario, scegliere un tipo qualsiasi.Otherwise, choose any type.

  3. Aprire le pagine dei servizi BLOB e creare un contenitore.Open the Blob services pages and create a container. È possibile usare il livello di accesso pubblico predefinito.You can use the default public access level.

  4. Nel contenitore fare clic su Carica per caricare i file di esempio scaricati nel primo passaggio.In container, click Upload to upload the sample files you downloaded in the first step. Si noti che è disponibile un'ampia gamma di tipi di contenuto, tra cui immagini e file di applicazioni che non sono disponibili per la ricerca full-text nei formati nativi.Notice that you have a wide range of content types, including images and application files that are not full text searchable in their native formats.

    File di origine nell'archivio BLOB di Azure

  5. Creare un servizio di ricerca cognitiva di Azure o trovare un servizio esistente nella stessa sottoscrizione.Create an Azure Cognitive Search service or find an existing service under the same subscription. È possibile usare un servizio gratuito per questo avvio rapido.You can use a free service for this quickstart.

A questo punto è possibile procedere con la procedura guidata Importa dati.You are now ready to move on the Import data wizard.

Eseguire la procedura guidata Importa datiRun the Import data wizard

Nella pagina Panoramica del servizio di ricerca fare clic su Importa dati sulla barra dei comandi per configurare l'arricchimento cognitivo in quattro passaggi.In the search service Overview page, click Import data on the command bar to set up cognitive enrichment in four steps.

Comando Importa dati

Passaggio 1: Creare un'origine datiStep 1: Create a data source

  1. In Definisci la connessione ai dati scegliere Archiviazione BLOB di Azure e selezionare l'account di archiviazione e il contenitore creati.In Connect to your data, choose Azure Blob storage, select the Storage account and container you created. Assegnare un nome origine dati e utilizzare i valori predefiniti per il resto.Give the data source a name, and use default values for the rest.

    Configurazione del BLOB di Azure

  2. Passare alla pagina successiva.Continue to the next page.

Passaggio 2: Aggiungere competenze cognitiveStep 2: Add cognitive skills

A questo punto occorre aggiungere le competenze cognitive per richiamare l'elaborazione del linguaggio naturale.Next, add cognitive skills to invoke natural language processing. I dati di esempio sono costituiti da 12 file, pertanto l'allocazione gratuita di 20 transazioni su Servizi cognitivi è sufficiente per questa guida di avvio rapido.The sample data consists of 12 files, so the free allotment of 20 transaction on Cognitive Services is sufficient for this quickstart. Poiché non si sta usando l'OCR, in questo processo verranno conteggiati, sottoposti a cracking e usati solo i file non di immagine.Because we aren't using OCR, only the non-image files will be counted, cracked, and used in this process.

  1. Per questa guida di avvio rapido si usa la risorsa Servizi cognitivi gratuita.For this quickstart, we are using the Free Cognitive Services resource.

    Collega Servizi cognitivi

  2. Espandere Aggiungi competenze e selezionare le competenze che eseguono l'elaborazione del linguaggio naturale.Expand Add skills and select skills that perform natural language processing. Per questa Guida introduttiva, scegliere il riconoscimento entità per gli utenti, le organizzazioni e i percorsi.For this quickstart, choose entity recognition for people, organizations, and locations.

    Collega Servizi cognitivi

  3. Accettare il campo di origine predefinito: content.Accept the default source field: content. Potrebbe sembrare una destinazione limitata, ma per i BLOB di Azure il campo content contiene la maggior parte del documento BLOB (ad esempio, un documento Word o una presentazione di PowerPoint) ed è pertanto un buon candidato.This might seem like a small target, but for Azure blobs the content field contains most of the blob document (for example, a Word doc or PowerPoint deck), which makes it a good candidate.

  4. Passare alla pagina successiva.Continue to the next page.

Nota

L'elaborazione del linguaggio naturale viene eseguita tramite il contenuto di testo nel set di dati di esempio.Natural language processing skills operate over text content in the sample data set. Poiché l'opzione OCR non è stata selezionata, i file JPEG e PNG trovati nel set di dati di esempio non verranno elaborati in questo argomento di avvio rapido.Since we didn't select the OCR option, the JPEG and PNG files found in the sample data set won't be processed in this quickstart.

Passaggio 3: Configurare l'indiceStep 3: Configure the index

In Ricerca cognitiva di Azure un indice contiene il contenuto ricercabile e la procedura guidata importa dati in genere può creare lo schema automaticamente eseguendo il campionamento dell'origine dati.In Azure Cognitive Search, an index contains your searchable content and the Import data wizard can usually create the schema for you by sampling the data source. In questo passaggio occorre esaminare lo schema generato e potenzialmente rivedere le impostazioni.In this step, review the generated schema and potentially revise any settings. Di seguito è riportato lo schema predefinito creato per il set di dati BLOB demo.Below is the default schema created for the demo Blob data set.

Per questa Guida introduttiva, la procedura guidata ha imposta valori predefiniti ragionevoli in modo efficace:For this quickstart, the wizard does a good job setting reasonable defaults:

  • Il nome predefinito è azureblob-index in base al tipo di origine dati.Default name is azureblob-index based on the data source type.

  • I campi predefiniti si basano sul campo dati di origine originale (content) e sui campi di output ( people, organizations e locations) creati dalle competenze cognitive.Default fields are based on the original source data field (content), plus the output fields (people, organizations, and locations) created by the cognitive skills. I tipi di dati predefiniti vengono dedotti dai metadati e dal campionamento dei dati.Default data types are inferred from metadata and data sampling.

  • La chiave di documento predefinita è metadata_storage_path (selezionata perché il campo contiene valori univoci).Default document key is metadata_storage_path (selected because the field contains unique values).

  • Gli attributi predefiniti per questi campi sono Recuperabile e Ricercabile.Default attributes are Retrievable and Searchable for these fields. Ricercabile indica un campo in cui è possibile eseguire ricerche.Searchable indicates a field can be searched. Recuperabile significa che può essere restituito nei risultati.Retrievable means it can be returned in results. La procedura guidata presuppone che si voglia rendere questi campi recuperabili e ricercabili perché sono stati creati con un insieme di competenze.The wizard assumes you want these fields to be retrievable and searchable because you created them via a skillset.

    Campi indice

Osservare il testo barrato e il punto interrogativo sull'attributo Recuperabile accanto al campo content.Notice the strikethrough and question mark on the Retrievable attribute by the content field. Per i documenti BLOB a elevato utilizzo di testo, il campo content contiene la maggior parte del contenuto del file, eseguito potenzialmente in migliaia di righe.For text-heavy blob documents, the content field contains the bulk of the file, potentially running into thousands of lines. Se è necessario passare il contenuto del file al codice client, assicurarsi che il campo Recuperabile resti selezionato.If you need to pass file contents to client code, make sure that Retrievable stays selected. In caso contrario, prendere in considerazione la cancellazione di questo attributo in content se gli elementi estratti (people, organizations e locations) sono sufficienti per gli scopi desiderati.Otherwise, consider clearing this attribute on content if the extracted elements (people, organizations, and locations) are sufficient for your purposes.

Contrassegnare un campo come Recuperabile non significa che il campo debba essere presente nei risultati della ricerca.Marking a field as Retrievable does not mean that the field must be present in the search results. È possibile controllare con precisione la composizione dei risultati della ricerca usando il parametro di query $select per specificare i campi da includere.You can precisely control search results composition by using the $select query parameter to specify which fields to include. Per i campi con grandi quantità di testo come content, il parametro $select è la soluzione per fornire risultati della ricerca gestibili agli utenti umani dell'applicazione, garantendo allo stesso tempo che il codice abbia accesso a tutte le informazioni necessarie attraverso l'attributo Recuperabile.For text-heavy fields like content, the $select parameter is your solution for providing manageable search results to the human users of your application, while ensuring client code has access to all the information it needs via the Retrievable attribute.

Passare alla pagina successiva.Continue to the next page.

Passaggio 4: Configurare l'indicizzatoreStep 4: Configure the indexer

L'indicizzatore è una risorsa di alto livello che guida il processo di indicizzazione.The indexer is a high-level resource that drives the indexing process. Specifica il nome dell'origine dati, l'indice di destinazione e la frequenza di esecuzione.It specifies the data source name, a target index, and frequency of execution. La procedura guidata Importa dati crea diversi oggetti, uno dei quali è sempre un indicizzatore che può essere eseguito ripetutamente.The Import data wizard creates several objects, and of them is always an indexer that you can run repeatedly.

  1. Nella pagina Indicizzatore si può accettare il nome predefinito e fare clic sull'opzione di pianificazione Una sola volta per l'esecuzione immediata.In the Indexer page, you can accept the default name and click the Once schedule option to run it immediately.

    Definizione di indicizzatore

  2. Fare clic su Invia per creare e contemporaneamente eseguire l'indicizzatore.Click Submit to create and simultaneously run the indexer.

Monitorare lo statoMonitor status

Il completamento dell'indicizzazione delle competenze cognitive richiede più tempo rispetto all'indicizzazione tipica basata su testo.Cognitive skills indexing takes longer to complete than typical text-based indexing. Per monitorare lo stato, passare alla pagina Panoramica e fare clic su Indicizzatori al centro della pagina.To monitor progress, go to the Overview page and click Indexers in the middle of page.

L'avviso viene visualizzato perché nell'origine dati sono presenti file di immagine JPG e PNG e la competenza OCR è stata omessa da questa pipeline.The warning occurs because JPG and PNG image files are in the data source, and we omitted the OCR skill from this pipeline. Verranno anche visualizzate notifiche di troncamento.You'll also find truncation notifications. L'estrazione è limitata a 32.000 caratteri nel livello gratuito.Extraction is limited to 32,000 characters on the Free tier.

Notifica di Ricerca cognitiva di Azure

L'indicizzazione e l'arricchimento possono richiedere tempo, per questo motivo sono consigliati set di dati più piccoli per l'esplorazione anticipata.Indexing and enrichment can take time, which is why smaller data sets are recommended for early exploration.

Nel portale di Azure è anche possibile monitorare il log attività Notifiche per rilevare la presenza di un collegamento di stato Notifica di Ricerca cognitiva di Azure selezionabile.In the Azure portal, you can also monitor the Notifications activity log for a clickable Azure Cognitive Search notification status link. Il completamento dell'esecuzione può richiedere alcuni minuti.Execution may take several minutes to complete.

Eseguire query in Esplora ricercheQuery in Search explorer

Dopo aver creato un indice, è possibile inviare query per la restituzione di documenti dall'indice.After an index is created, you can submit queries to return documents from the index. Nel portale usare Esplora ricerche per eseguire query e visualizzare i risultati.In the portal, use Search explorer to run queries and view results.

  1. Nella pagina del dashboard del servizio di ricerca fare clic su Esplora ricerche sulla barra dei comandi.On the search service dashboard page, click Search explorer on the command bar.

  2. Selezionare Cambia indice in alto per selezionare l'indice creato.Select Change Index at the top to select the index you created.

  3. Immettere una stringa di ricerca per una query nell'indice, ad esempio search=Microsoft&searchFields=Organizations.Enter a search string to query the index, such as search=Microsoft&searchFields=Organizations.

I risultati vengono restituiti in formato JSON, che può essere dettagliato e difficile da leggere, soprattutto in documenti di grandi dimensioni proveniente da BLOB di Azure.Results are returned in JSON, which can be verbose and hard to read, especially in large documents originating from Azure blobs. Se non è possibile analizzare facilmente i risultati, usare CTRL + F per cercare all'interno dei documenti.If you can't scan results easily, use CTRL-F to search within documents. Per questa query, è possibile cercare termini specifici all'interno del codice JSON.For this query, you could search within the JSON for specific terms.

CTRL + F consente inoltre di determinare il numero di documenti presenti in un determinato set di risultati.CTRL-F can also help you determine how many documents are in a given result set. Per i BLOB di Azure, il portale sceglie "metadata_storage_path" come chiave perché ogni valore è univoco per il documento.For Azure blobs, the portal chooses "metadata_storage_path" as the key because each value is unique to the document. Usando CTRL-F, cercare "metadata_storage_path" per ottenere il conteggio dei documenti.Using CTRL-F, search for "metadata_storage_path" to get a count of documents.

Esempio di Esplora ricerche

RisultatiTakeaways

È stato creato il primo set di competenze e sono stati appresi importanti concetti utili per la creazione del prototipo di una soluzione di ricerca arricchita con i propri dati.You've now created your first skillset and learned important concepts useful for prototyping an enriched search solution using your own data.

Alcuni concetti chiave ci auguriamo l'utente abbia compreso includono la dipendenza da origini dati di Azure.Some key concepts that we hope you picked up include the dependency on Azure data sources. Un set di competenze è associato a un indicizzatore e gli indicizzatori sono specifici di Azure e dell'origine.A skillset is bound to an indexer, and indexers are Azure and source-specific. Anche se in questa Guida introduttiva viene usato Archivio BLOB di Azure, sono possibili altre origini dati di Azure.Although this quickstart uses Azure Blob storage, other Azure data sources are possible. Per altre informazioni, vedere Indicizzatori in Ricerca cognitiva di Azure.For more information, see Indexers in Azure Cognitive Search.

Un altro concetto importante è che le competenze vengono eseguite tramite campi di input.Another important concept is that skills operate over input fields. Nel portale, è necessario scegliere un singolo campo di origine per tutte le competenze.In the portal, you have to choose a single source field for all the skills. Nel codice, gli input possono essere altri campi o l'output di una competenza upstream.In code, inputs can be other fields, or the output of an upstream skill.

L'output viene indirizzato a un indice di ricerca ed esiste un mapping tra le coppie nome-valore create durante l'indicizzazione e i singoli campi dell'indice.Output is directed to a search index, and there is a mapping between name-value pairs created during indexing and individual fields in your index. Internamente, il portale configura annotazioni e definisce un set di competenze, stabilendo l'ordine delle operazioni e il flusso generale.Internally, the portal sets up annotations and defines a skillset, establishing the order of operations and general flow. Questi passaggi sono nascosti nel portale, ma quando si avvia la scrittura di codice, questi concetti diventano importanti.These steps are hidden in the portal, but when you start writing code, these concepts become important.

Infine, si è appreso che è possibile verificare il contenuto eseguendo una query sull'indice.Finally, you learned that can verify content by querying the index. In ultima analisi, ciò che Ricerca cognitiva di Azure offre è un indice ricercabile in cui è possibile eseguire query usando la sintassi di query semplice o completamente estesa.In the end, what Azure Cognitive Search provides is a searchable index, which you can query using either the simple or fully extended query syntax. Un indice che contiene campi arricchiti è come qualsiasi altro.An index containing enriched fields is like any other. Se si vuole incorporare analizzatori personalizzati o standard, profili di punteggio, sinonimi, filtri con facet, ricerca geografica o qualsiasi altra funzionalità di Ricerca cognitiva di Azure, è possibile farlo.If you want to incorporate standard or custom analyzers, scoring profiles, synonyms, faceted filters, geo-search, or any other Azure Cognitive Search feature, you can certainly do so.

Eseguire la puliziaClean up

Quando si lavora nella propria sottoscrizione, alla fine di un progetto è opportuno verificare se le risorse create sono ancora necessarie.When you're working in your own subscription, it's a good idea at the end of a project to identify whether you still need the resources you created. L'esecuzione continua delle risorse può avere un costo.Resources left running can cost you money. È possibile eliminare le singole risorse oppure il gruppo di risorse per eliminare l'intero set di risorse.You can delete resources individually or delete the resource group to delete the entire set of resources.

Per trovare e gestire le risorse nel portale, usare il collegamento Tutte le risorse o Gruppi di risorse nel riquadro di spostamento a sinistra.You can find and manage resources in the portal, using the All resources or Resource groups link in the left-navigation pane.

Se si usa un servizio gratuito, tenere presente che il numero di indicizzatori e origini dati è limitato a tre.If you are using a free service, remember that you are limited to three indexes, indexers, and data sources. Per non superare il limite, è possibile eliminare i singoli elementi nel portale.You can delete individual items in the portal to stay under the limit.

Passaggi successiviNext steps

È possibile creare set di competenze usando il portale, .NET SDK o l'API REST.You can create skillsets using the portal, .NET SDK, or REST API. Per approfondire le proprie conoscenze, provare l'API REST usando Postman e altri dati di esempio.To further your knowledge, try the REST API using Postman and more sample data.

Suggerimento

Se si vuole ripetere questo esercizio o provare un'altra procedura dettagliata per gli arricchimenti tramite intelligenza artificiale, eliminare l'indicizzatore nel portale.If you want to repeat this exercise or try a different AI enrichment walkthrough, delete the indexer in the portal. Eliminando l'indicizzatore, il contatore delle transazioni giornaliere gratuite viene azzerato per l'elaborazione di Servizi cognitivi.Deleting the indexer resets the free daily transaction counter back to zero for Cognitive Services processing.