Funzionalità di Ricerca intelligenza artificiale di Azure

Articolo
04/04/2024

Ricerca di intelligenza artificiale di Azure fornisce il recupero delle informazioni e usa l'integrazione facoltativa dell'intelligenza artificiale per estrarre più contenuto di testo e struttura.

La tabella seguente riepiloga le funzionalità per categoria. Per altre informazioni sul confronto tra Ricerca intelligenza artificiale di Azure e altre tecnologie di ricerca, vedere Confrontare le opzioni di ricerca.

Esistono parità di funzionalità in tutti i cloud pubblici, privati e sovrani di Azure, ma alcune funzionalità non sono supportate in aree specifiche. Per altre informazioni, vedere Disponibilità del prodotto in base all'area.

Nota

Cerchi le funzionalità di anteprima? Vedere l'elenco delle funzionalità di anteprima.

Funzionalità di indicizzazione

Categoria	Funzionalità
Origini dati	Gli indici di ricerca possono accettare testo da qualsiasi origine, purché venga inviato come documento JSON. Gli indicizzatori sono una funzionalità che automatizza l'importazione dei dati da origini dati supportate per estrarre contenuto ricercabile negli archivi dati primari. Gli indicizzatori gestiscono automaticamente la serializzazione JSON e supportano la maggior parte delle forme di rilevamento delle modifiche e dell'eliminazione. È possibile connettersi a un'ampia gamma di origini dati, tra cui database SQL di Azure, Azure Cosmos DB o Archiviazione BLOB di Azure.
Strutture di dati gerarchici e annidati	Tipi e raccolte complessi consentono di modellare praticamente qualsiasi tipo di struttura JSON all'interno di un indice di ricerca. Le cardinalità uno-a-molti e molti-a-molti possono essere espresse in modo nativo tramite raccolte, tipi complessi e raccolte di tipi complessi.
Analisi linguistica	Gli analizzatori sono componenti usati per l'elaborazione del testo durante le operazioni di indicizzazione e di ricerca. Per impostazione predefinita, è possibile usare l'analizzatore Lucene Standard per utilizzo generico oppure eseguire l'override dell'impostazione predefinita con un analizzatore del linguaggio, un analizzatore personalizzato configurato o un altro analizzatore predefinito che produce token nel formato necessario. Gli analizzatori di linguaggio di Lucene o Microsoft sono usati per gestire in modo intelligente le funzionalità linguistiche specifiche di una lingua tra cui i tempi verbali, il genere, i sostantivi plurali irregolari, ad esempio "uomo" e "uomini", la scomposizione delle parole, il ritorno a capo, per le lingue senza spazi, e altro. Gli analizzatori lessicali personalizzati vengono usati per moduli di query complessi, ad esempio la corrispondenza fonetica e le espressioni regolari.

Ricerca vettoriale e ibrida

Categoria	Funzionalità
Indicizzazione dei vettori	All'interno di un indice di ricerca aggiungere campi vettoriali per supportare scenari di ricerca vettoriale. I campi vettoriali possono coesistere con campi non di filtro nello stesso documento di ricerca.
Query vettoriali	Formulare query a vettori singoli e multipli.
Algoritmi di ricerca vettoriale	Usare HNSW (Hierarchical Navigable Small World) o K-Nearest Neighbors (KNN) completo per trovare vettori simili in un indice di ricerca.
Filtri vettoriali	Applicare filtri prima o dopo l'esecuzione della query per una maggiore precisione durante il recupero delle informazioni.
Recupero di informazioni ibride	Cercare concetti e parole chiave in una singola richiesta di query ibrida. La ricerca ibrida consolida la ricerca di vettori e testo, con classificazione semantica facoltativa e ottimizzazione della pertinenza per ottenere risultati ottimali.
Suddivisione in blocchi e vettorizzazione dei dati integrati (anteprima)	Suddivisione in blocchi di dati nativi tramite competenza Suddivisione testo e vettorizzazione nativa tramite vettorizzatori e la competenza AzureOpenAIEmbeddingModel. La vettorializzazione integrata (anteprima) fornisce una pipeline di indicizzazione end-to-end dai file di origine alle query.
Compressione e quantizzazione dei vettori integrati	Usare la quantizzazione scalare predefinita per ridurre le dimensioni dell'indice vettoriale in memoria e su disco. È anche possibile rinunciare all'archiviazione dei vettori non necessari o assegnare tipi di dati limitati ai campi vettoriali per ridurre i requisiti di archiviazione.
Importare e vettorializzare i dati (anteprima)	Nuova procedura guidata nella portale di Azure che crea una pipeline di indicizzazione completa che include la suddivisione in blocchi di dati e la vettorizzazione. La procedura guidata crea tutti gli oggetti e le impostazioni di configurazione.

Arricchimento tramite intelligenza artificiale e knowledge mining

Categoria	Funzionalità
Elaborazione di intelligenza artificiale durante l'indicizzazione	L'arricchimento tramite intelligenza artificiale si riferisce all'elaborazione incorporata di immagini e linguaggio naturale in una pipeline di indicizzatore che estrae testo e informazioni dal contenuto che non può altrimenti essere indicizzato per la ricerca full-text. L'elaborazione dell'intelligenza artificiale viene ottenuta aggiungendo e combinando competenze in un set di competenze, che viene quindi collegato a un indicizzatore. L'intelligenza artificiale può essere una delle competenze predefinite di Microsoft, ad esempio la traduzione testuale o il riconoscimento ottico dei caratteri (OCR) o competenze personalizzate fornite dall'utente.
Archiviazione di contenuto arricchito per l'analisi e l'utilizzo in scenari non di ricerca	L'archivio conoscenze è un archivio permanente di contenuto arricchito, destinato a scenari non di ricerca come il knowledge mining e l'elaborazione di data science. Un archivio conoscenze viene definito in un set di competenze, ma creato in Archiviazione di Azure come oggetti o set di righe tabulari.
Arricchimenti memorizzati nella cache	L'arricchimento incrementale (anteprima) si riferisce agli arricchimenti memorizzati nella cache che possono essere riutilizzati durante l'esecuzione del set di competenze. La memorizzazione nella cache è particolarmente utile nei set di competenze che includono OCR e analisi delle immagini, che sono costosi da elaborare.

Esperienza utente e query

Categoria	Funzionalità
Ricerca di testo in formato libero	Ricerca full-text è un caso d'uso principale per la maggior parte delle app basate sulla ricerca. È possibile formulare query servendosi di una sintassi supportata. La sintassi di query semplice offre operatori logici, operatori di ricerca di una frase, operatori di suffisso, operatori di precedenza. La sintassi di query Lucene completa include tutte le operazioni nella sintassi semplice, con estensioni per la ricerca fuzzy, la ricerca di prossimità, il boosting dei termini e le espressioni regolari.
Pertinenza	L'assegnazione dei punteggi semplice è un vantaggio fondamentale di Ricerca di intelligenza artificiale di Azure. I profili di punteggio vengono usati per modellare la rilevanza in funzione dei valori nei documenti stessi. Ad esempio, si potrebbe decidere che prodotti più recenti o prodotti scontati compaiano prima tra i risultati della ricerca. È inoltre possibile compilare profili di puntaggio utilizzando tag per il punteggio personalizzati in base alle preferenze di ricerca cliente che sono stati rilevati e archiviati separatamente. Il ranker semantico è una funzionalità premium che classifica i risultati in base alla pertinenza semantica per la query. A seconda del contenuto e dello scenario, può migliorare significativamente la pertinenza della ricerca con una configurazione o un impegno quasi minimo.
Ricerca geospaziale	Le funzioni geospaziali filtrano e corrispondono alle coordinate geografiche. È possibile trovare una corrispondenza in base alla distanza o all'inclusione in una forma poligono.
Filtri e facet	L'Esplorazione in base a facet viene abilitata tramite un singolo parametro di query. Ricerca di intelligenza artificiale di Azure restituisce una struttura di spostamento in base a facet che è possibile usare come code-behind di un elenco di categorie, per filtrare gli elementi del catalogo in base all'intervallo di prezzi o al marchio. È possibile usare i filtri per incorporare l'esplorazione in base a facet nell'interfaccia utente dell'applicazione, migliorare la formulazione di query e filtrare in base a criteri specificati dall'utente o dallo sviluppatore. Creare filtri mediante la sintassi OData.
Esperienza utente	Completamento automatico può essere abilitato per le query con completamento automatico in una barra di ricerca. Suggerimenti per la ricerca funziona anche all'esterno di input di testo parziale in una barra di ricerca, ma i risultati sono documenti effettivi nell'indice anziché nei termini della query. Sinonimi associa termini equivalenti, che espandono in modo implicito l'ambito di una query, senza che l'utente debba fornire il termine alternativo. L'evidenziazione dei risultati applica la formattazione del testo a una parola chiave corrispondente nei risultati della ricerca. È possibile scegliere i campi che devono restituire i frammenti evidenziati. ordinamento è disponibile per più campi tramite lo schema dell'indice e viene attivato o disattivato in fase di query con un solo parametro di ricerca. Il paging e la limitazione dei risultati della ricerca sono semplici con il controllo ottimizzato offerto da Ricerca di intelligenza artificiale di Azure sui risultati della ricerca.

Funzionalità di sicurezza

Categoria	Funzionalità
Crittografia dei dati	La crittografia dei dati inattivi gestita da Microsoft è incorporata nel livello di archiviazione interno ed è irrevocabile. Le chiavi di crittografia gestite dal cliente create e gestite in Azure Key Vault possono essere usate per la crittografia supplementare di indici e mappe sinonimi. Per i servizi creati dopo il 1° agosto 2020, la crittografia cmk si estende ai dati nei dischi temporanei, per la doppia crittografia completa del contenuto indicizzato.
Endpoint Protection	Le regole IP per il supporto del firewall in ingresso consentono di configurare intervalli IP su cui il servizio di ricerca accetterà le richieste. Creare un endpoint privato usando collegamento privato di Azure per forzare tutte le richieste tramite una rete virtuale.
Accesso in ingresso	Il controllo degli accessi in base al ruolo di Azure assegna ruoli a utenti e gruppi in Microsoft Entra ID per l'accesso controllato ai contenuti e alle operazioni di ricerca. È anche possibile usare l'autenticazione basata su chiave se non si ha un tenant di Azure.
Sicurezza in uscita (indicizzatori)	L'accesso ai dati tramite endpoint privati consente a un indicizzatore di connettersi alle risorse di Azure protette tramite collegamento privato di Azure. L'accesso ai dati tramite un'identità attendibile significa che stringa di connessione a origini dati esterne possono omettere nomi utente e password. Quando un indicizzatore si connette all'origine dati, la risorsa consente la connessione se il servizio di ricerca è stato registrato in precedenza come servizio attendibile.

Funzionalità del portale

Categoria	Funzionalità
Strumenti per la creazione di prototipi e l'ispezione	L'aggiunta di un indice è una finestra di progettazione indici nel portale che è possibile usare per creare uno schema di base costituito da campi con attributi e altre impostazioni. Dopo aver salvato l'indice, è possibile popolarlo usando un SDK o l'API REST per fornire i dati. La procedura guidata Importa dati crea indici, indicizzatori, set di competenze e definizioni di origine dati. Se i dati sono presenti in Azure, questa procedura guidata consente di risparmiare tempo e impegno significativi, soprattutto per l'analisi e l'esplorazione del modello di verifica. Esplora ricerche viene usato per testare le query e perfezionare i profili di punteggio. Creare un'app demo viene usata per generare una pagina HTML che può essere usata per testare l'esperienza di ricerca. Sessioni di debug è un editor visivo che consente di eseguire il debug di un set di competenze in modo interattivo. Mostra le dipendenze, l'output e le trasformazioni.
Monitoraggio e diagnostica	Abilitare le funzionalità di monitoraggio per andare oltre le metriche sempre visibili a colpo d'occhio nel portale. Le metriche sulle query al secondo, la latenza e limitazione vengono acquisite e segnalate nelle pagine del portale senza alcuna configurazione aggiuntiva necessaria.

Categoria

Funzionalità

Strumenti per la creazione di prototipi e l'ispezione

L'aggiunta di un indice è una finestra di progettazione indici nel portale che è possibile usare per creare uno schema di base costituito da campi con attributi e altre impostazioni. Dopo aver salvato l'indice, è possibile popolarlo usando un SDK o l'API REST per fornire i dati.

La procedura guidata Importa dati crea indici, indicizzatori, set di competenze e definizioni di origine dati. Se i dati sono presenti in Azure, questa procedura guidata consente di risparmiare tempo e impegno significativi, soprattutto per l'analisi e l'esplorazione del modello di verifica.

Esplora ricerche viene usato per testare le query e perfezionare i profili di punteggio.

Creare un'app demo viene usata per generare una pagina HTML che può essere usata per testare l'esperienza di ricerca.

Sessioni di debug è un editor visivo che consente di eseguire il debug di un set di competenze in modo interattivo. Mostra le dipendenze, l'output e le trasformazioni.

Monitoraggio e diagnostica

Abilitare le funzionalità di monitoraggio per andare oltre le metriche sempre visibili a colpo d'occhio nel portale. Le metriche sulle query al secondo, la latenza e limitazione vengono acquisite e segnalate nelle pagine del portale senza alcuna configurazione aggiuntiva necessaria.

Programmabilità

Categoria	Funzionalità
REST	L'API REST del servizio è destinata alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche. L'API REST di gestione è destinata alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per .NET	Azure.Search.Documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche. Microsoft.Azure.Management.Search è destinato alla creazione e al provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Java	com.azure.search.documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche. com.microsoft.azure.management.search è la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per Python	azure-search-documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche. azure-mgmt-search è per la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.
Azure SDK per JavaScript/TypeScript	azure/search-documents è destinato alle operazioni del piano dati, incluse tutte le operazioni correlate all'indicizzazione, alle query e all'arricchimento tramite intelligenza artificiale. È anche possibile usare questa libreria client per recuperare le informazioni di sistema e le statistiche. azure/arm-search è per la creazione e il provisioning dei servizi tramite Azure Resource Manager. È anche possibile usare questa API per gestire chiavi e capacità.