Domande frequenti su Ricerca di intelligenza artificiale di Azure

Trovare le risposte alle domande frequenti su Ricerca di intelligenza artificiale di Azure.

Generali

Che cos'è Azure AI Search?

Ricerca di intelligenza artificiale di Azure offre un motore di ricerca dedicato e un archivio permanente del contenuto ricercabile per scenari di ricerca full-text e vettoriali. Include anche l'intelligenza artificiale integrata facoltativa per estrarre più testo e struttura dal contenuto non elaborato e per suddividere in blocchi e vettorizzare il contenuto per la ricerca vettoriale.

Ricerca per categorie usare Ricerca di intelligenza artificiale di Azure?

Il flusso di lavoro primario è creare, caricare ed eseguire query su un indice. Sebbene sia possibile usare il portale per la maggior parte delle attività, Ricerca di intelligenza artificiale di Azure deve essere usata a livello di codice, gestendo le richieste dal codice client. Il supporto a livello di codice viene fornito tramite API REST e librerie client in .NET, Python, Java e JavaScript SDK per Azure.

"Ricerca di Azure" e "Ricerca cognitiva di Azure" e "Ricerca di intelligenza artificiale di Azure" sono lo stesso prodotto?

Ricerca di Azure è stata rinominata in Ricerca cognitiva di Azure nell'ottobre 2019 per riflettere l'uso esteso (ancora facoltativo) delle competenze cognitive e dell'elaborazione dell'intelligenza artificiale nelle operazioni del servizio. Ricerca cognitiva di Azure è stato rinominato Ricerca di intelligenza artificiale di Azure nell'ottobre 2023 per allinearsi ai servizi di intelligenza artificiale di Azure.

Quali sono le lingue supportate?

L'analizzatore predefinito usato per la tokenizzazione è Lucene standard ed è indipendente dal linguaggio. In caso contrario, il supporto del linguaggio viene espresso tramite analizzatori del linguaggio che applicano regole linguistiche al contenuto in ingresso (indicizzazione) e in uscita (query). Alcune funzionalità, ad esempio il correttore ortografico, sono limitate a un subset di lingue.

Ricerca per categorie integrare la ricerca nella soluzione?

Il codice client deve chiamare le librerie client di Azure SDK o le API REST per connettersi a un indice di ricerca, formulare query e gestire le risposte. È anche possibile scrivere codice che compila e aggiorna un indice oppure esegue indicizzatori a livello di codice o tramite script.

Esiste parità funzionale tra le varie API?

Non sempre. L'API REST è sempre la prima a implementare nuove funzionalità nelle versioni dell'API di anteprima. Le librerie client negli SDK di Azure rileveranno nuove funzionalità nel tempo, ma vengono rilasciate in base alla propria pianificazione.

Anche se le API REST sono inizialmente disponibili con le funzionalità più recenti, gli SDK di Azure offrono maggiore supporto per la codifica e sono consigliati su REST, a meno che non sia disponibile una funzionalità necessaria.

È possibile sospendere il servizio e interrompere la fatturazione?

Non è possibile sospendere un servizio di ricerca. In Ricerca di intelligenza artificiale di Azure le risorse di calcolo vengono allocate al momento della creazione del servizio. Non è possibile rilasciare e recuperare le risorse su richiesta.

È possibile aggiornare, effettuare il downgrade, rinominare o spostare il servizio?

Il livello di servizio, il nome e l'area sono fissi per la durata del servizio.

Se si esegue la migrazione del servizio di ricerca a un'altra sottoscrizione o a un altro gruppo di risorse, è necessario prevedere tempi di inattività?

Se si segue l'elenco di controllo prima di spostare le risorse e assicurarsi che ogni passaggio venga completato, non dovrebbero esserci tempi di inattività.

Indicizzazione

Cosa significa "indicizzazione" in Ricerca di intelligenza artificiale di Azure?

Fa riferimento all'inserimento, all'analisi e all'archiviazione di contenuto testuale e token che popolano un indice di ricerca. L'indicizzazione crea indici invertiti e altre strutture di dati fisici che supportano il recupero delle informazioni.

Crea indici vettoriali se lo schema include campi vettoriali.

È possibile spostare, eseguire il backup e ripristinare gli indici?

Non è disponibile alcun supporto nativo per la conversione degli indici. Gli indici di ricerca sono considerati strutture di dati downstream, accettando contenuto da altre origini dati che raccolgono dati operativi. Di conseguenza, non è disponibile alcun supporto predefinito per il backup e il ripristino degli indici perché l'aspettativa è che si ricompila un indice dai dati di origine se è stato eliminato o si vuole spostarlo.

Tuttavia, se si vuole spostare un indice tra i servizi di ricerca, è possibile provare il codice di esempio index-backup-restore in questo repository di esempio di Ricerca di intelligenza artificiale di Azure .NET. È disponibile anche una versione Python di backup e ripristino.

È possibile ripristinare l'indice o il servizio dopo l'eliminazione?

No, se si elimina un indice o un servizio di Ricerca di intelligenza artificiale di Azure, non è possibile recuperarlo. Quando si elimina un servizio di ricerca, tutti gli indici nel servizio vengono eliminati definitivamente.

È possibile indicizzare da repliche database SQL?

Se si usa l'indicizzatore di ricerca per database SQL di Azure, non esistono restrizioni sull'uso di repliche primarie o secondarie come origine dati durante la compilazione di un indice da zero. L'aggiornamento di un indice con aggiornamenti incrementali (in base ai record modificati) richiede tuttavia la replica primaria. Questo requisito deriva dal database SQL, che garantisce il rilevamento delle modifiche solo nelle repliche primarie. Se si prova a usare repliche secondarie per un carico di lavoro di aggiornamento dell'indice, non esiste alcuna garanzia di ottenere tutti i dati.

Vettori

Che cos'è la ricerca vettoriale?

La ricerca vettoriale è una tecnica che trova i documenti più simili confrontando le relative rappresentazioni vettoriali. Poiché l'obiettivo di una rappresentazione vettoriale è acquisire le caratteristiche essenziali di un elemento in un formato numerico, le query vettoriali possono identificare contenuto simile anche se non esistono corrispondenze esplicite in base a parole chiave o tag. Quando un utente esegue una ricerca, la query viene riepilogata in una rappresentazione vettoriale e il motore di ricerca vettoriale identifica i documenti più simili. Per migliorare l'efficienza nei database di grandi dimensioni, la ricerca vettoriale spesso fornisce i vicini più vicini approssimativi per un vettore di query. Vedere Panoramica della ricerca vettoriale per le specifiche dell'offerta vettoriale di Ricerca di intelligenza artificiale di Azure.

Ricerca di intelligenza artificiale di Azure supporta la ricerca vettoriale?

Ricerca di intelligenza artificiale di Azure supporta l'indicizzazione e il recupero dei vettori. Può vettorizzare stringhe di query e contenuto se si usano le librerie di anteprima e beta.

Come funziona la ricerca vettoriale in Ricerca di intelligenza artificiale di Azure?

Con la ricerca vettoriale autonoma, si usa prima di tutto un modello di incorporamento per trasformare il contenuto in una rappresentazione vettoriale all'interno di uno spazio di incorporamento. È quindi possibile fornire questi vettori in un payload del documento all'indice di ricerca per l'indicizzazione. Per gestire le richieste di ricerca, usare la stessa rete neurale dei dati dall'indicizzazione per trasformare la query di ricerca in una rappresentazione vettoriale e la ricerca vettoriale trova i vettori più simili e restituisce i documenti corrispondenti.

In Ricerca di intelligenza artificiale di Azure è possibile indicizzare i dati vettoriali come campi nei documenti insieme a testo e ad altri tipi di contenuto. Il tipo di dati per un campo vettoriale è Collection(Edm.Single).

È possibile eseguire query vettoriali autonome o in combinazione con altri tipi di query, incluse query e filtri di termini nella stessa richiesta di ricerca.

Ricerca di intelligenza artificiale di Azure può vettorizzare il contenuto o le query?

La vettorizzazione integrata predefinita è ora disponibile in anteprima pubblica.

Il servizio di ricerca supporta la ricerca vettoriale?

La maggior parte dei servizi esistenti supporta la ricerca vettoriale. Se si usa un pacchetto o un'API che supporta la ricerca vettoriale e la creazione dell'indice non riesce, il servizio di ricerca sottostante non supporta la ricerca vettoriale e deve essere creato un nuovo servizio. Questo problema può verificarsi per un piccolo subset di servizi creati prima del 1° gennaio 2019.

È possibile aggiungere la ricerca vettoriale a un indice esistente?

Se il servizio di ricerca supporta la ricerca vettoriale, sia gli indici esistenti che nuovi possono contenere campi vettoriali.

Perché vengono visualizzati limiti di dimensioni dell'indice vettoriale diversi tra i nuovi servizi di ricerca e i servizi di ricerca esistenti?

Stiamo implementando limiti delle dimensioni dell'indice vettoriale migliorati in tutto il mondo per i nuovi servizi di ricerca, ma stiamo ancora costruendo capacità dell'infrastruttura in determinate aree. I nuovi servizi di ricerca creati nelle aree supportate vedranno un aumento dei limiti delle dimensioni degli indici vettoriali. Sfortunatamente, non è possibile eseguire la migrazione dei servizi esistenti ai nuovi limiti.

Ricerca per categorie abilitare la ricerca vettoriale in un indice di ricerca?

Per abilitare la ricerca vettoriale in un indice, è necessario:

  • Aggiungere uno o più campi vettoriali a una raccolta di campi.

  • Aggiungere una sezione "vectorSearch" allo schema di indice specificando la configurazione usata dai campi di ricerca vettoriale, inclusi i parametri dell'algoritmo Nearest Neighbor approssimativo usato, ad esempio HNSW.

  • Usare 2023-11-01 o Azure SDK per creare o aggiornare l'indice, caricare documenti ed eseguire query.

Query

Dove si verifica l'esecuzione di query?

Le query eseguono su un singolo indice di ricerca ospitato nel servizio di ricerca. Non è possibile unire più indici al contenuto di ricerca in due o più indici, ma è possibile eseguire query sugli indici con lo stesso nome in più servizi di ricerca.

Perché vengono trovate zero corrispondenze con termini che sono sicuramente validi?

Il caso più comune non è sapere che ogni tipo di query supporta diversi comportamenti di ricerca e livelli di analisi linguistica. La ricerca full-text, che è il carico di lavoro predominante, include una fase di analisi del linguaggio che suddivide i termini nei moduli radice. Questo aspetto di analisi delle query esegue il cast di una rete più ampia alla ricerca di corrispondenze possibili, perché il termine in formato token corrisponde a un maggior numero di varianti.

Le query con caratteri jolly, fuzzy e regex, tuttavia, non vengono analizzate come query con termini o frasi regolari e possono causare problemi di richiamo se la query non corrisponde alla forma analizzata della parola nell'indice di ricerca. Per altre informazioni sull'analisi e l'analisi delle query, vedere Architettura delle query.

Perché le ricerche con caratteri jolly sono lente?

La maggior parte delle query di ricerca con caratteri jolly, ad esempio prefisso, fuzzy e regex, viene riscritta internamente con termini corrispondenti nell'indice di ricerca. Questa elaborazione aggiuntiva aggiunge alla latenza. Inoltre, è probabile che le query di ricerca generali, ad a* esempio, vengano riscritte con molti termini, che possono essere lente. Per ricerche con caratteri jolly efficienti, valutare la definizione di un analizzatore personalizzato.

È possibile eseguire ricerche tra più indici?

No, una query ha sempre come ambito un singolo indice.

Perché il punteggio di ricerca è una costante 1,0 per ogni corrispondenza?

I punteggi di ricerca vengono generati per le query di ricerca full-text, in base alle proprietà statistiche dei termini corrispondenti e ordinati da alta a bassa nel set di risultati. I tipi di query che non sono la ricerca full-text (carattere jolly, prefisso, regex) non vengono classificati in base a un punteggio di pertinenza. Questo comportamento è impostato a livello di progettazione. Un punteggio costante consente di includere le corrispondenze rilevate tramite l'espansione della query nei risultati, senza influire sulla classificazione.

Si supponga, ad esempio, che un input di "tour*" in una ricerca con caratteri jolly produa corrispondenze in "tour", "tourettes" e "tourmaline". Data la natura di questi risultati, non c'è modo di dedurre ragionevolmente quali termini sono più preziosi di altri. Per questo motivo, le frequenze dei termini vengono ignorate quando l'assegnazione dei punteggi comporta query di tipi con caratteri jolly, prefisso ed espressione regolare. Ai risultati della ricerca basati su un input parziale viene assegnato un punteggio costante per evitare la distorsione verso risultati potenzialmente imprevisti.

Sicurezza

Dove archivia i dati dei clienti in Ricerca intelligenza artificiale di Azure?

Archivia i dati ovunque venga distribuito il servizio. Ricerca di intelligenza artificiale di Azure non archivia i dati dei clienti all'esterno dell'area di distribuzione.

Ricerca intelligenza artificiale di Azure invia i dati dei clienti ad altri servizi per l'elaborazione?

Sì, se si usano le competenze predefinite basate sui servizi di intelligenza artificiale di Azure, l'indicizzatore invia richieste ai servizi di intelligenza artificiale di Azure tramite la rete interna. Se si aggiunge una competenza personalizzata, l'indicizzatore invia contenuto all'URI fornito nella competenza personalizzata sulla rete pubblica.

È possibile controllare l'accesso ai risultati della ricerca in base all'identità utente?

Non esattamente. In genere, gli utenti autorizzati a eseguire l'applicazione sono autorizzati a visualizzare tutti i risultati della ricerca. Ricerca di intelligenza artificiale di Azure non dispone del supporto predefinito per le autorizzazioni a livello di riga o a livello di documento, ma è possibile implementare i filtri di sicurezza come soluzione alternativa.

È possibile controllare l'accesso alle operazioni in base all'identità utente?

Sì, è possibile usare l'autorizzazione basata sui ruoli per le operazioni del piano dati sul contenuto.

È possibile usare il portale di Azure per visualizzare e gestire il contenuto della ricerca se il servizio di ricerca si trova dietro un firewall IP o un endpoint privato?

È possibile usare il portale di Azure in un servizio di ricerca protetto dalla rete se si crea un'eccezione di rete che consente l'accesso a client e portale. Per altre informazioni, vedere Connettersi tramite un firewall IP o connettersi tramite un endpoint privato.

Passaggi successivi

Se la domanda non viene risposta qui, è possibile fare riferimento alle fonti seguenti per altre domande e risposte.

Stack Overflow: Ricerca di intelligenza artificiale di Azure
Funzionamento della ricerca full-text in Ricerca di intelligenza artificiale di Azure
Che cos'è Azure AI Search?