Nejčastější dotazy ke službě Azure AI Search

Najděte odpovědi na nejčastější dotazy týkající se služby Azure AI Search.

OBECNÉ

Co je Azure AI Search?

Azure AI Search poskytuje vyhrazený vyhledávací modul a trvalé úložiště prohledávatelného obsahu pro scénáře fulltextového a vektorového vyhledávání. Zahrnuje také volitelnou, integrovanou AI pro extrakci více textu a struktury z nezpracovaného obsahu a k blokům a vektorizaci obsahu pro vektorové vyhledávání.

Návody pracovat se službou Azure AI Search?

Primárním pracovním postupem je vytvoření, načtení a dotazování indexu. I když můžete portál použít pro většinu úloh, služba Azure AI Search je určená programově a zpracovává požadavky z klientského kódu. Programová podpora je poskytována prostřednictvím rozhraní REST API a klientských knihoven v .NET, Pythonu, Javě a javascriptových sadách SDK pro Azure.

Jsou "Azure Search" a "Azure Cognitive Search" a "Azure AI Search" stejný produkt?

Služba Azure Search se v říjnu 2019 přejmenovala na Azure Cognitive Search, aby odrážela rozšířené (ještě volitelné) využití kognitivních dovedností a zpracování umělé inteligence v operacích služeb. Služba Azure Cognitive Search se v říjnu 2023 přejmenovala na Azure AI Search, aby odpovídala službám Azure AI.

Jaké jazyky jsou podporovány?

Výchozí analyzátor používaný pro tokenizaci je standardní Lucene a je nezávislý na jazyce. V opačném případě se podpora jazyka vyjadřuje prostřednictvím analyzátorů jazyka, které používají jazyková pravidla pro příchozí (indexování) a odchozí obsah (dotazy). Některé funkce, jako je například kontrola pravopisu, jsou omezené na podmnožinu jazyků.

Návody integrovat vyhledávání do svého řešení?

Klientský kód by měl volat klientské knihovny sady Azure SDK nebo rozhraní REST API pro připojení k indexu vyhledávání, formulovat dotazy a zpracovávat odpovědi. Můžete také napsat kód, který sestaví a aktualizuje index nebo spouští indexery programově nebo pomocí skriptu.

Existuje funkční parita napříč různými rozhraními API?

Ne vždy. Rozhraní REST API je vždy první, která implementuje nové funkce ve verzích api ve verzi Preview. Klientské knihovny v sadách Azure SDK zachytávají nové funkce v průběhu času, ale vydávají se podle vlastního plánu.

I když jsou rozhraní REST API poprvé k dispozici s nejnovějšími funkcemi, sady Azure SDK poskytují větší podporu kódování a doporučují se přes REST, pokud není k dispozici požadovaná funkce.

Můžu službu pozastavit a zastavit fakturaci?

Vyhledávací službu nejde pozastavit. Ve službě Azure AI Search se výpočetní prostředky přidělují při vytváření služby. Tyto prostředky není možné uvolnit a uvolnit na vyžádání.

Můžu službu upgradovat, downgradovat, přejmenovat nebo přesunout?

Úroveň služby, název a oblast jsou pevné po celou dobu životnosti služby.

Pokud migruji vyhledávací službu do jiného předplatného nebo skupiny prostředků, mám očekávat nějaké výpadky?

Pokud postupujete podle kontrolního seznamu před přesunem prostředků a ujistěte se, že je každý krok dokončený, nemělo by dojít k žádnému výpadku.

Indexování

Co znamená "indexování" ve službě Azure AI Search?

Odkazuje na příjem dat, analýzu a ukládání textového obsahu a tokenů, které naplňují index vyhledávání. Indexování vytváří invertované indexy a další fyzické datové struktury, které podporují načítání informací.

Vytvoří vektorové indexy, pokud schéma obsahuje vektorová pole.

Můžu přesunout, zálohovat a obnovit indexy?

Pro přenos indexů neexistuje žádná nativní podpora. Indexy vyhledávání jsou považovány za podřízené datové struktury a přijímají obsah z jiných zdrojů dat, které shromažďují provozní data. Proto neexistuje žádná integrovaná podpora zálohování a obnovování indexů, protože očekáváte, že index znovu sestavíte ze zdrojových dat, pokud jste je odstranili, nebo ho chcete přesunout.

Pokud ale chcete přesunout index mezi vyhledávacími službami, můžete vyzkoušet ukázkový kód pro obnovení indexu a zálohování v tomto ukázkovém úložišti Azure AI Search .NET. Existuje také verze zálohování a obnovení Pythonu.

Můžu po odstranění obnovit index nebo službu?

Ne, pokud odstraníte index nebo službu Azure AI Search, nedá se obnovit. Když odstraníte vyhledávací službu, všechny indexy ve službě se trvale odstraní.

Můžu indexovat z replik služby SQL Database?

Pokud používáte indexer vyhledávání pro Azure SQL Database, neexistují žádná omezení použití primárních nebo sekundárních replik jako zdroje dat při vytváření indexu úplně od začátku. Aktualizace indexu s přírůstkovými aktualizacemi (na základě změněných záznamů) ale vyžaduje primární repliku. Tento požadavek pochází ze služby SQL Database, která zaručuje sledování změn pouze u primárních replik. Pokud se pokusíte použít sekundární repliky pro úlohu aktualizace indexu, není zaručeno, že získáte všechna data.

Vektory

Co je vektorové vyhledávání?

Vektorové vyhledávání je technika, která najde nejvíce podobné dokumenty porovnáním jejich vektorových reprezentací. Vzhledem k tomu, že cílem vektorové reprezentace je zachytit základní charakteristiky položky v číselném formátu, vektorové dotazy mohou identifikovat podobný obsah i v případě, že neexistují explicitní shody založené na klíčových slovech nebo značkách. Když uživatel provede vyhledávání, dotaz se shrne do vektorové reprezentace a vektorový vyhledávací modul identifikuje nejpodobnější dokumenty. Pokud chcete zvýšit efektivitu u velkých databází, vektorové vyhledávání často poskytuje přibližné nejbližší sousedy vektoru dotazu. Podívejte se na přehled vektorového vyhledávání vektorů služby Azure AI Search.

Podporuje Azure AI Search vektorové vyhledávání?

Azure AI Search podporuje indexování a načítání vektorů. Pokud použijete knihovny preview a beta, může vektorizovat řetězce dotazů a obsah.

Jak funguje vektorové vyhledávání ve službě Azure AI Search?

Při samostatném vektorovém vyhledávání použijete nejprve model vkládání k transformaci obsahu na vektorovou reprezentaci v prostoru pro vložení. Tyto vektory pak můžete zadat v datové části dokumentu do indexu vyhledávání pro indexování. Pokud chcete obsluhovat požadavky hledání, použijete stejný název DNN od indexování k transformaci vyhledávacího dotazu na vektorovou reprezentaci a hledání vektorů vyhledá nejvíce podobných vektorů a vrátí odpovídající dokumenty.

Ve službě Azure AI Search můžete vektorová data indexovat jako pole v dokumentech společně s textovými a jinými typy obsahu. Datový typ vektorového pole je Collection(Edm.Single).

Vektorové dotazy mohou být vystaveny samostatně nebo v kombinaci s jinými typy dotazů, včetně dotazů termínů a filtrů ve stejném požadavku vyhledávání.

Může Azure AI Search vektorizovat můj obsah nebo dotazy?

Integrovaná vektorizace je teď ve verzi Public Preview.

Podporuje moje vyhledávací služba vektorové vyhledávání?

Většina existujících služeb podporuje vektorové vyhledávání. Pokud používáte balíček nebo rozhraní API, které podporuje vektorové vyhledávání a vytváření indexů selže, podkladová vyhledávací služba nepodporuje vektorové vyhledávání a musí se vytvořit nová služba. K tomu může dojít u malé podmnožina služeb vytvořených před 1. lednem 2019.

Můžu do existujícího indexu přidat vektorové vyhledávání?

Pokud vaše vyhledávací služba podporuje vektorové vyhledávání, můžou existující i nové indexy obsahovat vektorová pole.

Proč se mezi novými vyhledávacími službami a existujícími vyhledávacími službami zobrazují různá omezení velikosti indexu vektorů?

Zavádíme vylepšené limity velikosti indexu vektorů po celém světě pro nové vyhledávací služby, ale stále vytváříme kapacitu infrastruktury v určitých oblastech. Nové vyhledávací služby vytvořené v podporovaných oblastech uvidí zvýšené limity velikosti vektorových indexů. Na nové limity bohužel nemůžeme migrovat stávající služby.

Návody povolit vektorové vyhledávání v indexu vyhledávání?

Pokud chcete povolit vektorové vyhledávání v indexu, měli byste:

  • Přidejte jedno nebo více vektorových polí do kolekce polí.

  • Do schématu indexu přidejte oddíl "vectorSearch" určující konfiguraci používanou poli vektorového vyhledávání, včetně parametrů algoritmu Přibližný nejbližší soused, který se používá, například HNSW.

  • K vytvoření nebo aktualizaci indexu, načtení dokumentů a dotazů k problémům použijte sadu Azure SDK 2023-11-01 nebo sadu Azure SDK.

Dotazy

Kde dochází ke spuštění dotazu?

Dotazy se spouštějí přes jeden index vyhledávání, který je hostovaný ve vaší vyhledávací službě. Nemůžete připojit více indexů k vyhledávání obsahu ve dvou nebo více indexech, ale můžete dotazovat indexy se stejným názvem ve více vyhledávacích službách.

Proč existují nulové shody podle podmínek, které vím, že jsou platné?

Nejběžnějším případem není znalost, že každý typ dotazu podporuje různé chování vyhledávání a úrovně lingvistických analýz. Fulltextové vyhledávání, což je převládající úloha, zahrnuje fázi analýzy jazyka, která rozděluje termíny do kořenových formulářů. Tento aspekt analýzy dotazů přetypuje širší síť přes možné shody, protože tokenizovaný termín odpovídá většímu počtu variant.

Zástupné, přibližné a regulární dotazy se ale neanalyzuje, jako jsou běžné dotazy na termíny nebo fráze, a můžou vést ke špatnému odvolání, pokud se dotaz neshoduje s analyzovanou formou slova v indexu vyhledávání. Další informace o analýze a analýze dotazů najdete v architektuře dotazů.

Proč jsou moje vyhledávání se zástupnými cardy pomalé?

Většina vyhledávacích dotazů se zástupnými čísly, jako jsou předpona, přibližné hodnoty a regulární výrazy, se interně přepíší s odpovídajícími termíny v indexu vyhledávání. Toto dodatečné zpracování zvyšuje latenci. Rozsáhlé vyhledávací dotazy, například a* , se pravděpodobně přepíšou mnoha termíny, což může být pomalé. Pro výkonná vyhledávání se zástupnými čísly zvažte definování vlastního analyzátoru.

Můžu prohledávat více indexů?

Ne, dotaz je vždy vymezen na jeden index.

Proč je skóre hledání konstantou 1,0 pro každou shodu?

Skóre hledání se generují pro dotazy fulltextového vyhledávání na základě statistických vlastností odpovídajících termínů a seřazené vysoké až nízké hodnoty v sadě výsledků. Typy dotazů, které nejsou fulltextovým vyhledáváním (zástupné znaménka, předpona, regulární výraz), nejsou seřazené podle skóre relevance. Toto chování je záměrné. Konstantní skóre umožňuje zahrnout do výsledků shody nalezené prostřednictvím rozšíření dotazu, aniž by to ovlivnilo pořadí.

Předpokládejme například, že vstup "tour*" ve vyhledávání se zástupným znakem vytváří shody na "tours", "tourettes" a "tourmaline". Vzhledem k povaze těchto výsledků neexistuje způsob, jak rozumně odvodit, které termíny jsou cennější než jiné. Z tohoto důvodu jsou frekvence termínů ignorovány při vyhodnocování výsledků v dotazech typů se zástupnými čísly, předponou a regulárními výrazy. Výsledky hledání založené na částečném vstupu mají konstantní skóre, aby nedocházelo k předsudkům vůči potenciálně neočekávaným shodám.

Zabezpečení

Kde Azure AI Search ukládá zákaznická data?

Ukládá vaše data všude, kde je vaše služba nasazená. Azure AI Search neukládá zákaznická data mimo oblast nasazení.

Odesílá Azure AI Search zákaznická data do jiných služeb ke zpracování?

Ano, pokud používáte integrované dovednosti založené na službách Azure AI, indexer odesílá požadavky službám Azure AI přes interní síť. Pokud přidáte vlastní dovednost, indexer odešle obsah na identifikátor URI zadaný ve vlastní dovednosti přes veřejnou síť.

Můžu řídit přístup k výsledkům hledání na základě identity uživatele?

Ne přesně. Uživatelé, kteří mají oprávnění ke spuštění vaší aplikace, mají obvykle také oprávnění zobrazit všechny výsledky hledání. Azure AI Search nemá integrovanou podporu oprávnění na úrovni řádků nebo dokumentů, ale filtry zabezpečení můžete implementovat jako alternativní řešení.

Můžu řídit přístup k operacím na základě identity uživatele?

Ano, pro operace roviny dat s obsahem můžete použít autorizaci na základě role.

Můžu pomocí webu Azure Portal zobrazit a spravovat obsah vyhledávání, pokud je vyhledávací služba za bránou firewall protokolu IP nebo privátním koncovým bodem?

Pokud vytvoříte výjimku sítě, která umožňuje klientský a portálový přístup, můžete použít Azure Portal ve službě Search chráněné sítí. Další informace najdete v tématu Připojení přes bránu firewall protokolu IP nebo připojení prostřednictvím privátního koncového bodu.

Další kroky

Pokud tady nenajdete odpověď na vaši otázku, můžete se podívat na následující zdroje, kde najdete další otázky a odpovědi.

Stack Overflow: Azure AI Search
Jak funguje fulltextové vyhledávání ve službě Azure AI Search
Co je Azure AI Search?