Co je Azure Cognitive Search?

Azure Cognitive Search (dříve Označované jako"Azure Search") je cloudová vyhledávací služba, která vývojářům poskytuje infrastrukturu, rozhraní API a nástroje pro vytváření bohatého vyhledávacího prostředí nad privátním heterogenní obsahem ve webových, mobilních a podnikových aplikacích.

Hledání je základem každé aplikace, která uživatelům předá textový obsah, a to s běžnými scénáři, jako je katalog nebo hledání dokumentů, online maloobchod nebo dolování znalostí pro datové vědy.

Při vytváření vyhledávací služby budete pracovat s následujícími funkcemi:

  • Vyhledávací modul pro fulltextové vyhledávání s úložištěm pro obsah vlastněný uživatelem ve vyhledávacím indexu
  • Bohaté indexování s analýzou textu a volitelným rozšířením AI pro pokročilou extrakci a transformaci obsahu
  • Bohaté možnosti dotazů, včetně jednoduché syntaxe, úplné syntaxe Lucene a vyhledávání typeahead
  • Programovatelnost prostřednictvím rozhraní REST API a klientských knihoven v jazyce Azure SDK pro .NET, Python, Javu a JavaScript
  • Integrace Azure na datové vrstvě, vrstvě strojového učení a AI (Cognitive Services)

Vyhledávací služba je architekturálně mezi externími úložištěmi dat, která obsahují neindexovaná data, a klientskou aplikací, která odesílá požadavky na dotazy do indexu vyhledávání a zpracovává odpověď.

Azure Cognitive Search architektury

Napříč platformou Azure se Cognitive Search může integrovat s dalšími službami Azure ve formě indexerů, které automatizují příjem a načítání dat ze zdrojů dat Azure, a sad dovedností, které zahrnují použitelné AI z Cognitive Services, jako je zpracování obrázků a přirozeného jazyka, nebo vlastní AI, které vytvoříte v Azure Machine Learning nebo zabalíte do Azure Functions.

Uvnitř vyhledávací služby

V samotné vyhledávací službě jsou dvě primární úlohy indexování a dotazování.

  • Indexování je proces příjmu, který načte obsah do vyhledávací služby a zajistí, že bude možné ho prohledávat. Interně se příchozí text zpracovává do tokenů a ukládá se do obrácených indexů pro rychlé prohledávání. Můžete nahrát libovolný text ve formě dokumentů JSON.

    Kromě toho, pokud váš obsah obsahuje smíšené soubory, máte možnost přidat rozšíření AI prostřednictvím kognitivních dovedností. Rozšíření AI může extrahovat text vložený do souborů aplikace a také odvodit text a strukturu z netextových souborů analýzou obsahu.

    Dovednosti, které poskytují analýzu, jsou předdefinované od Microsoftu nebo vlastní dovednosti, které vytvoříte. Následné analýzy a transformace mohou vést k novým informacím a strukturám, které dříve neexistovaly, a poskytovat tak vysoký nástroj pro mnoho scénářů vyhledávání a dolování znalostí.

  • K dotazování může dojít, jakmile se index naplní prohledáovatelným textem, když klientská aplikace odešle požadavky na dotazy vyhledávací službě a zpracuje odpovědi. Veškeré provádění dotazů je nad vyhledávacím indexem, který vytvoříte, vlastníte a uložíte ve službě. V klientské aplikaci se vyhledávací prostředí definuje pomocí rozhraní API z Azure Cognitive Search a může zahrnovat ladění podle relevance, automatické dokončování, porovnávání synonym, přibližné shody, porovnávání vzorů, filtrování a řazení.

Funkce se zveřejňuje prostřednictvím jednoduchého rozhraní REST API nebo .NET SDK, které zakrývá zákonitou složitost načítání informací. Můžete také použít rozhraní Azure Portal pro správu služeb a správu obsahu s nástroji pro vytváření prototypů a dotazování indexů a sad dovedností. Služba běží v cloudu, proto infrastrukturu a dostupnost spravuje Microsoft.

Azure Cognitive Search se dobře hodí pro následující scénáře aplikací:

  • Konsolidaci heterogenního obsahu do privátního, uživatelem definovaného vyhledávacího indexu Přenačte zatížení indexování a dotazů do vyhrazené vyhledávací služby.

  • Snadná implementace funkcí souvisejících s vyhledáváním: ladění relevance, faceted navigace, filtry (včetně geoprostorového vyhledávání), mapování synonym a automatické dokončování.

  • Transformujte velké nediferentované textové nebo obrázové soubory nebo soubory aplikací uložené ve službě Azure Blob Storage nebo Cosmos DB na prohledáovatelné dokumenty JSON. Toho se dosahuje během indexování prostřednictvím kognitivních dovedností, které přidávají externí zpracování.

  • Přidejte lingvistickou nebo vlastní analýzu textu. Pokud máte obsah v jiné než anglické jazykové verzi, Azure Cognitive Search analyzátory Lucene i procesory přirozeného jazyka společnosti Microsoft. Analyzátory můžete také nakonfigurovat tak, aby se dosáhlo specializovaného zpracování nezpracovaných obsahu, jako je například filtrování diakritických znamén nebo rozpoznání a zachování vzorů v řetězcích.

Další informace o konkrétních funkcích najdete v tématu Funkce Azure Cognitive Search

Jak začít

End-to-end zkoumání základních vyhledávacích funkcí lze provést ve čtyřech krocích:

  1. Vytvořte vyhledávací službu na sdílené úrovni Free nebo fakturovatelnou úroveň pro vyhrazené prostředky, které používá pouze vaše služba. Všechny rychlé starty a kurzy je možné dokončit ve sdílené službě.

  2. K vytvoření vyhledávacího indexu můžete použít portál, REST API, .NET SDKnebo jinou sadu SDK. Schéma indexu definuje strukturu prohledáovatelného obsahu.

  3. Upload k nabízení dokumentů JSON z libovolného zdroje pomocí modelu push, nebo použijte model "pull" (indexery), pokud jsou vaše zdrojová data v Azure.

  4. Dotazování indexu pomocí Průzkumníka služby Search na portálu, REST API, .NET SDKnebo jiné sady SDK.

Pokud chcete začít zkoumat, začněte průvodcem importem dat a integrovaným zdrojem dat Azure, který umožňuje vytvořit, načíst a dotazovat index během několika minut.

Pokud chcete pomoct se složitými nebo vlastními řešeními, obraťte se na partnera s velmi odbornými znalostmi Cognitive Search technologií.

Porovnání možností hledání

Zákazníci se často ptají, Azure Cognitive Search v porovnání s jinými řešeními souvisejícími s vyhledáváním. Následující tabulka shrnuje klíčové rozdíly.

Porovnaná alternativa Klíčové rozdíly
Microsoft Search Microsoft Search je pro Microsoft 365 uživatele, kteří se potřebují dotazovat na obsah v SharePoint. Nabízí se jako prostředí pro vyhledávání připravené k použití, povolené a nakonfigurované správci, s možností přijímat externí obsah prostřednictvím konektorů od Microsoftu a jiných zdrojů. Pokud tento postup popisuje váš scénář, Microsoft Search s Microsoft 365 je atraktivní možnost k prozkoumání.

Naproti tomu Azure Cognitive Search dotazy na index, který definujete, naplněný daty a dokumenty, které vlastníte, často z různých zdrojů. Azure Cognitive Search nabízí možnosti prohledávacího nástroje pro některé zdroje dat Azure prostřednictvím indexerů, ale jakýkoli dokument JSON, který odpovídá vašemu schématu indexu, můžete nasazit do jednoho konsolidovaného prohledávacího prostředku. Kanál indexování můžete také přizpůsobit tak, aby zahrnoval strojové učení a lexikální analyzátory. Vzhledem Cognitive Search, že je součástí modulu plug-in ve větších řešeních, můžete vyhledávání integrovat do téměř jakékoli aplikace na libovolné platformě.
Bing Rozhraní API Bingu pro vyhledávání na webu hledá odpovídající zadané termíny v indexech na Bing.com. Indexy jsou vytvořené z webového obsahu HTML, XML a dalších typů na veřejných webech. Vlastní vyhledávání Bingu staví na stejných základech a nabízí stejnou technologii prohledávacího modulu pro typy webového obsahu vymezeného na jednotlivé weby.

V Cognitive Search můžete definovat a naplnit index. Indexery můžete použít k procházení dat ve zdrojích dat Azure nebo k nasouvání libovolného dokumentu JSON odpovídajícího indexu do vyhledávací služby.
Databázové hledání Mnoho databázových platforem obsahuje integrované prostředí pro vyhledávání. SQL Server má fulltextové vyhledávání. Cosmos DB a podobné technologie mají dotazovatelné indexy. Při vyhodnocování produktů, které kombinují vyhledávání a úložiště, může být obtížné určit, kterým směrem se vydat. Mnoho řešení používá obojí: DBMS pro úložiště a Azure Cognitive Search pro specializované vyhledávací funkce.

V porovnání s hledáním DBMS ukládá Azure Cognitive Search obsah z heterogenních zdrojů a nabízí specializované funkce pro zpracování textu, jako je zpracování textu s lingvistickým obsahem (stemming, lematizace, slovní formy) v 56 jazycích. Podporuje také automatické opravy slov s pravopisnými chybami, synonyma, návrhy, ovládací prvky pro určování skóre, omezující vlastnosti a vlastní tokenizaci. Fulltextový vyhledávací modul v Azure Cognitive Search je postaven na Apache Lucene, oborovém standardu načítání informací. I když Azure Cognitive Search data ve formě inverzního indexu, nenahrazuje skutečné úložiště dat a nedoporučujeme je v této kapacitě používat. Další informace najdete v tomto příspěvku fóra.

Dalším důležitým bodem v této kategorii je využití prostředků. Indexování a určité operace dotazování jsou často velmi náročné na výpočetní operace. Přenesení zátěže vyhledávání z DBMS na vyhrazené řešení v cloudu zachová systémové prostředky pro zpracování transakcí. Díky přenesení vyhledávání na externí prostředky můžete také snadno upravit kapacitu tak, aby odpovídala množství dotazů.
Vyhrazené řešení pro vyhledávání Za předpokladu, že jste se rozhodli pro vyhrazené vyhledávání s komplexními funkcemi, poslední kategorií je srovnání místních řešení a cloudové služby. Mnoho vyhledávacích technologií nabízí kontrolu nad indexováním a kanály dotazů, přístup k širší syntaxi dotazů a filtrování, řízení podle priority a relevance a funkce pro samořízené a inteligentní vyhledávání.

Cloudová služba je správnou volbou, pokud chcete řešení na klíč s minimální režií a údržbou a upravitelnou kapacitou.

V rámci cloudu nabízí několik poskytovatelů srovnatelné základní funkce s fulltextovým vyhledáváním, geografickým vyhledáváním a schopností zvládat určitou úroveň nejednoznačnosti v zadáních hledání. Obvykle jde o specializovanou funkci nebo snadnost a celkovou jednoduchost rozhraní API, nástrojů a správy, která určuje, co je nejvhodnější.

Mezi poskytovateli cloudu je Azure Cognitive Search nejsilnější pro úlohy fulltextového vyhledávání nad obchody s obsahem a databázemi v Azure, pro aplikace, které primárně spoléhají na hledání při načítání informací i navigaci v obsahu.

Mezi hlavní silné stránky patří:

  • Integrace dat Azure (prohledávací moduly) ve vrstvě indexování
  • Azure Private Link integrace s podporou požadavků na zabezpečení mimo internet
  • Integrace se zpracováním AI, aby bylo možné neprohledávat typy obsahu prohledávat textem.
  • Jazykové a vlastní analýzy s analyzátory pro výkonné fulltextové vyhledávání v 56 jazycích
  • Důležité funkce:bohatý dotazovací jazyk, ladění relevance, faceting, automatické dokončování, synonyma, geografické vyhledávání a složení výsledků.
  • Škálování kapacity, spolehlivost a špičková dostupnost Azure

Mezi naše zákazníky patří online katalogy, obchodní programy a aplikace pro zjišťování dokumentů, Azure Cognitive Search využívat co nejširší škálu funkcí v podniku.

Podívejte se na toto video

V tomto 15minutovém videu si prohlédněte hlavní možnosti Azure Cognitive Search.