Rychlý Start: vytvoření znalostní databáze v Azure Portal

znalostní báze je funkce Azure Kognitivní hledání, která přijímá výstup z kanálu rozšíření AI a zpřístupňuje je v Azure Storage pro aplikace a úlohy pro příjem dat. Rozšíření vytvořená kanálem, jako je přeložený text, text v OCR, tagované obrázky a rozpoznané entity – jsou probíhají v tabulkách nebo objektech blob, kde k nim mohou mít pøístup jakékoli aplikace nebo úlohy, které se připojují k Azure Storage.

V tomto rychlém startu nastavíte svá data a potom spustíte průvodce importem dat , který vytvoří kanál pro rozšíření, který taky vygeneruje znalostní bázi. Znalostní báze bude obsahovat původní textový obsah získaný ze zdroje (recenze zákazníků v hotelu) a obsahu vygenerovaného AI, který obsahuje popisek mínění, extrakci klíčových frází a překlad textu pro poznámky zákazníků, které nejsou anglické.

Poznámka

V tomto rychlém startu se dozvíte, jak nejrychlejší postupovat do kompletního znalostní báze v Azure Storage. Podrobnější vysvětlení jednotlivých kroků najdete v tématu Vytvoření úložiště znalostí v klidovém umístění .

Požadavky

V tomto rychlém startu se používají následující služby:

V tomto rychlém startu se také používá Cognitive Services pro obohacení AI. Vzhledem k tomu, že úloha je tak malá, Cognitive Services po dobu bezplatného zpracování po dobu až 20 transakcí klepnuli na pozadí. To znamená, že můžete dokončit toto cvičení, aniž byste museli vytvořit další prostředek Cognitive Services.

Spustit Průvodce

  1. Přihlaste se k webu Azure Portal pomocí svého účtu Azure.

  2. Vyhledejte vyhledávací službu a na stránce Přehled klikněte na příkaz importovat data na panelu příkazů a vytvořte znalostní bázi ve čtyřech krocích.

    Snímek obrazovky s příkazem importovat data

Krok 1: Vytvoření zdroje dat

Vzhledem k tomu, že data jsou více řádky v jednom souboru CSV, nastavte režim analýzy tak, aby pro každý řádek získal jeden vyhledávací dokument.

  1. v Připojení k vašim datům vyberte Azure Blob Storage, vyberte účet a kontejner, který jste vytvořili.

  2. Jako název zadejte "hotelové recenze – DS".

  3. V části režim analýzy vyberte text s oddělovači a potom zaškrtněte políčko první řádek obsahuje záhlaví . Ujistěte se, že znak oddělovače je čárka (,).

  4. v připojovacím řetězci vložte do svého účtu Azure Storage připojovací řetězec.

    Připojovací řetězec má následující formát: DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.net

  5. Do pole kontejnery zadejte název kontejneru objektů blob, který uchovává data ("hotelové recenze").

    Stránka by měla vypadat podobně jako na následujícím snímku obrazovky.

    Snímek obrazovky definice zdroje dat

  6. Pokračujte na další stránku.

Krok 2: Přidání dovedností

V tomto kroku průvodce přidejte dovednosti pro obohacení AI. Zdrojová data obsahují recenze zákazníků v angličtině a francouzštině. Mezi dovednosti, které jsou pro tuto datovou sadu relevantní, patří extrakce klíčových frází, detekce mínění a překlad textu. V pozdějším kroku budou tato rozšíření "" provedená "do úložiště znalostní báze jako tabulky Azure.

  1. Rozbalte položku připojit Cognitive Services. Ve výchozím nastavení je vybrané bezplatné (omezená rozšíření) . Tento prostředek můžete použít, protože počet záznamů ve HotelReviews-Free.csv je 19 a tento bezplatný prostředek umožňuje až 20 transakcí za den.

  2. Rozbalte položku Přidat rozšíření.

  3. Do dovednosti název zadejte "hotelové recenze – SS".

  4. V poli zdrojová data zadejte reviews_text.

  5. Pro úroveň podrobností obohacení vyberte stránky (5000 znaků bloků dat).

  6. V případě dovedností pro rozpoznávání textu vyberte následující dovednosti:

    • Extrakce klíčových frází
    • Přeložení textu
    • Rozpoznávání jazyka
    • Zjistit mínění

    Stránka by měla vypadat jako na následujícím snímku obrazovky:

    Snímek obrazovky s definicí dovednosti

  7. Přejděte dolů a rozbalte možnost Uložit obohacení do úložiště znalostí.

  8. vyberte zvolit existující připojení a pak vyberte účet Azure Storage. Zobrazí se stránka kontejnery, abyste mohli vytvořit kontejner pro projekce. Pro odlišení zdrojového obsahu a obsahu znalostní báze doporučujeme, abyste přijali konvence pojmenovávání předpon, jako je například "kstore-hotelu-prohlídek".

  9. Vraťte se do Průvodce importem dat, vyberte následující projekce tabulky Azure. Průvodce vždy nabízí projekci dokumentů . Další projekce se budou nabízet v závislosti na vybraných dovednostech (jako jsou klíčové fráze) nebo na členitosti (stránky):

    • Dokumenty
    • Stránky
    • Klíčové fráze

    Následující snímek obrazovky znázorňuje výběr projekce tabulky v průvodci.

    Snímek obrazovky definice znalostní báze Store

  10. Pokračujte na další stránku.

Krok 3: Konfigurace indexu

V tomto kroku průvodce nakonfigurujte index pro volitelné dotazy fulltextového vyhledávání. Průvodce zobrazí ukázkový zdroj dat pro odvození polí a datových typů. Stačí vybrat atributy pro požadované chování. Například atribut, který lze načíst, umožní službě Search vracet hodnotu pole, zatímco vyhledávání umožní fulltextové vyhledávání v poli.

  1. Jako název indexu zadejte "hotely-recenze-idx".

  2. U atributů přijměte výchozí výběry: načístelné a prohledávatelné pro nová pole, která vytváří kanál.

    Index by měl vypadat podobně jako na následujícím obrázku. Vzhledem k tomu, že seznam je dlouhý, ne všechna pole jsou v obrázku viditelná.

    Snímek obrazovky definice indexu

  3. Pokračujte na další stránku.

Krok 4: konfigurace a spuštění indexeru

V tomto kroku průvodce nakonfigurujte indexer, který se bude načítat zdrojem dat, dovednosti a indexem, který jste definovali v předchozím kroku průvodce.

  1. Jako název zadejte "hotelové recenze – idxr".

  2. Pro plán ponechte výchozí nastavení.

  3. Vyberte Odeslat a spusťte indexer. V tomto kroku dojde k extrakci dat, indexování a uplatnění odbornosti rozpoznávání.

Krok 5: kontrolní stav

Na stránce Přehled otevřete kartu indexery uprostřed stránky a potom vyberte hotely-recenze – idxr. Během minuty nebo dvou stavů by měl stav "probíhá" na "úspěch" s nulovými chybami a upozorněními.

kontrolovat tabulky v prohlížeči Storage

v Azure Portal přepněte na účet Azure Storage a pomocí Storage prohlížeče zobrazte nové tabulky. Měli byste vidět tři tabulky, jednu pro každou projekci, která byla nabídnuta v části "uložení obohacení" na stránce přidat rozšíření.

  • "hotelReviewssDocuments" obsahuje všechny uzly první úrovně stromu rozšíření dokumentu, které nejsou kolekcemi.

  • "hotelReviewssKeyPhrases" obsahuje dlouhý seznam pouze klíčových frází extrahovaných ze všech revizí. Dovednosti, které výstupní kolekce (pole), jako jsou klíčové fráze a entity, budou mít výstup odeslaný do samostatné tabulky.

  • "hotel Zmijová Stránka" obsahuje obohacená pole vytvořená na každé stránce, která byla rozdělena z dokumentu. V tomto zdroji dovedností a zdroji dat se rozšiřují stránky, které se skládají z popisků mínění a přeloženého textu. Tabulka pages (nebo tabulka vět, pokud určíte konkrétní úroveň členitosti) se vytvoří, když v definici sady dovedností zvolíte úroveň členitosti stránek.

Všechny tyto tabulky obsahují sloupce ID, které podporují relace mezi tabulkami v jiných nástrojích a aplikacích. Když otevřete tabulku, posuňte se za tato pole a zobrazte pole obsahu přidaná kanálem.

V tomto rychlém startu by tabulka pro hotel UžisPages měla vypadat podobně jako na následujícím snímku obrazovky:

Snímek obrazovky vygenerované tabulky v prohlížeči Storage Browser

Vyčištění

Pokud pracujete s vlastním předplatným, je vhodné vždy na konci projektu zkontrolovat, jestli budete vytvořené prostředky ještě potřebovat. Prostředky, které necháte běžet, vás stojí peníze. Můžete odstraňovat prostředky jednotlivě nebo odstraněním skupiny prostředků odstranit celou sadu prostředků najednou.

Prostředky můžete najít a spravovat na portálu pomocí odkazu Všechny prostředky nebo Skupiny prostředků v levém navigačním podokně.

Pokud používáte bezplatnou službu, mějte na paměti, že jste omezeni na tři indexy, indexery a zdroje dat. Pokud chcete zůstat pod limitem, můžete odstranit jednotlivé položky na portálu.

Tip

Pokud chcete toto cvičení zopakovat nebo vyzkoušet jiný názorný postup rozšiřování AI, odstraňte indexer hotel-reviews-idxr a související objekty a vytvořte je znovu. Odstranění indexeru resetuje čítač bezplatných denních transakcí na nulu.

Další kroky

Teď, když jste se seznámili s úložištěm znalostí, se podívejte na jednotlivé kroky tak, že přepnete na podrobný REST API průvodce. Úlohy, které průvodce zpracovává interně, jsou vysvětleny v návodu REST.