Snabbstart: Skapa ett kunskapslager i Azure Portal

Kunskapslager är en funktion i Azure Cognitive Search som accepterar utdata från en AI-berikningspipeline och gör den tillgänglig i Azure Storage för underordnade appar och arbetsbelastningar. Berikar som skapats av pipelinen – till exempel översatt text, OCR-text, taggade bilder och identifierade entiteter – projiceras i tabeller eller blobar, där de kan nås av alla appar eller arbetsbelastningar som ansluter till Azure Storage.

I den här snabbstarten ska du konfigurera dina data och sedan köra guiden Importera data för att skapa en berikningspipeline som också genererar ett kunskapslager. Kunskapslagret innehåller originaltextinnehåll som hämtas från källan (kundrecensioner av ett hotell), plus AI-genererat innehåll som innehåller en sentimentetikett, extrahering av nyckelfraser och textöversättning av kundkommentarer som inte är på engelska.

Anteckning

Den här snabbstarten visar den snabbaste vägen till ett färdigt kunskapslager i Azure Storage. Mer detaljerade förklaringar av varje steg finns i Skapa ett kunskapslager i REST i stället.

Förutsättningar

I den här snabbstarten används följande tjänster:

Den här snabbstarten använder Cognitive Services för AI-berikning. Eftersom arbetsbelastningen är så liten Cognitive Services i bakgrunden för kostnadsfri bearbetning för upp till 20 transaktioner. Det innebär att du kan slutföra den här övningen utan att behöva skapa ytterligare en Cognitive Services resurs.

Starta guiden

  1. Logga in på Azure-portalen med ditt Azure-konto.

  2. Leta upp söktjänsten och klicka på Importera data i kommandofältet på sidan Översikt för att skapa ett kunskapslager i fyra steg.

    Skärmbild av kommandot Importera data

Steg 1: Skapa en datakälla

Eftersom data är flera rader i en CSV-fil anger du parsningsläget för att hämta ett sökdokument för varje rad.

  1. I Anslut till dina data väljer du Azure Blob Storage och väljer det konto och den container som du skapade.

  2. Som Namn anger du "hotel-reviews-ds".

  3. För Parsningsläge väljer du Avgränsad text och markerar sedan kryssrutan Första raden innehåller rubrik. Kontrollera att avgränsartecknet är ett kommatecken (,).

  4. I Anslutningssträng klistrar du in en anslutningssträng till ditt Azure Storage konto.

    En anslutningssträng har följande format: DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.net

  5. I Containrar anger du namnet på blobcontainern som innehåller data ("hotellrecensioner").

    Sidan bör se ut ungefär som på följande skärmbild.

    Skärmbild av datakällsdefinition

  6. Fortsätt till nästa sida.

Steg 2: Lägg till kunskaper

I det här guidesteget lägger du till kunskaper för AI-berikning. Källdata består av kundrecensioner på engelska och franska. Kunskaper som är relevanta för den här datauppsättningen omfattar extrahering av nyckelfraser, attitydidentifiering och textöversättning. I ett senare steg kommer dessa berikar att "projiceras" till ett kunskapslager som Azure-tabeller.

  1. Expandera Anslut Cognitive Services. Kostnadsfri (begränsade berikande) är valt som standard. Du kan använda den här resursen eftersom antalet poster i HotelReviews-Free.csv är 19 och den här kostnadsfria resursen tillåter upp till 20 transaktioner per dag.

  2. Expandera Lägg till berikar.

  3. I Namn på kompetensuppsättning anger du "hotel-reviews-ss".

  4. I fältet Källdata väljer du reviews_text.

  5. För Berikande kornighetsnivå väljer du Sidor (5 000 tecken segment).

  6. För Kognitiva textkunskaper väljer du följande färdigheter:

    • Extrahering av diskussionsämne
    • Översätt text
    • Språkidentifiering
    • Identifiera sentiment

    Sidan bör se ut som på följande skärmbild:

    Skärmbild av definitionen för kunskapsuppsättningen

  7. Rulla nedåt och expandera Spara berikande till kunskapslagret.

  8. Välj Välj en befintlig anslutning och välj sedan ett Azure Storage konto. Sidan Containrar visas så att du kan skapa en container för projektioner. Vi rekommenderar att du använder en namngivningskonvention för prefix, till exempel "kstore-hotel-reviews" för att skilja mellan källinnehåll och innehåll i kunskapslager.

  9. Gå tillbaka till guiden Importera data och välj följande Azure-tabellprojektioner. Guiden erbjuder alltid projektionen Dokument. Andra projektioner erbjuds beroende på vilka färdigheter du väljer (till exempel nyckelfraser) eller berikande kornighet (Sidor):

    • Dokument
    • Sidor
    • Nyckelfraser

    Följande skärmbild visar val av tabellprojektion i guiden.

    Skärmbild av definitionen för kunskapslagret

  10. Fortsätt till nästa sida.

Steg 3: Konfigurera indexet

I det här guidesteget konfigurerar du ett index för valfria fulltextsökningsfrågor. Guiden exempel på din datakälla för att dra slutsatser om fält och datatyper. Du behöver bara välja attributen för ditt önskade beteende. Till exempel tillåter attributet Hämtningsbar att söktjänsten returnerar ett fältvärde medan sökbar aktiverar fulltextsökning i fältet.

  1. I Indexnamn anger du "hotel-reviews-idx".

  2. För attribut accepterar du standardinställningarna: Hämtningsbar och Sökbar för de nya fält som pipelinen skapar.

    Indexet bör se ut ungefär som på följande bild. Eftersom listan är lång är inte alla fält synliga i bilden.

    Skärmbild av indexdefinitionen

  3. Fortsätt till nästa sida.

Steg 4: Konfigurera och köra indexeraren

I det här guidesteget konfigurerar du en indexerare som ska samla datakällan, kunskapsuppsättningen och indexet som du definierade i föregående guidesteg.

  1. I Namn anger du "hotel-reviews-idxr".

  2. Behåll standardvärdet En gång för Schema.

  3. Välj Skicka för att köra indexeraren. Data extrahering, indexering, tillämpning av kognitiva kunskaper sker i det här steget.

Steg 5: Kontrollera status

På sidan Översikt öppnar du fliken Indexerare mitt på sidan och väljer sedan hotels-reviews-idxr. Inom en minut eller två bör statusen gå från "Pågår" till "Lyckades" utan fel och varningar.

Kontrollera tabeller i Storage Browser

I Azure Portal du till ditt Azure Storage konto och använder Storage Browser för att visa de nya tabellerna. Du bör se tre tabeller, en för varje projektion som fanns i avsnittet "Spara berikanden" på sidan "Lägg till berikan".

  • "hotelReviewssDocuments" innehåller alla noder på den första nivån i ett dokuments berikande träd som inte är samlingar.

  • "hotelReviewssKeyPhrases" innehåller en lång lista med bara nyckelfraser som extraherats från alla recensioner. Kunskaper som matar ut samlingar (matriser), till exempel nyckelfraser och entiteter, får utdata skickade till en fristående tabell.

  • "hotelReviewssPages" innehåller berikade fält som skapats på varje sida som har delats från dokumentet. I den här kunskapsuppsättningen och datakällan berikar sidnivå som består av sentimentetiketter och översatt text. En sidtabell (eller en meningar-tabell om du anger den specifika detaljnivån) skapas när du väljer "sidor" kornighet i kompetensuppsättningsdefinitionen.

Alla dessa tabeller innehåller ID-kolumner för att stödja tabellrelationer i andra verktyg och appar. När du öppnar en tabell bläddrar du förbi fälten för att visa innehållsfälten som lagts till av pipelinen.

I den här snabbstarten bör tabellen för "hotelReviewssPages" se ut ungefär som på följande skärmbild:

Skärmbild av de genererade tabellerna i Storage Browser

Rensa

När du arbetar i din egen prenumeration kan det dock vara klokt att i slutet av ett projekt kontrollera om du fortfarande behöver de resurser som du skapade. Resurser som fortsätter att köras kostar pengar. Du kan ta bort resurser individuellt eller ta bort resursgruppen om du vill ta bort hela uppsättningen resurser.

Du kan hitta och hantera resurser i portalen med hjälp av länken Alla resurser eller Resursgrupper i det vänstra navigeringsfönstret.

Om du använder en kostnadsfri tjänst bör du komma ihåg att du är begränsad till tre index, indexerare och datakällor. Du kan ta bort enskilda objekt i portalen för att hålla dig under gränsen.

Tips

Om du vill upprepa den här övningen eller prova en annan genomgång av AI-berikning tar du bort indexeraren hotel-reviews-idxr och de relaterade objekten för att återskapa dem. Om du tar bort indexeraren återställs den kostnadsfria dagliga transaktionsräknaren till noll.

Nästa steg

Nu när du har introducerats för ett kunskapslager kan du ta en närmare titt på varje steg genom att växla över till REST API genomgången. Uppgifter som guiden hanterar internt beskrivs i REST-genomgången.