Quickstart: Een kennisopslag maken in de Azure Portal
Kennisopslag is een functie van Azure Cognitive Search die uitvoer van een AI-verrijkingspijplijn accepteert en deze beschikbaar maakt in Azure Storage voor downstream-apps en workloads. Verrijkingen die door de pijplijn zijn gemaakt, zoals vertaalde tekst, OCR-tekst, getagde afbeeldingen en herkende entiteiten, worden geprojecteerd in tabellen of blobs, waar ze toegankelijk zijn voor elke app of workload die verbinding maakt met Azure Storage.
In deze quickstart stelt u uw gegevens in en vervolgens gaat u de wizard Gegevens importeren uitvoeren om een verrijkingspijplijn te maken die ook een kennisopslag genereert. Het kennisopslag bevat oorspronkelijke tekstinhoud die uit de bron is gehaald (klantbeoordelingen van een hotel), plus door AI gegenereerde inhoud met een sentimentlabel, sleuteltermextractie en tekstvertaling van niet-Engelse opmerkingen van klanten.
Notitie
In deze quickstart ziet u de snelste route naar een voltooid kennisopslag in Azure Storage. Zie In plaats daarvan een kennisopslag in REST maken voor gedetailleerdere uitleg van elke stap.
Vereisten
In deze quickstart worden de volgende services gebruikt:
Een Azure-account met een actief abonnement. Gratis een account maken
Azure Cognitive Search. Maak een service of zoek een bestaande service in uw account. U kunt een gratis service voor deze quickstart gebruiken.
Azure Storage. Maak een account of zoek een bestaand account. Het accounttype moet StorageV2 (algemeen gebruik V2) zijn.
Voorbeeldgegevens. In deze quickstart wordt gebruikgemaakt van hotelbeoordelingsgegevens die zijn opgeslagen in een CSV-bestand (afkomstig van Kaggle.com) en bevat 19 stukjes feedback van klanten over één hotel.
Download HotelReviews_Free.csv en upload deze vervolgens naar een blobcontainer in Azure Storage.
In deze quickstart wordt ook gebruikgemaakt Cognitive Services ai-verrijking. Omdat de workload zo klein is, wordt de gratis verwerking (maximaal 20 transacties) van Cognitive Services achter de schermen gebruikt. Dit betekent dat u deze oefening kunt doen zonder dat u een nieuwe Cognitive Services-resource moet aanmaken.
De wizard starten
Meld u met uw Azure-account aan bij Azure Portal.
Vind uw zoekservice en klik op de overzichtspagina op Gegevens importeren in de opdrachtbalk om in vier stappen een kennisarchief te maken.
Stap 1: Een gegevensbron maken
Omdat de gegevens meerdere rijen in één CSV-bestand zijn, stelt u de parseringsmodus in om één zoekdocument voor elke rij op te halen.
In Verbinding maken gegevens selecteert u Azure Blob Storage en selecteert u het account en de container die u hebt gemaakt.
Voer 'hotel-reviews-ds' in bij Naam.
Selecteer voor Parseermodus Tekstbestand met scheidingstekens en schakel vervolgens het selectievakje Eerste regel bevat de koptekst in. Zorg ervoor dat het Scheidingsteken een komma (,) is.
Plak in Verbindingsreeks een connection string in uw Azure Storage account.
Een connection string heeft de volgende indeling:
DefaultEndpointsProtocol=https;AccountName=<YOUR-ACCOUNT-NAME>;AccountKey=<YOUR-ACCOUNT-KEY>;EndpointSuffix=core.windows.netVoer in Containers de naam in van de blobcontainer met de gegevens ('hotel-reviews').
Uw pagina moet er ongeveer uitzien als in de volgende schermafbeelding.
Ga door naar de volgende pagina.
Stap 2: vaardigheden toevoegen
In deze wizardstap voegt u vaardigheden voor AI-verrijking toe. De brongegevens bestaan uit klantbeoordelingen in het Engels en Frans. De vaardigheden die relevant zijn voor deze gegevensset zijn sleuteltermextractie, gevoelsdetectie en vertaling. In een latere stap worden deze verrijkingen als Azure-tabellen 'geprojecteerd' naar een kennisarchied.
Vouw Cognitive Services toevoegen uit. Standaard is Gratis (beperkte verrijkingen) geselecteerd. U kunt deze resource gebruiken omdat het aantal records in HotelReviews-Free.csv 19 is en deze gratis resource maximaal 20 transacties per dag toestaat.
Vouw Verrijkingen toevoegen uit.
Voer bij Naam vaardighedenset'hotel-reviews-ss' in.
Selecteer reviews_text bij veld voor brongegevens.
Selecteer pagina's (segmenten van 5000 tekens) bij Granulariteitsniveau verrijking.
Selecteer voor Text Cognitive Skills de volgende vaardigheden:
- Sleuteltermen extraheren
- Tekst vertalen
- Taaldetectie
- Gevoel detecteren
Uw pagina moet er als volgt uitzien:
Schuif omlaag en vouw Verrijkingen opslaan in kennisopslag uit.
Selecteer Een bestaande verbinding kiezen en selecteer vervolgens een Azure Storage account. De pagina Containers wordt weergegeven, zodat u een container voor projecties kunt maken. We raden u aan een naamconventie voor voorvoegsels te gebruiken, zoals 'kstore-hotel-reviews' om onderscheid te maken tussen broninhoud en inhoud van het kennisopslag.
Als u terugkeert naar de wizard Gegevens importeren, selecteert u de volgende Azure-tabelprojecties. De wizard biedt altijd de documenten projectie. Andere projecties worden aangeboden, afhankelijk van de vaardigheden die u selecteert (zoals sleuteltermen) of de verrijkingsgranulariteit**(pagina's):**
- Documenten
- Pagina's
- Sleuteltermen
In de volgende schermopname ziet u de selecties voor tabelprojectie in de wizard.
Ga door naar de volgende pagina.
Stap 3: De index configureren
Configureer in deze wizardstap een index voor optionele zoekquery's in volledige tekst. Deze wizard gebruikt uw gegevensbron om velden en gegevenstypen af te leiden. U hoeft alleen de kenmerken voor het gewenste gedrag te selecteren. Met het kenmerk Ophalen mogelijk kan de zoekservice bijvoorbeeld een veldwaarde retourneren, met Doorzoekbaar wordt zoeken in volledige tekst mogelijk.
Voer bij Indexnaam'hotel-reviews-idx' in.
Accepteer de standaardselecties voor de kenmerken: Ophalen mogelijk en Doorzoekbaar voor de nieuwe velden die de pijplijn maakt.
Uw index moet er ongeveer uitzien als op deze afbeelding. Omdat de lijst lang is, zijn niet alle velden zichtbaar op de afbeelding.
Ga door naar de volgende pagina.
Stap 4: de indexer configureren en uitvoeren
In deze wizardstap configureert u een indexer die de gegevensbron, vaardighedenset en de index die u in de vorige wizardstappen hebt gedefinieerd, samenbrengen.
Voer bij Naam 'hotel-reviews-idxr' in.
Behoud de standaardinstelling Eén keer voor Planning.
Selecteer Verzenden om de indexer uit te voeren. Gegevensextractie, indexering en toepassing van cognitieve vaardigheden vinden allemaal plaats in deze stap.
Stap 5: Status controleren
Open op de pagina Overzicht het tabblad Indexeermachines in het midden van de pagina en selecteer hotels-reviews-idxr. Binnen een minuut of twee moet de status worden uitgevoerd van 'Wordt uitgevoerd' naar 'Geslaagd' met nul fouten en waarschuwingen.
Tabellen controleren in Storage Browser
Schakel in Azure Portal over naar uw Azure Storage-account en gebruik Storage Browser om de nieuwe tabellen te bekijken. U ziet drie tabellen, één voor elke projectie die is aangeboden in de sectie Verrijkingen opslaan van de pagina Verrijkingen toevoegen.
'hotelReviewssDocuments' bevat alle knooppunten op het eerste niveau van de verrijkingsstructuur van een document die geen verzamelingen zijn.
hotelReviewssKeyPhrases bevat een lange lijst met alleen de sleuteltermen die uit alle beoordelingen zijn geëxtraheerd. Vaardigheden die verzamelingen (matrices) als uitvoer hebben, zoals sleuteltermen en entiteiten, krijgen uitvoer die wordt verzonden naar een zelfstandige tabel.
'hotelReviewssPages' bevat verrijkte velden die zijn gemaakt op elke pagina die is gesplitst uit het document. In deze vaardighedenset en gegevensbron worden verrijkingen op paginaniveau die bestaan uit sentimentlabels en vertaalde tekst. Er wordt een paginatabel (of een zinnentabel als u dat specifieke granulariteitsniveau opgeeft) gemaakt wanneer u 'pagina's' granulariteit kiest in de definitie van de vaardighedenset.
Al deze tabellen bevatten id-kolommen ter ondersteuning van tabelrelaties in andere hulpprogramma's en apps. Wanneer u een tabel opent, schuift u langs deze velden om de inhoudsvelden weer te geven die door de pijplijn zijn toegevoegd.
In deze quickstart moet de tabel voor hotelReviewssPages er ongeveer uitzien als in de volgende schermafbeelding:
Opschonen
Wanneer u in uw eigen abonnement werkt, is het een goed idee om aan het einde van een project te bepalen of u de gemaakte resources nog steeds nodig hebt. Resources die actief blijven, kunnen u geld kosten. U kunt resources afzonderlijk verwijderen, maar u kunt ook de resourcegroep verwijderen als u de volledige resourceset wilt verwijderen.
U kunt resources vinden en beheren in de portal via de koppeling Alle resources of Resourcegroepen in het navigatiedeelvenster aan de linkerkant.
Als u een gratis service gebruikt, moet u er rekening mee houden dat u bent beperkt tot drie indexen, indexeerfuncties en gegevensbronnen. U kunt afzonderlijke items in de portal verwijderen om onder de limiet te blijven.
Tip
Als u deze oefening wilt herhalen of een ander AI-verrijkingsoverzicht wilt proberen, verwijdert u de indexeerer hotel-reviews-idxr en de gerelateerde objecten om ze opnieuw te maken. Door de indexeerfunctie te verwijderen, wordt de teller van het aantal gratis dagelijkse transacties weer opnieuw ingesteld.
Volgende stappen
Nu u kennis hebt gemaakt met een kennisopslag, kunt u elke stap nader bekijken door over te schakelen naar REST API overzicht. Taken die de wizard intern heeft verwerkt, worden uitgelegd in het REST-overzicht.