Wat is Azure Cognitive Search?

Azure Cognitive Search ( voorheen bekend als'Azure Search') is een zoekservice in de cloud die ontwikkelaars een architectuur, API's en hulpprogramma's biedt voor het bouwen van een uitgebreide zoekervaring via persoonlijke, heterogene inhoud in web-, mobiele en bedrijfstoepassingen.

Zoeken is een basis voor elke app die inhoud beschikbaar maakt voor gebruikers, met veelvoorkomende scenario's zoals zoeken in catalogussen of documenten, zoeken op e-commercewebsites of kennismining voor gegevenswetenschap.

Wanneer u een zoekservice maakt, werkt u met de volgende mogelijkheden:

  • Een zoekmachine voor zoeken in volledige tekst
  • Permanente opslag van inhoud in eigendom van gebruikers in een zoekindex
  • Uitgebreide indexering, met tekstanalyse en optionele AI-verrijking voor inhoudextractie en transformatie
  • Uitgebreide querymogelijkheden, waaronder eenvoudige syntaxis, volledige Lucene-syntaxis en zoekfunctie typeahead
  • Programmeerbaarheid via REST API's en clientbibliotheken in Azure SDK's voor .NET, Python, Java en JavaScript
  • Azure-integratie op de gegevenslaag, machine learning laag en AI (Cognitive Services)
  • State-of-art classificatiealgoritmen via semantisch zoeken (preview)

Architectuurkundig gezien bevindt een zoekservice zich tussen de externe gegevensopslag die uw niet-geïndexeerde gegevens bevatten en uw client-app die queryaanvragen naar een zoekindex verzendt en het antwoord verwerkt.

Architectuur van Azure Cognitive Search

Extern kan zoeken worden geïntegreerd met andere Azure-services in de vorm van indexeren die het opnemen/ophalen van gegevens uit Azure-gegevensbronnen automatiseren en vaardighedensets die gebruiksbare AI van Cognitive Services bevatten, zoals afbeeldings- en tekstanalyse, of aangepaste AI die u in Azure Machine Learning maakt of in een Azure Functions verpakt.

Binnen een zoekservice

Binnen de zoekservice zelf zijn de twee primaire werkbelastingen indexeren en query's uitvoeren.

  • Indexeren is een opnameproces dat inhoud in uw zoekservice laadt en doorzoekbaar maakt. Intern wordt inkomende tekst verwerkt in tokens en opgeslagen in omgekeerde indexen voor snelle scans. U kunt elke tekst in de vorm van JSON-documenten uploaden.

    Als uw inhoud gemengde bestanden bevat, hebt u bovendien de mogelijkheid om AI-verrijking toe te voegen via cognitieve vaardigheden. AI-verrijking kan tekst extraheren die is ingesloten in toepassingsbestanden, en ook tekst en structuur afleiden uit niet-tekstbestanden door de inhoud te analyseren.

    De vaardigheden die de analyse bieden, zijn vooraf gedefinieerde vaardigheden van Microsoft of aangepaste vaardigheden die u maakt. De daaropvolgende analyse en transformaties kunnen leiden tot nieuwe informatie en structuren die voorheen nog niet bestonden, waardoor veel hulp voor een groot aantal zoek- en kennisanalysescenario's wordt geboden.

  • Query's kunnen plaatsvinden zodra een index is gevuld met doorzoekbare tekst, wanneer uw client-app queryaanvragen naar een zoekservice verzendt en antwoorden verwerkt. Alle uitvoeringen van query's verlopen via een zoekindex die u in uw service maakt, bezit en opslaat. In uw client-app wordt de zoekervaring gedefinieerd met behulp van API's van Azure Cognitive Search. De zoekervaring kan het volgende omvatten: afstemming van relevantie, automatische aanvulling, overeenkomende synoniemen, zoeken bij benadering, patroonvergelijking, filteren en sorteren.

Functionaliteit wordt beschikbaar gemaakt via een eenvoudige REST API of .NET SDK waarmee de inherente complexiteit van het ophalen van gegevens wordt gemaskeerd. Azure Portal biedt daarnaast ondersteuning voor service-administratie en inhoudsbeheer, door middel van hulpprogramma’s voor het ontwikkelen van prototypen, het doorzoeken van indexen en het doorzoeken van vaardighedensets. Omdat de service wordt uitgevoerd in de cloud, worden de infrastructuur en beschikbaarheid beheerd met Microsoft.

Azure Cognitive Search is geschikt voor de volgende toepassingsscenario's:

  • heterogene inhoud consolideren in een index die privé, enkelvoudig en doorzoekbaar is.

  • U kunt eenvoudig zoekfuncties implementeren: relevantie afstemmen, facetnavigatie, filters (inclusief geo-ruimtelijke zoekopdrachten), toewijzing van synoniemen en automatisch aanvullen.

  • Transformeer grote niet-gedifferentieerde tekst- of afbeeldingsbestanden, of toepassingsbestanden die zijn opgeslagen in Azure Blob Storage of Cosmos DB, naar doorzoekbare JSON-documenten. Dit wordt bereikt tijdens de index via cognitieve vaardigheden die externe verwerking toevoegen.

  • Taalkundige of aangepaste tekstanalyse toevoegen. Als u niet-Engelstalige inhoud hebt, ondersteunt Azure Cognitive Search zowel Lucene-analyses als Microsofts natuurlijketaalprocessoren. U kunt ook analysefuncties configureren om gespecialiseerde verwerking van onbewerkte inhoud uit te voeren, zoals het uitfilteren van diakritische tekens of het herkennen en behouden van patronen in tekenreeksen.

Zie Functies van Azure Cognitive Search voor meer informatie over specifieke functionaliteiten

Hoe gaat u aan de slag

Een end-to-end-onderzoek van de belangrijkste zoekfuncties kan in vier stappen worden bereikt:

  1. Maak een zoekservice in de gedeelde gratis laag of een factureerbare laag voor toegewezen resources die alleen door uw service worden gebruikt. Alle quickstarts en zelfstudies kunnen worden uitgevoerd op een gedeelde service.

  2. Maak een zoekindex met behulp van de portal, REST API, .NET SDKof een andere SDK. Het indexschema bepaalt de structuur van doorzoekbare inhoud.

  3. Upload inhoud met behulp van het pushmodel om JSON-documenten vanuit een bron te pushen of gebruik het pull-model (indexeren) als uw brongegevens zich in Azure hebben.

  4. Vraag een index op met behulp van Search Explorer in de portal, REST API, .NET SDK of een andere SDK.

Voor de eerste verkenning begint u met de wizard Gegevens importeren en een ingebouwde Azure-gegevensbron om binnen enkele minuten een index te maken, te laden en er query's op uit te voeren.

Voor hulp bij complexe of aangepaste oplossingen kunt u contact opnemen met een partner met diepgaande expertise in Cognitive Search technologie.

Zoekopties vergelijken

Klanten vragen vaak wat de verschillen zijn tussen Azure Cognitive Search en andere zoekgerelateerde oplossingen. In de volgende tabel worden de verschillen samengevat.

Vergeleken met Belangrijke verschillen
Microsoft Search Microsoft Search is voor geverifieerde Microsoft 365-gebruikers die query's willen uitvoeren op inhoud in SharePoint. Het wordt aangeboden als een kant-en-klare zoekervaring die is ingeschakeld en geconfigureerd door beheerders, met de mogelijkheid om externe inhoud te accepteren via connectors van Microsoft en andere bronnen. Als dit uw situatie omschrijft, is Microsoft Search met Microsoft 365 een aantrekkelijke optie om te verkennen.

Met Azure Cognitive Search daarentegen worden query's uitgevoerd op een door u gedefinieerde index, die is gevuld met gegevens en documenten waarvan u de eigenaar bent, vaak afkomstig uit verschillende bronnen. Azure Cognitive Search heeft verkenningsmogelijkheden voor bepaalde Azure-gegevensbronnen via indexeerfuncties, maar u kunt elk JSON-document dat overeenkomt met uw indexschema naar een enkele geconsolideerde, doorzoekbare resource pushen. U kunt ook de indexeerpijplijn aanpassen zodat deze machine learning en lexicale analysefuncties bevat. Omdat Cognitive Search is gebouwd als invoegonderdeel voor grotere oplossingen, kunt u de zoekfunctie integreren in vrijwel elke app en op elk platform.
Bing Met Bing Webzoekopdrachten-API wordt in de indexen op Bing.com gezocht naar overeenkomsten voor termen die u hebt ingediend. Indexen zijn gebouwd uit HTML, XML en andere webinhoud op openbare sites. Bing Aangepaste zoekopdrachten, dat op dezelfde basis is gebouwd, biedt dezelfde verkenningstechnologie voor typen webinhoud, met een bereik dat is ingesteld op afzonderlijke websites.

In Cognitive Search kunt u de index definiëren en invullen. U kunt indexeerfuncties gebruiken om gegevens te verkennen in Azure-gegevensbronnen of een indexconform JSON-document naar uw zoekservice te pushen.
Zoeken in database Veel databaseplatforms beschikken over een ingebouwde zoekfunctie. SQL Server heeft een functie voor zoeken in volledige tekst. Cosmos DB en soortgelijke technologieën hebben indexen waarop kan worden gezocht. Bij de evaluatie van producten die zoeken en opslag combineren, is het soms lastig om te bepalen wat u moet kiezen. Veel oplossingen gebruiken beide: DBMS voor opslag en Azure Cognitive Search voor gespecialiseerde zoekfuncties.

Vergeleken met DBMS slaat Azure Cognitive Search de inhoud van heterogene bronnen op en biedt het gespecialiseerde tekstverwerkingsfuncties, zoals linguïstische tekstverwerking (woordstammen, lemmata, woordvormen) in 56 talen. Het ondersteunt ook automatische correctie van verkeerd gespelde woorden, synoniemen, suggesties, scoringsbesturingselementen, facetten en aangepaste tokenisering. De engine voor zoekopdrachten in volledige tekst in Azure Cognitive Search is gebouwd op Apache Lucene, een industrienorm op het gebied van het ophalen van gegevens. Hoewel Azure Cognitive Search gegevens bewaart in de vorm van een omgekeerde index, is het geen vervanging voor echte gegevensopslag en raden we niet aan om Azure Cognitive Search op die manier te gebruiken. Zie dit forumbericht voor meer informatie.

Een ander belangrijk punt in deze categorie is het gebruik van resources. Indexering en bepaalde querybewerkingen zijn vaak rekenintensief. Door de zoekopdracht van de DBMS naar een toegewezen oplossing in de cloud te verplaatsen, blijven systeemresources beschikbaar voor transactieverwerking. En door de zoekfunctie te externaliseren, kunt u eenvoudig schalen naar het juiste queryvolume.
Toegewezen zoekoplossing Ervan uitgaande dat u hebt gekozen voor een toegewezen zoekoplossing met het volledige spectrum aan functies, dan is er nog een essentieel onderscheid tussen on-premises oplossingen en een cloudservice. Veel zoektechnologieën bieden controle over het indexeren en doorzoeken van pijplijnen, toegang tot rijkere syntaxis voor filteren en het uitvoeren van query’s, beheer van rangen en relevantie, en functies voor zelfgestuurde en intelligente zoekopdrachten.

Als u op zoek bent naar een pasklare oplossing met minimale overhead, minimaal onderhoud en aanpasbare schaling is een cloudservice de juiste keuze voor u.

Binnen het cloudmodel bieden verschillende providers vergelijkbare basisfuncties, met Zoekopdracht in volledige tekst, op geografische locaties zoeken en de mogelijkheid om te gaan met een zekere dubbelzinnigheid van zoekinvoergegevens. Meestal bepaalt een gespecialiseerde functie, of het gemak en de algehele eenvoud van de API’s, de hulpprogramma’s en het beheer, welke oplossing het meest geschikt voor u is.

Azure Cognitive Search is van alle cloudproviders het sterkst op het gebied van zoeken in volledige tekst in inhoudsopslag en databases in Azure, voor apps die hoofdzakelijk afhankelijk zijn van het ophalen van gegevens en van inhoudsnavigatie.

Belangrijke pluspunten zijn onder andere:

  • Azure-gegevensintegratie (verkenners) in de indexeringslaag
  • Azure Private Link-integratie om offline ondersteuning te bieden voor beveiligingsvereisten
  • Integratie met AI-verwerking om tekst in niet-doorzoekbare inhoudstypen doorzoekbaar te maken.
  • Taalkundige en aangepaste analyse met analysefuncties voor grondig zoeken in volledige tekst in 56 talen
  • Kritieke functies: rijke querytaal, relevantie afstemmen, facetteren, automatisch aanvullen, synoniemen, geo-zoekopdracht, en resultaatcompositie.
  • Schaling, betrouwbaarheid en beschikbaarheid van wereldklasse in Azure

Onder onze klanten bevinden zich degenen die het breedste scala aan functies in Azure Cognitive Search gebruiken, onder andere onlinecatalogussen, Line-Of-Business-programma’s en toepassingen voor het ontdekken van documenten.

Deze video bekijken

In deze vijftien minuten durende video introduceert programmamanager Luis Cabrera Azure Cognitive Search.