Vad är Azure Cognitive Search?

Azure Cognitive Search (kallades tidigare"Azure Search")är en söktjänst i molnet som ger utvecklare en arkitektur, API:er och verktyg för att skapa en omfattande sökupplevelse över privat, heterogent innehåll i webb-, mobil- och företagsprogram.

Sökning är grundläggande för alla appar som visar innehåll för användare, med vanliga scenarier som katalog- eller dokumentsökning, webbplatssökning för e-handel eller kunskapsutvinning för datavetenskap.

När du skapar en söktjänst arbetar du med följande funktioner:

  • En sökmotor för fulltextsökning
  • Beständig lagring av användarägt innehåll i ett sökindex
  • Omfattande indexering med textanalys och valfri AI-berikning för extrahering och transformering av innehåll
  • Omfattande frågefunktioner, inklusive enkel syntax, fullständig Lucene-syntax och sökning efter typ
  • Programmering via REST-API:er och klientbibliotek i Azure-API:er för .NET, Python, Java och JavaScript
  • Azure-integrering på datalagret, maskininlärningslagret och AI (Cognitive Services)
  • Avancerade algoritmer för rangordning via semantisk sökning (förhandsversion)

Arkitektoniskt finns en söktjänst mellan de externa datalager som innehåller dina oindexerade data och klientappen som skickar frågebegäranden till ett sökindex och hanterar svaret.

Azure Cognitive Search arkitektur

Externt kan sökning integreras med andra Azure-tjänster i form av indexerare som automatiserar datainmatning/-hämtning från Azure-datakällor och kompetensuppsättningar som införlivar användbar AI från Cognitive Services, till exempel bild- och textanalys eller anpassad AI som du skapar i Azure Machine Learning eller omsluter inuti Azure Functions.

Inuti en söktjänst

I själva söktjänsten indexerar och frågar de två primära arbetsbelastningarna .

  • Indexering är en intagningsprocess som läser in innehåll till söktjänsten och gör det sökbart. Internt bearbetas inkommande text till token och lagras i inverterade index för snabba genomsökningar. Du kan ladda upp all text som är i form av JSON-dokument.

    Om ditt innehåll innehåller blandade filer kan du dessutom lägga till AI-berikning via kognitiva kunskaper. AI-berikning kan extrahera text som är inbäddad i programfiler och även härsa text och struktur från icke-textfiler genom att analysera innehållet.

    De kunskaper som ger analysen är fördefinierade från Microsoft, eller anpassade kunskaper som du skapar. Efterföljande analyser och omvandlingar kan resultera i ny information och strukturer som inte fanns tidigare, vilket ger stor nytta för många sök- och kunskapsutvinningsscenarier.

  • Frågor kan ske när ett index har fyllts med sökbar text, när klientappen skickar frågebegäranden till en söktjänst och hanterar svar. All frågekörning körs över ett sökindex som du skapar, äger och lagrar i din tjänst. I klientappen definieras sökupplevelsen med HJÄLP av API:er från Azure Cognitive Search och kan innehålla relevansjustering, automatisk komplettering, synonymmatchning, fuzzy-matchning, mönstermatchning, filter och sortering.

Funktionerna exponeras via en enkel REST API eller .NET-SDK som maskerar den inbyggda komplexiteten i informationshämtning. Du kan också använda Azure Portal för tjänstadministration och innehållshantering, med verktyg för prototyper och frågor mot dina index och kunskapsuppsättningar. Eftersom tjänsten körs i molnet hanteras infrastruktur och tillgänglighet av Microsoft.

Azure Cognitive Search passar bra för följande programscenarier:

  • Konsolidera heterogent innehåll till ett privat, användardefinierat sökindex.

  • Implementera enkelt sökrelaterade funktioner: relevansjustering, fasetterad navigering, filter (inklusive geo-spatial sökning), synonymmappning och automatisk komplettering.

  • Omvandla stora o differentierade text- eller bildfiler, eller programfiler som lagras i Azure Blob Storage eller Cosmos DB, till sökbara JSON-dokument. Detta uppnås under indexet genom kognitiva kunskaper som lägger till extern bearbetning.

  • Lägg till språklig eller anpassad textanalys. Om du har innehåll som inte är på engelska Azure Cognitive Search både Lucene-analysverktyg och Microsofts processorer med naturligt språk. Du kan också konfigurera analysverktyg för att uppnå specialiserad bearbetning av rådatainnehåll, till exempel filtrera bort diakritiska tecken eller identifiera och bevara mönster i strängar.

Mer information om specifika funktioner finns i Funktioner i Azure Cognitive Search

Så här kommer du igång

Du kan göra en utforskning av grundläggande sökfunktioner i fyra steg:

  1. Skapa en söktjänst på den delade kostnadsfria nivån eller en fakturerbar nivå för dedikerade resurser som endast används av din tjänst. Alla snabbstarter och självstudier kan slutföras på en delad tjänst.

  2. Skapa ett sökindex med hjälp av portalen, REST API ,NET SDKeller någon annan SDK. Indexschemat definierar strukturen för sökbart innehåll.

  3. Ladda upp innehåll med push-modellen för att skicka JSON-dokument från valfri källa, eller använd "pull"-modellen (indexerare) om dina källdata finns i Azure.

  4. Fråga ett index med sökutforskaren i portalen, REST API .NET SDKeller någon annan SDK.

Börja med guiden Importera data och en inbyggd Azure-datakälla för att skapa, läsa in och köra frågor mot ett index på några minuter.

Om du behöver hjälp med komplexa eller anpassade lösningar kan du kontakta en partner med djup expertis Cognitive Search teknik.

Jämför sökalternativ

Kunder frågar ofta hur Azure Cognitive Search jämför med andra sökrelaterade lösningar. I följande tabell sammanfattas viktiga skillnader.

Jämfört med Viktiga skillnader
Microsoft Search Microsoft Search är till för Microsoft 365 autentiserade användare som behöver fråga över innehåll i SharePoint. Det erbjuds som en färdig sökupplevelse som är aktiverad och konfigurerad av administratörer, med möjlighet att acceptera externt innehåll via anslutningsappar från Microsoft och andra källor. Om det här beskriver ditt scenario är Microsoft Search med Microsoft 365 ett attraktivt alternativ att utforska.

Däremot kör Azure Cognitive Search frågor över ett index som du definierar, fyllt med data och dokument som du äger, ofta från olika källor. Azure Cognitive Search har crawlerfunktioner för vissa Azure-datakällor via indexerare,men du kan skicka alla JSON-dokument som överensstämmer med ditt indexschema till en enda konsoliderad sökbar resurs. Du kan också anpassa indexeringspipelinen så att den inkluderar maskininlärning och lexikala analysverktyg. Eftersom Cognitive Search är byggt för att vara en plugin-komponent i större lösningar kan du integrera sökning i nästan alla appar, på valfri plattform.
Bing API för webbsökning i Bing söker i indexen på Bing.com efter matchande termer som du skickar. Index skapas utifrån HTML-, XML- och annat webbinnehåll på offentliga webbplatser. Anpassad sökning i Bing som bygger på samma grund, erbjuder samma crawlerteknik för webbinnehållstyper, begränsat till enskilda webbplatser.

I Cognitive Search kan du definiera och fylla i indexet. Du kan använda indexerare för att crawla data på Azure-datakällor eller skicka ett index överensstämmande JSON-dokument till söktjänsten.
Databassökning Flera olika databasplattformar innehåller en inbyggd sökupplevelse. SQL Server har fulltextsökning. Cosmos DB och liknande tekniker har frågbara index. Vid utvärdering av produkter som kombinerar sökning och lagring, kan det vara svårt att avgöra vad som är bäst. Många lösningar använder båda: DBMS för lagring och Azure Cognitive Search för specialiserade sökfunktioner.

Jämfört med DBMS-sökning lagrar Azure Cognitive Search innehåll från heterogena källor och erbjuder särskilda funktioner för textbearbetning som språkmedveten textbearbetning (ordstamsigenkänning, lemmatisering, ordformulär) på 56 språk. Det stöder också autokorrigering av felstavade ord, synonymer, förslag, bedömningskontroller, facetter och anpassad tokenisering. Motorn för fulltextsökning i Azure Cognitive Search bygger på Apache Lucene, en branschstandard inom informationshämtning. Även om Azure Cognitive Search bevarar data i form av ett inverterat index, är det inte en ersättning för verklig datalagring och vi rekommenderar inte att du använder dem i den kapaciteten. För ytterligare information, se det här foruminlägget.

Resursutnyttjande är en annan brytpunkt i den här kategorin. Indexering och vissa frågeåtgärder är ofta beräkningsmässigt intensiva. Om sökningen avlastas från DBMS till en dedikerad lösning i molnet, bevaras systemets resurser för transaktionsbearbetning. Genom att dessutom exterrnalisera sökningen kan du enkelt justera skalan utifrån frågevolymen.
Dedikerad söklösning Under förutsättning att du har valt dedikerad sökning med fullspektrumfunktioner, är en slutlig kategorisk jämförelse mellan lokala lösningar eller en molntjänst. Många söktekniker erbjuder kontroll över indexerings- och frågepipelines, tillgång till mer avancerad fråge- och filtreringssyntax, kontroll över rangordning och relevans, samt funktioner för självdirigerad och intelligent sökning.

En molntjänst är det rätta valet om du vill ha en nyckelfärdig lösning med minimalt merarbete och underhåll, och justerbar skala.

Inom molnparadigmet erbjuder flera leverantörer jämförbara baslinjefunktioner, med fulltextsökning, geo-sökning och möjlighet att hantera en viss nivå av tvetydighet i sökinmatningar. Det är vanligtvis en specialiserad funktion eller den övergripande enkelheten i API:er, verktyg och hantering som avgör det bästa valet.

Bland molnleverantörer är Azure Cognitive Search starkast för arbetsbelastningar för fulltextsökning i innehållslager och databaser i Azure, för appar som främst förlitar sig på sökning efter både informationshämtning och innehållsnavigering.

Viktiga fördelar är:

  • Azure-dataintegrering (crawler) på indexeringslagret
  • Azure Private Link för att stödja säkerhetskrav utanför Internet
  • Integrering med AI-bearbetning för att göra innehållstyper som inte går att söka i text sökbara.
  • Språklig och anpassad analys, med analysverktyg för fulltextsökning på 56 språk
  • Viktiga funktioner:omfattande frågespråk, relevansjustering, fasering, automatisk komplettering, synonymer, geo-sökning och resultatsammansättning.
  • Azure-skala, tillförlitlighet och tillgänglighet i världsklass

Bland våra kunder kan de utnyttja det bredaste utbudet av funktioner i Azure Cognitive Search bland annat onlinekataloger, affärsprogram och program för dokumentidentifiering.

Titta på den här videon

I den här videon på 15 minuter introducerar programchefen Luis Cabrera Azure Cognitive Search.