Data Catalog söksyntaxreferens

Azure Data Catalog är en fullständigt hanterad tjänst i Microsoft Azure som fungerar som ett system för registrering och identifieringssystem för företagsdatakällor. Azure Data Catalog funktioner som gör det möjligt för tekniska och icke-tekniska användare att identifiera, förstå och använda datakällor.

En viktig aspekt av dataidentifiering är möjligheten att söka efter datakällor som har registrerats i Azure Data Catalog. Azure Data Catalog har en kraftfull söksyntax som gör att användarna enkelt kan skapa frågor som returnerar de data som användarna behöver.

Översikt över söksyntax

Azure Data Catalog sökningar liknar de som används av Microsoft Windows och Microsoft Outlook, och som bör vara bekant för användare av dessa verktyg.

Frågetekniker

Teknik Användning Exempel
Grundläggande sökning Grundläggande sökning med hjälp av en eller flera söktermer. Resultatet returnerar tillgångar där ett eller flera av de angivna villkoren matchar en egenskap. sales data
Egenskapsomfång Returnera endast datakällor där söktermen matchas med den angivna egenskapen name:finance
Booleska operatorer Utöka eller begränsa en sökning med booleska åtgärder finance NOT corporate
Gruppera med parenteser Gruppera delar av frågan med parenteser för logisk isolering, särskilt i kombination med booleska operatorer name:finance AND (tags:tag1 OR tags:tag2)
Jämförelseoperatorer Använda andra jämförelser än lika med för egenskaper som innehåller datum och numeriska datatyper creationTime>"11/05/2014"

Matchnings-, jämförelse- och booleska operatorer

Nyckelord/symbol Exempel Funktion
: experts:user@domain.com tags:tag1 Använd egenskapsomfång och returnera endast de tillgångar där en viss egenskap innehåller texten som genomsöks. Frågans semantik är "prefixmatchning".
= name=Sales name="Soft Drink Sales" Tillåter att användaren anger en exakt matchning. Endast de tillgångar som innehåller egenskapen med exakt värdet för söktermen returneras.
<> experts<>user1 tags<>tag2 Operatorn "Inte lika med". Returnerar endast de tillgångar som inte har det värde som anges i sökfrågan.
"" "social security" Söker efter objekt som innehåller den exakta frasen Social Security. Det finns ett specialfall för att använda citattecken. Om citattecken används med egenskapsomfång grupperar semantiken men inte exakta fraser. I det här fallet är beteendet detsamma som att ange den namngivna egenskapen två gånger. Exempel: name:"social security" hittar tillgångar som har en namnegenskap med ordet social i sig eller en namnegenskap med ordet säkerhet i sig.
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) Söker efter objekt som innehåller tag1 och tag2 eller har namnet sales i databasen salesfy15. Används vanligtvis tillsammans med booleska operatorer
>,>= timestamp>"11/05/2014" Söker efter objekt med ett ändrat datum efter 2014-11-05.
<,<= timestamp<"11/05/2014" Söker efter objekt med ett datum före 2014-11-05.
NOT social NOT security Söker efter objekt som innehåller sociala objekt, men inte säkerhet.
AND social AND security Söker efter objekt som innehåller sociala medier och säkerhet.
ELLER social OR security Söker efter objekt som innehåller socialförsäkring eller säkerhet.
Hsa: has:tags has:description Tillåt filtrering och returnera endast de tillgångar där en viss egenskap har angetts (eller om egenskapen representerar en samling – den innehåller minst ett element).

Kommentarer

Prefixsemantik

Som standard görs alla sökningar i Azure Data Catalog med hjälp av en teknik som kallas prefixmatchning semantik. Det innebär att alla söktermer startar en matchning i början av tillgångens egenskaper.

Tänk dig till exempel två fiktiva tillgångar som registrerats i Azure Data Catalog med följande namn:

  • SalesData
  • Offerter för säljare

En sökning efter "försäljning" returnerar båda dessa tillgångar, eftersom båda namnen börjar med ordet "försäljning". Framtida versioner av Azure Data Catalog har stöd för exakta matchningsoperatorer.

Sökningar med egenskapsomfång

Azure Data Catalog stöder egenskapsomfång. I den aktuella förhandsversionen är egenskapsomfången fallkänsliga. Det innebär att för att frågan ska fungera måste det faktiska höljet för egenskapen i sökfrågan matcha det som finns i indexet.

Sökningar efter ogiltiga egenskaper (egenskaper som inte finns) resulterar i ett fel.

Citattecken fungerar på ett särskilt sätt när du använder egenskapsomfång. Citattecken i andra sammanhang anger exakta fraser. Men när citattecken används i egenskapsomfånget grupperar semantiken. Gör till name:"Sales Products" exempel en fritextsökning som tittar på innehållet i namnegenskapen och letar efter "Försäljning" eller "Produkter". Därför är semantiken name:"Sales Products" för: exakt samma som name:Sales name:Products .

Den allmänna principen för egenskapsnamn i Sökbara egenskaper är kamelbokstav, vilket innebär att den första bokstaven är gemen och att vart och ett av ordets första bokstäver är versaler.

De mest användbara egenskaperna visas nedan.

Egenskap Användning Exempel
name Söker efter objekt där söktermen visas i datakällans namn name:finance
beskrivning Söker efter objekt där söktermen visas i datakällans beskrivning description:finance
objectType Söker efter objekt av en viss objekttyp, till exempel tabell, vy eller KPI objectType:table
sourceType Söker efter objekt av en viss typ av datakälla, till exempel SQL Server eller SQL Server Analysis Services flerdimensionella sourceType:"tabular"
tags Söker efter objekt där söktermen visas i datakälltaggarna tags:finance
timestamp Söker efter objekt baserat på datum och tid då deras metadata senast ändrades timestamp:>"11/05/2014"
lastRegisteredTime Söker efter objekt baserat på datum och tid då deras metadata registrerades lastRegisteredTime:>"11/05/2014"
friendlyName Söker efter objekt där söktermen visas i datakällans egna namn friendlyName: finance
Experter Söker efter objekt där datakällexperten matchar söktermen experts:user@example.com experts:user
termName Söker efter objekt där söktermen visas i företagsordlistor som tillämpas på datatillgången termName:marketing

Du kan också använda följande egenskapsnamn tillsammans med filtret "has:" för att kontrollera var tillgångar har specifika egenskaper.

Egenskap Användning Exempel
förhandsvisa Söker efter objekt som innehåller förhandsversion has:preview
documentation (dokumentation) Söker efter objekt som innehåller dokumentation has:documentation
tableDataProfiles Söker efter objekt som har en tabellprofil (storlek, antal rader osv.) has:tableDataProfiles
columnsDataProfiles Söker efter objekt som har en kolumndataprofil (antal distinkta värden, min, max osv.) has:columnsDataProfiles

Sökexempel

I följande avsnitt visas några sökexempel.

Returnera alla tillgångar med "försäljning" i namnet

name:sales

Returnera alla tillgångar som registrerats efter 2015-04-20 som innehåller "försäljning" i en egenskap

sales AND lastRegisteredTime&gt;"4/20/2015"

Returnera alla tillgångar som inkluderar försäljning i en egenskap och som inte har taggen Q1FY2013

sales AND tags&lt;&gt;"Q1FY2013"

Returnera alla tillgångar som inte har experter eller dokumentation tilldelade

not has:experts and not has:documentation