Data Catalog söksyntaxreferens
Azure Data Catalog är en fullständigt hanterad tjänst i Microsoft Azure som fungerar som ett system för registrering och identifieringssystem för företagsdatakällor. Azure Data Catalog funktioner som gör det möjligt för tekniska och icke-tekniska användare att identifiera, förstå och använda datakällor.
En viktig aspekt av dataidentifiering är möjligheten att söka efter datakällor som har registrerats i Azure Data Catalog. Azure Data Catalog har en kraftfull söksyntax som gör att användarna enkelt kan skapa frågor som returnerar de data som användarna behöver.
Översikt över söksyntax
Azure Data Catalog sökningar liknar de som används av Microsoft Windows och Microsoft Outlook, och som bör vara bekant för användare av dessa verktyg.
Frågetekniker
| Teknik | Användning | Exempel |
|---|---|---|
| Grundläggande sökning | Grundläggande sökning med hjälp av en eller flera söktermer. Resultatet returnerar tillgångar där ett eller flera av de angivna villkoren matchar en egenskap. | sales data |
| Egenskapsomfång | Returnera endast datakällor där söktermen matchas med den angivna egenskapen | name:finance |
| Booleska operatorer | Utöka eller begränsa en sökning med booleska åtgärder | finance NOT corporate |
| Gruppera med parenteser | Gruppera delar av frågan med parenteser för logisk isolering, särskilt i kombination med booleska operatorer | name:finance AND (tags:tag1 OR tags:tag2) |
| Jämförelseoperatorer | Använda andra jämförelser än lika med för egenskaper som innehåller datum och numeriska datatyper | creationTime>"11/05/2014" |
Matchnings-, jämförelse- och booleska operatorer
| Nyckelord/symbol | Exempel | Funktion |
|---|---|---|
| : | experts:user@domain.com tags:tag1 |
Använd egenskapsomfång och returnera endast de tillgångar där en viss egenskap innehåller texten som genomsöks. Frågans semantik är "prefixmatchning". |
| = | name=Sales name="Soft Drink Sales" |
Tillåter att användaren anger en exakt matchning. Endast de tillgångar som innehåller egenskapen med exakt värdet för söktermen returneras. |
| <> | experts<>user1 tags<>tag2 |
Operatorn "Inte lika med". Returnerar endast de tillgångar som inte har det värde som anges i sökfrågan. |
| "" | "social security" |
Söker efter objekt som innehåller den exakta frasen Social Security. Det finns ett specialfall för att använda citattecken. Om citattecken används med egenskapsomfång grupperar semantiken men inte exakta fraser. I det här fallet är beteendet detsamma som att ange den namngivna egenskapen två gånger. Exempel: name:"social security" hittar tillgångar som har en namnegenskap med ordet social i sig eller en namnegenskap med ordet säkerhet i sig. |
| () | (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) |
Söker efter objekt som innehåller tag1 och tag2 eller har namnet sales i databasen salesfy15. Används vanligtvis tillsammans med booleska operatorer |
| >,>= | timestamp>"11/05/2014" |
Söker efter objekt med ett ändrat datum efter 2014-11-05. |
| <,<= | timestamp<"11/05/2014" |
Söker efter objekt med ett datum före 2014-11-05. |
| NOT | social NOT security |
Söker efter objekt som innehåller sociala objekt, men inte säkerhet. |
| AND | social AND security |
Söker efter objekt som innehåller sociala medier och säkerhet. |
| ELLER | social OR security |
Söker efter objekt som innehåller socialförsäkring eller säkerhet. |
| Hsa: | has:tags has:description |
Tillåt filtrering och returnera endast de tillgångar där en viss egenskap har angetts (eller om egenskapen representerar en samling – den innehåller minst ett element). |
Kommentarer
Prefixsemantik
Som standard görs alla sökningar i Azure Data Catalog med hjälp av en teknik som kallas prefixmatchning semantik. Det innebär att alla söktermer startar en matchning i början av tillgångens egenskaper.
Tänk dig till exempel två fiktiva tillgångar som registrerats i Azure Data Catalog med följande namn:
- SalesData
- Offerter för säljare
En sökning efter "försäljning" returnerar båda dessa tillgångar, eftersom båda namnen börjar med ordet "försäljning". Framtida versioner av Azure Data Catalog har stöd för exakta matchningsoperatorer.
Sökningar med egenskapsomfång
Azure Data Catalog stöder egenskapsomfång. I den aktuella förhandsversionen är egenskapsomfången fallkänsliga. Det innebär att för att frågan ska fungera måste det faktiska höljet för egenskapen i sökfrågan matcha det som finns i indexet.
Sökningar efter ogiltiga egenskaper (egenskaper som inte finns) resulterar i ett fel.
Citattecken fungerar på ett särskilt sätt när du använder egenskapsomfång. Citattecken i andra sammanhang anger exakta fraser. Men när citattecken används i egenskapsomfånget grupperar semantiken. Gör till name:"Sales Products" exempel en fritextsökning som tittar på innehållet i namnegenskapen och letar efter "Försäljning" eller "Produkter". Därför är semantiken name:"Sales Products" för: exakt samma som name:Sales name:Products .
Den allmänna principen för egenskapsnamn i Sökbara egenskaper är kamelbokstav, vilket innebär att den första bokstaven är gemen och att vart och ett av ordets första bokstäver är versaler.
De mest användbara egenskaperna visas nedan.
| Egenskap | Användning | Exempel |
|---|---|---|
| name | Söker efter objekt där söktermen visas i datakällans namn | name:finance |
| beskrivning | Söker efter objekt där söktermen visas i datakällans beskrivning | description:finance |
| objectType | Söker efter objekt av en viss objekttyp, till exempel tabell, vy eller KPI | objectType:table |
| sourceType | Söker efter objekt av en viss typ av datakälla, till exempel SQL Server eller SQL Server Analysis Services flerdimensionella | sourceType:"tabular" |
| tags | Söker efter objekt där söktermen visas i datakälltaggarna | tags:finance |
| timestamp | Söker efter objekt baserat på datum och tid då deras metadata senast ändrades | timestamp:>"11/05/2014" |
| lastRegisteredTime | Söker efter objekt baserat på datum och tid då deras metadata registrerades | lastRegisteredTime:>"11/05/2014" |
| friendlyName | Söker efter objekt där söktermen visas i datakällans egna namn | friendlyName: finance |
| Experter | Söker efter objekt där datakällexperten matchar söktermen | experts:user@example.com experts:user |
| termName | Söker efter objekt där söktermen visas i företagsordlistor som tillämpas på datatillgången | termName:marketing |
Du kan också använda följande egenskapsnamn tillsammans med filtret "has:" för att kontrollera var tillgångar har specifika egenskaper.
| Egenskap | Användning | Exempel |
|---|---|---|
| förhandsvisa | Söker efter objekt som innehåller förhandsversion | has:preview |
| documentation (dokumentation) | Söker efter objekt som innehåller dokumentation | has:documentation |
| tableDataProfiles | Söker efter objekt som har en tabellprofil (storlek, antal rader osv.) | has:tableDataProfiles |
| columnsDataProfiles | Söker efter objekt som har en kolumndataprofil (antal distinkta värden, min, max osv.) | has:columnsDataProfiles |
Sökexempel
I följande avsnitt visas några sökexempel.
Returnera alla tillgångar med "försäljning" i namnet
name:sales
Returnera alla tillgångar som registrerats efter 2015-04-20 som innehåller "försäljning" i en egenskap
sales AND lastRegisteredTime>"4/20/2015"
Returnera alla tillgångar som inkluderar försäljning i en egenskap och som inte har taggen Q1FY2013
sales AND tags<>"Q1FY2013"
Returnera alla tillgångar som inte har experter eller dokumentation tilldelade
not has:experts and not has:documentation