Data Catalog naar de zoeksyntaxis

Azure Data Catalog is een volledig beheerde service die wordt gehost in Microsoft Azure die fungeert als een registratie- en detectiesysteem voor bedrijfsgegevensbronnen. Azure Data Catalog biedt mogelijkheden waarmee technische en niet-technische gebruikers gegevensbronnen kunnen ontdekken, begrijpen en gebruiken.

Een belangrijk aspect van gegevensdetectie is de mogelijkheid om te zoeken naar gegevensbronnen die zijn geregistreerd in Azure Data Catalog. Azure Data Catalog heeft een krachtige zoeksyntaxis waarmee gebruikers eenvoudig query's kunnen maken die de gegevens retourneren die de gebruikers nodig hebben.

Overzicht van zoeksyntaxis

Azure Data Catalog zoekopdrachten is vergelijkbaar met zoekopdrachten die worden gebruikt door Microsoft Windows en Microsoft Outlook en die bekend moeten zijn bij gebruikers van deze hulpprogramma's.

Query-technieken

Techniek Gebruik Voorbeeld
Basiszoekactie Basiszoekactie met behulp van een of meer zoektermen. De resultaten die worden opgehaald, zijn assets die wat betreft een willekeurige eigenschap overeenkomen met een of meer van de opgegeven voorwaarden. sales data
Bereik van eigenschap definiëren Retourneert alleen gegevensbronnen waarbij de zoekterm is afgestemd op de opgegeven eigenschap name:finance
Booleaanse operators Een zoekopdracht uit- of beperken met behulp van Booleaanse bewerkingen finance NOT corporate
Groeperen met haakjes Gebruik haakjes en groepeer delen van de query voor logische isolatie, met name in combinatie met Booleaanse operators name:finance AND (tags:tag1 OR tags:tag2)
Vergelijkingsoperators Gebruik andere vergelijkingen dan gelijkheid voor eigenschappen die de gegevenstypen numeriek en datum hebben creationTime>"11/05/2014"

Overeenkomende, vergelijkings- en Booleaanse operators

Sleutelwoord/symbool Voorbeelden Functie
: experts:user@domain.com tags:tag1 Gebruik het bereik van eigenschappen en retourneert alleen de assets waarin een bepaalde eigenschap de tekst bevat die wordt doorzocht. De semantiek voor de query is 'overeenkomst met voorvoegsel'.
= name=Sales name="Soft Drink Sales" Hiermee kan de gebruiker een exacte overeenkomst opgeven. Alleen assets die de eigenschap met exact de waarde van de zoekterm bevatten, worden geretourneerd.
<> experts<>user1 tags<>tag2 De operator 'Niet gelijk aan'. Retourneert alleen de assets die niet de waarde hebben die is aangegeven in de zoekquery.
"" "social security" Zoekt items die de exacte woordgroep sociale beveiliging bevatten. Er is één speciaal geval voor het gebruik van aanhalingstekens. Als aanhalingstekens worden gebruikt met het bereik van eigenschappen, wordt de semantiek gegroepeerd, maar niet exact geformuleerd. In dit geval is het gedrag hetzelfde als het twee keer opgeven van de benoemde eigenschap. Voorbeeld: naam:'sociale zekerheid' zoekt assets met een naam-eigenschap met het woord social of een naam-eigenschap met het woord beveiliging.
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) Zoekt items die tag1 en tag2 bevatten of de naam sales in database salesfy15 hebben. Wordt doorgaans gebruikt in combinatie met Booleaanse operators
>, >= timestamp>"11/05/2014" Zoekt items met een gewijzigde datum na 05-11-2014.
<, <= timestamp<"11/05/2014" Zoekt items met een datum vóór 05-11-2014.
NOT social NOT security Zoekt items die sociale, maar geen beveiliging bevatten.
AND social AND security Zoekt items die sociale en beveiligingsitems bevatten.
OF social OR security Zoekt items die sociale of beveiligingsitems bevatten.
Hsa: has:tags has:description Sta filteren toe en retourneert alleen de assets waar een bepaalde eigenschap is ingesteld (of als de eigenschap een verzameling vertegenwoordigt - deze bevat ten minste één element).

Notities

Voorvoegselsemantiek

Standaard worden alle zoekopdrachten in Azure Data Catalog uitgevoerd met behulp van een techniek met de naam Voorvoegsel match Semantics. Dit betekent dat elke zoekterm een overeenkomst begint aan het begin van de eigenschappen van de asset.

Neem bijvoorbeeld twee fictieve assets die zijn geregistreerd in Azure Data Catalog met de volgende namen:

  • SalesData
  • Verkoopman-aanhalingstekens

Een zoekopdracht naar 'sales' retourneert beide assets, omdat hun namen beide beginnen met het woord 'sales'. Toekomstige versies van Azure Data Catalog bieden ondersteuning voor operators voor exacte overeenkomst.

Zoekopdrachten binnen het bereik van eigenschappen

Azure Data Catalog querygrammatica ondersteunt het bereik van eigenschappen. In de huidige preview zijn de eigenschapsbereiken casegevoelig. Dit betekent dat om ervoor te zorgen dat de query werkt, de werkelijke hoofd- en hoofding van de eigenschap in de zoekquery moet overeenkomen met wat er in de index staat.

Zoekopdrachten naar ongeldige eigenschappen (eigenschappen die niet bestaan) resulteren in een fout.

Aanhalingstekens gedragen zich op een speciale manier bij het gebruik van het bereik van eigenschappen. Aanhalingstekens in een andere context geven exacte formulering aan. Wanneer aanhalingstekens echter worden gebruikt in het bereik van eigenschappen, wordt de semantiek gegroepeerd. Bijvoorbeeld: zoekt een zoekopdracht in vrije tekst naar de inhoud van de naam-eigenschap die zoekt naar name:"Sales Products" 'Verkoop' of 'Producten'. Daarom is de semantiek van: name:"Sales Products" precies hetzelfde als name:Sales name:Products .

Het algemene principe voor eigenschapsnamen in Doorzoekbare eigenschappen is camel-case, wat betekent dat de eerste letter kleine letters is en dat elk van de eerste woorden hoofdletters zijn.

Hieronder vindt u de handigste eigenschappen.

Eigenschap Gebruik Voorbeeld
naam Zoekt items waar de zoekterm wordt weergegeven in de naam van de gegevensbron name:finance
beschrijving Zoekt items waar de zoekterm wordt weergegeven in de beschrijving van de gegevensbron description:finance
objectType Zoekt items van een specifiek objecttype, zoals tabel, weergave of KPI objectType:table
Sourcetype Zoekt items van een specifiek gegevensbrontype, zoals SQL Server of SQL Server Analysis Services multidimensionaal sourceType:"tabular"
tags Zoekt items waar de zoekterm wordt weergegeven in de gegevensbrontags tags:finance
tijdstempel Zoekt items op basis van de datum en tijd waarop de metagegevens het laatst zijn gewijzigd timestamp:>"11/05/2014"
lastRegisteredTime Zoekt items op basis van de datum en tijd waarop hun metagegevens zijn geregistreerd lastRegisteredTime:>"11/05/2014"
Friendlyname Zoekt items waar de zoekterm wordt weergegeven in de gebruiksvriendelijke naam van de gegevensbron friendlyName: finance
Deskundigen Zoekt items waar de gegevensbronexpert overeenkomt met de zoekterm experts:user@example.com experts:user
termName Zoekt items waar de zoekterm wordt weergegeven in zakelijke woordenlijsttermen die zijn toegepast op de gegevensactiva termName:marketing

U kunt ook de volgende eigenschapsnamen gebruiken, samen met het filter 'has:' om te controleren waar assets specifieke eigenschappen hebben ingesteld.

Eigenschap Gebruik Voorbeeld
trailers Zoekt items die een preview-versie bevatten has:preview
documentatie Zoekt items die documentatie bevatten has:documentation
tableDataProfiles Zoekt items met een tabelprofiel (grootte, aantal rijen, enzovoort) has:tableDataProfiles
columnsDataProfiles Zoekt items met een kolomgegevensprofiel (aantal afzonderlijke waarden, min, max, enzovoort) has:columnsDataProfiles

Zoekvoorbeelden

In de volgende secties worden enkele zoekvoorbeelden gegeven.

Alle assets retourneren met 'verkoop' in de naam

name:sales

Alle assets retourneren die zijn geregistreerd na 20-4-2015 die 'verkoop' in een eigenschap bevatten

sales AND lastRegisteredTime&gt;"4/20/2015"

Alle assets retourneren die verkoop in een eigenschap bevatten en die niet de tag Q1FY2013 hebben

sales AND tags&lt;&gt;"Q1FY2013"

Alle assets retourneren waar geen experts of documentatie aan zijn toegewezen

not has:experts and not has:documentation