Azure Data Catalog – Entwicklerkonzepte

Artikel
12/15/2023

Wichtig

Azure Data Catalog wird am 15. Mai 2024 eingestellt.

Es können keine neuen Azure Data Catalog-Konten mehr erstellt werden.

Verwenden Sie zur Nutzung von Data Catalog-Features den Dienst Microsoft Purview, der einheitliche Datengovernance für Ihren gesamten Datenbestand bietet.

Wenn Sie Azure Data Catalog bereits nutzen, müssen Sie einen Migrationsplan für Ihre Organisation erstellen, um bis zum 15. Mai 2024 auf Microsoft Purview umzustellen.

Azure Data Catalog von Microsoft ist ein vollständig verwalteter Clouddienst mit Funktionen für die Datenquellenermittlung und das Crowdsourcing von Datenquellenmetadaten. Entwickler können den Dienst über die REST-APIs nutzen. Eine erfolgreiche Integration von Azure Data Catalogsetzt voraus, dass die Entwickler mit den implementierten Konzepten vertraut sind.

Wichtige Begriffe

Das konzeptionelle Modell von Azure Data Catalog basiert auf vier zentralen Konzepten: Katalog, Benutzer, Assets und Anmerkungen.

Konzeptionelles Modell mit Azure-Konto und Azure-Abonnement ganz oben, die in den Katalog einfließen. Der Katalog fließt in Benutzer und Assets ein, und Assets fließen in Anmerkungen ein.

Katalog

Ein Katalog ist ein Container auf oberster Ebene für alle Metadaten, die von einer Organisation gespeichert werden. Pro Azure-Konto ist jeweils ein Katalog zulässig. Kataloge sind mit einem Azure-Abonnement verknüpft, pro Konto kann aber immer nur ein einzelner Katalog erstellt werden (auch wenn ein Konto über mehrere Abonnements verfügen kann).

Der Katalog enthält Benutzer und Assets.

Benutzer

Benutzer*innen sind Sicherheitsprinzipale, die über Berechtigungen zum Ausführen von Aktionen im Katalog verfügen (Durchsuchen des Katalogs, Hinzufügen, Bearbeiten oder Entfernen von Elementen usw.).

Ein Benutzer kann verschiedene Rollen haben. Informationen zu Rollen finden Sie im Abschnitt „Rollen und Autorisierung“.

Einzelne Benutzer und Sicherheitsgruppen können hinzugefügt werden.

Azure Data Catalog verwendet Microsoft Entra ID für die Identitäts- und Zugriffsverwaltung. Jeder Katalogbenutzer muss einem Active Directory für das Konto angehören.

Objekte

Ein Katalog enthält Datenassets. Assets sind die Einheit der vom Katalog verwalteten Granularität.

Die Granularität eines Assets variiert je nach Datenquelle. Bei SQL Server oder Oracle Database kann ein Asset eine Tabelle oder Sicht sein. Bei SQL Server Analysis Services kann ein Asset eine Kennzahl, eine Dimension oder ein Key Performance Indicator (KPI) sein. Bei SQL Server Reporting Services ist ein Asset ein Bericht.

Ein Asset ist das Element, das Sie einem Katalog hinzufügen oder daraus entfernen. Es ist die Ergebniseinheit, die von Search zurückgegeben wird.

Ein Asset setzt sich aus dem Namen, dem Speicherort, dem Typ und Anmerkungen zur genaueren Beschreibung zusammen.

Anmerkungen

Anmerkungen sind Elemente, die Metadaten für Assets darstellen.

Beispiele für Anmerkungen wären etwa Beschreibungen, Tags, Schemas und Dokumentation. Im Abschnitt Assetobjektmodell finden Sie eine vollständige Liste der Asset- und Anmerkungstypen.

Crowdsourcing von Anmerkungen und Benutzerperspektive (Meinungsvielfalt)

Ein zentraler Aspekt von Azure Data Catalog ist die Crowdsourcing-Unterstützung für Metadaten im System. Im Gegensatz zu einem Wiki-Ansatz, bei dem nur eine einzelne Meinung möglich ist und vom letzten Autor bestimmt wird, können beim Azure Data Catalog-Modell gleichzeitig mehrere Meinungen im System vorhanden sein.

Dieser Ansatz spiegelt die Realität von Unternehmensdaten wider, da er für ein bestimmtes Asset verschiedene Perspektiven von unterschiedlichen Benutzern zulässt:

Datenbankadministratorinnen und -administratoren können Informationen zu verfügbaren Vereinbarungen zum Servicelevel oder das verfügbare Verarbeitungszeitfenster für ETL-Massenvorgänge angeben.
Data Stewards können Informationen zu den Geschäftsprozessen, bei denen die Ressource angewandt wird, oder die Klassifizierungen angeben, die das Unternehmen auf die Ressource angewandt hat.
Finanzanalystinnen und -analysten können Informationen zur Verwendung der Daten im Rahmen der Berichterstellung am Ende des Zeitraums angeben.

Um dieses Beispiel zu ermöglichen, kann jeder Benutzer (Datenbankadministrator, Data Steward und Analyst) einer einzelnen, im Katalog registrierten Tabelle eine Beschreibung hinzufügen. Alle Beschreibungen werden im System gespeichert und im Azure Data Catalog-Portal angezeigt.

Dieses Muster wird auf die meisten Elemente im Objektmodell angewendet. Daher handelt es sich bei Objekttypen in der JSON-Nutzlast häufig um Arrays für Eigenschaften, obwohl Sie unter Umständen einen Singleton erwarten würden.

Am Assetstamm findet sich beispielsweise ein Array mit Beschreibungsobjekten. Die Array-Eigenschaft heißt „descriptions“. Eine Beschreibungsobjekt besitzt eine einzige Eigenschaft – die Beschreibung. Für jeden Benutzer, der „description“ eingibt, wird ein Beschreibungsobjekt für den von ihm angegebenen Wert erstellt.

Die UX kann dann entscheiden, wie die Kombination dargestellt wird. Für die Anzeige stehen drei verschiedene Muster zur Verfügung.

Das einfachste Muster ist „Alles anzeigen“. Bei diesem Muster werden alle Objekte in einer Listenansicht angezeigt. Die UX des Azure Data Catalog-Portals verwendet dieses Muster für die Beschreibung.
Ein weiteres Muster ist „Zusammenführen“. Bei diesem Muster werden alle Werte der verschiedenen Benutzer zusammengeführt. Duplikate werden entfernt. Beispiele für dieses Muster in der UX des Azure Data Catalog-Portals sind die Eigenschaften „tags“ und „experts“.
Ein drittes Muster ist „Letzter Autor ist ausschlaggebend“. Bei diesem Muster wird nur der zuletzt eingegebene Wert angezeigt. Ein Beispiel für dieses Muster ist „friendlyName“.

Assetobjektmodell

Wie bereits im Abschnitt mit den wichtigen Begriffen angedeutet, enthält das Objektmodell von Azure Data Catalog Elemente, bei denen es sich um Assets oder Anmerkungen handeln kann. Elemente besitzen optionale oder erforderliche Eigenschaften. Einige Eigenschaften gelten für alle Elemente. Einige Eigenschaften gelten für alle Assets. Einige Eigenschaften gelten nur für bestimmte Assettypen.

Systemeigenschaften

Eigenschaftenname	Datentyp	Kommentare
Zeitstempel	DateTime	Der Zeitpunkt der letzten Änderung des Elements. Dieses Feld wird vom Server generiert, wenn ein Element eingefügt wird, sowie bei jeder Aktualisierung eines Elements. Der Wert dieser Eigenschaft wird bei der Eingabe von Veröffentlichungsvorgängen ignoriert.
Kennung	Uri	Die absolute URL des Elements (schreibgeschützt). Es handelt sich hierbei um den eindeutig adressierbaren URI für das Element. Der Wert dieser Eigenschaft wird bei der Eingabe von Veröffentlichungsvorgängen ignoriert.
Typ	String	Der Typ des Assets (schreibgeschützt).
etag	String	Eine Zeichenfolge entsprechend der Version des Elements, die beim Ausführen von Vorgängen, mit denen Elemente im Katalog aktualisiert werden, für die Steuerung optimistischer Nebenläufigkeit verwendet werden kann. Mit „*“ kann die Übereinstimmung mit einem beliebigen Wert angegeben werden.

Allgemeine Eigenschaften

Diese Eigenschaften gelten für alle Stammassettypen und für alle Anmerkungstypen.

Eigenschaftenname	Datentyp	Kommentare
fromSourceSystem	Boolean	Gibt an, ob Daten des Elements aus einem Quellsystem (z. B. SQL Server-Datenbank, Oracle Database) abgeleitet oder von einem Benutzer erstellt wurden.

Allgemeine Stammeigenschaften

Diese Eigenschaften gelten für alle Stammassettypen.

Eigenschaftenname	Datentyp	Kommentare
name	String	Ein Name, der sich aus den Speicherortinformationen der Datenquelle ableitet.
dsl	DataSourceLocation	Beschreibt die Datenquelle eindeutig und ist einer der Bezeichner für das Asset. (Siehe Abschnitt zu dualer Identität.) Die DSL-Struktur variiert je nach Protokoll und Quelltyp.
dataSource	DataSourceInfo	Weitere Informationen zum Typ des Assets.
lastRegisteredBy	SecurityPrincipal	Beschreibt den Benutzer, der dieses Asset zuletzt registriert hat. Enthält die eindeutige ID für den Benutzer („UPN“) und einen Anzeigenamen („lastName“ und „firstName“).
containerID	String	Die ID des Containerassets für die Datenquelle. Diese Eigenschaft wird für den Containertyp nicht unterstützt.

Allgemeine Nicht-Singleton-Anmerkungseigenschaften

Diese Eigenschaften gelten für alle Nicht-Singleton-Anmerkungstypen (Anmerkungen, von denen pro Asset mehrere vorhanden sein können).

Eigenschaftenname	Datentyp	Kommentare
Schlüssel	String	Ein benutzerdefinierter Schlüssel, der die Anmerkung in der aktuellen Sammlung eindeutig identifiziert. Die Länge des Schlüssels darf 256 Zeichen nicht überschreiten.

Stammassettypen

Stammassettypen stellen die verschiedenen Typen von Datenassets dar, die im Katalog registriert werden können. Für jeden Stammtyp gibt es eine Sicht, die die in der Sicht enthaltenen Assets und Anmerkungen beschreibt. Der Sichtname sollte bei der Veröffentlichung eines Assets mithilfe der REST-API im entsprechenden {view_name}-URL-Segment verwendet werden.

Assettyp (Sichtname)	Weitere Eigenschaften	Datentyp	Zulässige Anmerkungen	Kommentare
Tabelle („tables“)			Beschreibung	Eine Tabelle stellt beliebige Tabellendaten dar. Beispiele wären etwa SQL-Tabellen, SQL-Sichten, tabellarische Analysis Services-Tabellen, mehrdimensionale Analysis Services-Dimensionen und Oracle-Tabellen.
			FriendlyName
			Tag
			Schema
			ColumnDescription
			ColumnTag
			Experte
			Vorschau
			AccessInstruction
			TableDataProfile
			ColumnDataProfile
			ColumnDataClassification
			Dokumentation
Kennzahl („measures“)			Beschreibung	Dieser Typ stellt eine Analysis Services-Kennzahl dar.
			FriendlyName
			Tag
			Experte
			AccessInstruction
			Dokumentation
	Measure	Spalte		Metadaten zur Beschreibung der Kennzahl.
	isCalculated	Boolean		Gibt an, ob es sich um eine berechnete Kennzahl handelt.
	measureGroup	String		Gibt an, ob es sich um eine berechnete Kennzahl handelt.
KPI („kpis“)			Beschreibung
			FriendlyName
			Tag
			Experte
			AccessInstruction
			Dokumentation
	measureGroup	String		Der physische Container für die Kennzahl.
	goalExpression	String		Ein numerischer MDX-Ausdruck oder eine Berechnung, der bzw. die den Zielwert des KPI zurückgibt.
	valueExpression	String		Ein numerischer MDX-Ausdruck, der den Ist-Wert des KPI zurückgibt.
	statusExpression	String		Ein MDX-Ausdruck, der den Status des KPI zu einem bestimmten Zeitpunkt darstellt.
	trendExpression	String		Ein MDX-Ausdruck, der den Wert des KPI im Zeitverlauf auswertet. Der Trend kann ein beliebiges zeitbasiertes Kriterium sein, das in bestimmten geschäftlichen Zusammenhängen nützlich ist.
Bericht („reports“)			Beschreibung	Dieser Typ stellt einen SQL Server Reporting Services-Bericht dar.
			FriendlyName
			Tag
			Experte
			AccessInstruction
			Dokumentation
	assetCreatedDate	String
	assetCreatedDate	String
	assetModifiedDate	String
	assetModifiedBy	String
Bericht („reports“)			Beschreibung	Dieser Typ stellt einen Container für andere Objekte dar, z. B. eine SQL-Datenbank, ein Azure-Blobcontainer oder ein Analysis Services-Modell.
			Tag
			Experte
			AccessInstruction
			Dokumentation

Anmerkungstypen

Anmerkungstypen stellen Typen von Metadaten dar, die anderen Typen innerhalb des Katalogs zugewiesen werden können.

Anmerkungstyp (geschachtelter Sichtname)	Weitere Eigenschaften	Datentyp	Kommentare
Beschreibung („descriptions“)			Diese Eigenschaft enthält eine Beschreibung für ein Asset. Jeder Benutzer des Systems kann eine eigene Beschreibung hinzufügen. Nur dieser Benutzer kann das Beschreibungsobjekt bearbeiten. (Administratoren und Assetbesitzer können das Beschreibungsobjekt löschen, aber nicht bearbeiten.) Die Beschreibungen der Benutzer werden vom System separat verwaltet. Es gibt also ein Array mit Beschreibungen für die einzelnen Assets (eine für jeden Benutzer, der einen Beitrag zu dem Asset geleistet hat, sowie ggf. eine weitere mit Informationen, die sich aus der Datenquelle ableiten).
	Beschreibung	string	Eine kurze Beschreibung des Assets (zwei bis drei Zeilen).
Tag („tags“)			Diese Eigenschaft definiert ein Tag für ein Asset. Jeder Benutzer des Systems kann mehrere Tags für ein Asset hinzufügen. Nur der Benutzer, der ein Tagobjekt erstellt hat, kann dieses bearbeiten. (Administratoren und Assetbesitzer können das Tagobjekt löschen, aber nicht bearbeiten.) Die Tags der Benutzer werden vom System separat verwaltet. Es gibt daher ein Array von Tagobjekten für jedes Asset.
	tag	Zeichenfolge	Ein Tag mit einer Beschreibung des Assets.
FriendlyName („friendlyName“)			Diese Eigenschaft enthält einen Anzeigenamen für ein Asset. FriendlyName ist eine Singleton-Anmerkung; einem Asset kann immer nur ein einzelner FriendlyName hinzugefügt werden. Nur der Benutzer, der ein FriendlyName-Objekt erstellt hat, kann dieses bearbeiten. (Administratoren und Assetbesitzer können das FriendlyName-Objekt löschen, aber nicht bearbeiten.) Die Anzeigenamen der Benutzer werden vom System separat verwaltet.
	friendlyName	Zeichenfolge	Ein Anzeigename des Assets.
FriendlyName („friendlyName“)			Diese Eigenschaft enthält einen Anzeigenamen für ein Asset. FriendlyName ist eine Singleton-Anmerkung; einem Asset kann immer nur ein einzelner FriendlyName hinzugefügt werden. Nur der Benutzer, der ein FriendlyName-Objekt erstellt hat, kann dieses bearbeiten. (Administratoren und Assetbesitzer können das FriendlyName-Objekt löschen, aber nicht bearbeiten.) Die Anzeigenamen der Benutzer werden vom System separat verwaltet.
	friendlyName	Zeichenfolge	Ein Anzeigename des Assets.
Schema („schema“)			Das Schema beschreibt die Struktur der Daten. Es listet die Namen, Typen und andere Metadaten des Attributs (Spalte, Attribut, Feld usw.) auf. Diese Informationen werden alle von der Datenquelle abgeleitet. Das Schema ist eine Singleton-Anmerkung; für ein Asset kann immer nur ein einzelnes Schema kann hinzugefügt werden.
	Spalten	Column[]	Ein Array mit Spaltenobjekten. Diese beschreiben die Spalte mit aus der Datenquelle abgeleiteten Informationen.
ColumnDescription („columnDescriptions“)			Diese Eigenschaft enthält eine Beschreibung für eine Spalte. Jeder Benutzer des Systems kann seine eigenen Beschreibungen für mehrere Spalten hinzufügen (höchstens eine pro Spalte). Nur der Benutzer, der ein ColumnDescription-Objekt erstellt hat, kann dieses bearbeiten. (Administratoren und Assetbesitzer können das ColumnDescription-Objekt löschen, aber nicht bearbeiten.) Die Spaltenbeschreibungen dieses Benutzers werden vom System separat verwaltet. Es gibt daher ein Array mit ColumnDescription-Objekten für die einzelnen Assets (eins für jeden Benutzer, der einen Beitrag zu der Spalte geleistet hat, sowie ggf. ein weiteres mit Informationen, die aus der Datenquelle abgeleitet wurde). Da die ColumnDescription nur lose an das Schema gebunden ist, kann es vorkommen, dass Beschreibung und Schema nicht mehr synchron sind. Die ColumnDescription kann eine Spalte beschreiben, die im Schema nicht mehr vorhanden ist. Der Autor oder die Autorin muss sicherstellen, dass Beschreibung und Schema synchron sind. Die Datenquelle kann auch beschreibende Spalteninformationen enthalten. Hierbei handelt es sich um zusätzliche ColumnDescription-Objekte, die beim Ausführen des Tools erstellt werden.
	columnName	String	Der Name der Spalte, auf die sich diese Beschreibung bezieht.
	Beschreibung	String	Eine kurze Beschreibung der Spalte (zwei bis drei Zeilen).
ColumnTag („columnTags“)			Diese Eigenschaft enthält ein Tag für eine Spalte. Jeder Benutzer des Systems kann mehrere Tags für eine bestimmte Spalte sowie Tags für mehrere Spalten hinzufügen. Nur der Benutzer, der ein ColumnTag-Objekt erstellt hat, kann dieses bearbeiten. (Administratoren und Assetbesitzer können das ColumnTag-Objekt löschen, aber nicht bearbeiten.) Die Spaltentags dieser Benutzer werden vom System separat verwaltet. Es gibt daher ein Array von ColumnTag-Objekten für jedes Asset. Da das ColumnTag nur lose an das Schema gebunden ist, kann es vorkommen, dass Tag und Beschreibung nicht mehr synchron sind. Das ColumnTag kann eine Spalte beschreiben, die im Schema nicht mehr vorhanden ist. Der Autor muss sicherstellen, dass Spaltentag und Schema synchron sind.
	columnName	String	Der Name der Spalte, auf die sich dieses Tag bezieht.
	tag	String	Ein Tag mit einer Beschreibung der Spalte.
Experte („experts“)			Diese Eigenschaft enthält einen Benutzer, der im Dataset als Experte angesehen wird. Expertenmeinungen (Beschreibungen) werden auf der Benutzeroberfläche zuerst aufgelistet. Jeder Benutzer kann eigene Experten angeben. Nur dieser Benutzer kann das Expertenobjekt bearbeiten. (Administratoren/Administratorinnen und Ressourcenbesitzer/-besitzerinnen können Expertenobjekte löschen, aber nicht bearbeiten.)
	Experte	SecurityPrincipal
Vorschau („previews“)			Die Vorschau enthält eine Momentaufnahme der Top-20-Datenzeilen für das Asset. Sie ist nur für einige Assettypen sinnvoll. (Eine Vorschau ist sinnvoll für eine Tabelle, nicht aber für eine Kennzahl.)
	Vorschau	object[]	Ein Array mit Objekten, das eine Spalte darstellt. Jedes Objekt besitzt eine Eigenschaftenzuordnung zu einer Spalte mit einem Spaltenwert für die Zeile.
AccessInstruction („accessInstructions“)
	mimeType	Zeichenfolge	Der MIME-Typ des Inhalts.
	content	Zeichenfolge	Die Anweisungen für den Zugriff auf dieses Datenasset. Der Inhalt kann eine URL, eine E-Mail-Adresse oder ein Satz von Anweisungen sein.
TableDataProfile („tableDataProfiles“)
	numberOfRows	int	Die Anzahl der Zeilen im Dataset.
	size	long	Die Größe des Datasets in Bytes.
	schemaModifiedTime	Zeichenfolge	Der Zeitpunkt der letzten Schemaänderung.
	dataModifiedTime	Zeichenfolge	Der Zeitpunkt der letzten Datasetänderung. (Daten wurden hinzugefügt, geändert oder gelöscht.)
ColumnsDataProfile („columnsDataProfiles“)
	Spalten	ColumnDataProfile[]	Ein Array von Spaltendatenprofilen.
ColumnDataClassification ("columnDataClassifications")
	columnName	String	Der Name der Spalte, auf die sich diese Klassifizierung bezieht.
	Klassifizierung	String	Die Klassifizierung der Daten in dieser Spalte.
Dokumentation („documentation“)			Einem bestimmten Asset kann nur eine Dokumentation zugeordnet sein.
	mimeType	Zeichenfolge	Der MIME-Typ des Inhalts.
	content	Zeichenfolge	Der Inhalt der Dokumentation.

Allgemeine Typen

Allgemeine Typen können als Typen für Eigenschaften verwendet werden, sind aber keine Elemente.

Allgemeiner Typ	Eigenschaften	Datentyp	Kommentare
DataSourceInfo	sourceType	Zeichenfolge	Beschreibt die Art der Datenquelle. Beispiele: SQL Server, Oracle-Datenbank usw.
	objectType	Zeichenfolge	Beschreibt die Art des Objekts in der Datenquelle. Beispiele: Tabelle oder Sicht für SQL Server
DataSourceLocation	protocol	Zeichenfolge	Erforderlich. Beschreibt ein Protokoll für die Kommunikation mit der Datenquelle. Beispiele hierfür sind `tds` für SQL Server und `oracle` für Oracle. Die Liste der derzeit unterstützten Protokolle finden Sie unter Datenquellenreferenz: DSL-Struktur.
	address	Dictionary<Zeichenfolge,Objekt>	Erforderlich. Bei „address“ handelt es sich um eine protokollspezifische Gruppe von Daten zur Identifizierung der Datenquelle, auf die verwiesen wird. Die für ein bestimmtes Protokoll gültigen Adressdaten, d. h. ohne Kenntnis des Protokolls bedeutungslos.
	authentication	Zeichenfolge	Optional. Das Authentifizierungsschema, das zur Kommunikation mit der Datenquelle verwendet wird. Beispiele: windows, oauth, usw.
	connectionProperties	Dictionary<Zeichenfolge,Objekt>	Optional. Weitere Informationen zum Herstellen einer Verbindung mit einer Datenquelle.
DataSourceLocation			Das Back-End überprüft die angegebenen Eigenschaften während der Veröffentlichung nicht in Microsoft Entra ID.
	upn	Zeichenfolge	Erforderlich. Eindeutige E-Mail-Adresse des Benutzers. Muss angegeben werden, wenn keine Objekt-ID angegeben wurde, oder im Zusammenhang mit der Eigenschaft „lastRegisteredBy“, andernfalls optional.
	objectId	Guid	Optional. Benutzer- oder Sicherheitsgruppenidentität in Microsoft Entra. Optional. Muss angegeben werden, wenn kein UPN angegeben wurde, andernfalls optional.
	firstName	Zeichenfolge	Der Vorname des Benutzers (für die Anzeige). Optional. Nur im Kontext der Eigenschaft „lastRegisteredBy“ gültig. Kann bei der Bereitstellung eines Sicherheitsprinzipals für Rollen, Berechtigungen und Experten nicht angegeben werden.
	lastName	Zeichenfolge	Der Nachname des Benutzers (für die Anzeige). Optional. Nur im Kontext der Eigenschaft „lastRegisteredBy“ gültig. Kann bei der Bereitstellung eines Sicherheitsprinzipals für Rollen, Berechtigungen und Experten nicht angegeben werden.
Spalte	name	Zeichenfolge	Der Name der Spalte oder des Attributs.
	Typ	Zeichenfolge	Der Datentyp der Spalte oder des Attributs. Die zulässigen Typen hängen vom Datenquellentyp des Assets ab. Nur eine Teilmenge von Typen wird unterstützt.
	maxLength	int	Die maximal zulässige Länge für die Spalte oder das Attribut. Abgeleitet von der Datenquelle. Gilt nur für einige Datenquellentypen.
	precision	int	Die Genauigkeit für die Spalte oder das Attribut. Abgeleitet von der Datenquelle. Gilt nur für einige Datenquellentypen.
	isNullable	isNullable	Gibt an, ob die Spalte einen Nullwert enthalten kann. Abgeleitet von der Datenquelle. Gilt nur für einige Datenquellentypen.
	expression	Zeichenfolge	Wenn es sich bei dem Wert um eine berechnete Spalte handelt, enthält dieses Feld den Ausdruck, der den Wert angibt. Abgeleitet von der Datenquelle. Gilt nur für einige Datenquellentypen.
ColumnDataProfile	columnName	Zeichenfolge	Name der Spalte.
	Typ	Zeichenfolge	Der Typ der Spalte.
	min	Zeichenfolge	Der Mindestwert im Dataset.
	max	Zeichenfolge	Der Höchstwert im Dataset.
	avg	double	Der durchschnittliche Wert im Dataset.
	stdev	double	Die Standardabweichung für das Dataset
	nullCount	int	Die Anzahl der Nullwerte im Dataset.
	distinctCount	int	Die Anzahl der unterschiedlichen Werte im Dataset.

Assetidentität

Azure Data Catalog verwendet „protocol“ und Identitätseigenschaften aus dem Eigenschaftenbehälter „address“ der DataSourceLocation-Eigenschaft „dsl“, um die Identität des Assets zu generieren, die verwendet wird, um das Asset im Katalog zu adressieren. Das TDS-Protokoll (Tabular Data Stream) beispielsweise besitzt die Identitätseigenschaften „server“, „database“, „schema“ und „object“. Die Kombinationen der Protokoll- und Identitätseigenschaften werden verwendet, um die Identität des SQL Server-Tabellenassets zu generieren. Azure Data Catalog enthält verschiedene integrierte Datenquellenprotokolle, die unter Von Azure Data Catalog unterstützte Datenquellenaufgeführt sind. Der Satz der unterstützten Protokolle kann programmgesteuert erweitert werden. (Weitere Informationen finden Sie in der Data Catalog-REST-API-Referenz.) Administratoren des Katalogs können benutzerdefinierte Datenquellenprotokolle registrieren. In der folgenden Tabelle werden die Eigenschaften beschrieben, die erforderlich sind, um ein benutzerdefiniertes Protokoll zu registrieren:

Benutzerdefinierte Datenquellenprotokoll-Spezifikation

Es gibt drei verschiedene Spezifikationstypen für Datenquellenprotokolle. Nachfolgend sind die Typen aufgeführt, gefolgt von einer Tabelle mit ihren Eigenschaften.

DataSourceProtocol

Eigenschaften	Datentyp	Kommentare
namespace	Zeichenfolge	Der Namespace des Protokolls. Der Namespace muss zwischen 1 und 255 Zeichen lang sein, mindestens ein nicht leeres Teil enthalten, die Teile müssen durch den Punkt (.) getrennt sein. Jeder Teil muss zwischen 1 und 255 Zeichen lang sein, mit einem Buchstaben beginnen und darf nur Buchstaben und Zahlen enthalten.
name	Zeichenfolge	Der Name des Protokolls. Der Name muss zwischen 1 und 255 Zeichen lang sein, mit einem Buchstaben beginnen und darf nur Buchstaben, Zahlen und den Gedankenstrich (-) enthalten.
identityProperties	DataSourceProtocolIdentityProperty[]	Liste der Identitätseigenschaften, muss mindestens eine, darf jedoch nicht mehr als 20 Eigenschaften enthalten. Beispiel: „server“, „database“, „schema“, „object“ sind die Identitätseigenschaften des „tds“-Protokolls.
identitySets	DataSourceProtocolIdentitySet[]	Liste der Identitätssätze. Definiert Sätze von Identitätseigenschaften, die die gültige Identität des Assets darstellen. Muss mindestens einen, darf jedoch nicht mehr als 20 Sätze enthalten. Beispiel: {"server", "database", "schema" and "object"} ist ein Identitätssatz für das TDS-Protokoll, der die Identität von SQL Server-Tabellenassets definiert.

DataSourceProtocolIdentityProperty

Eigenschaften	Datentyp	Kommentare
name	Zeichenfolge	Der Name der Eigenschaft. Der Name muss zwischen 1 und 100 Zeichen lang sein, mit einem Buchstaben beginnen und darf nur Buchstaben und Zahlen enthalten.
Typ	Zeichenfolge	Den Typ der Eigenschaft. Unterstützte Werte: „bool“, „boolean“, „byte“, „guid“, „int“, „integer“, „long“, „string“, „url“
ignoreCase	bool	Gibt an, ob bei Verwendung des Eigenschaftswerts die Groß-/Kleinschreibung ignoriert werden soll. Kann nur für Eigenschaften vom Typ „string“ angegeben werden. Der Standardwert ist „falsch“.
urlPathSegmentsIgnoreCase	bool[]	Gibt an, ob für jedes Segment des URL-Pfads die Groß-/Kleinschreibung ignoriert werden soll. Kann nur für Eigenschaften vom Typ „url“ angegeben werden. Der Standardwert ist [false].

DataSourceProtocolIdentitySet

Eigenschaften	Datentyp	Kommentare
name	Zeichenfolge	Der Name des Identitätssatzes.
properties	string[]	Die Liste der in diesem Identitätssatz enthaltenen Identitätseigenschaften. Sie darf keine Duplikate enthalten. Jede Eigenschaft, auf die der Identitätssatz verweist, muss in der Liste der „identityProperties“ des Protokolls definiert werden.

Rollen und Autorisierung

Microsoft Azure Data Catalog bietet Autorisierungsfunktionen für asset- und anmerkungsbezogene CRUD-Vorgänge.

Azure Data Catalog verwendet zwei Autorisierungsmechanismen:

Rollenbasierte Autorisierung
Berechtigungsbasierte Autorisierung

Rollen

Drei Rollen stehen zur Verfügung: Administrator, Besitzer und Mitwirkender. Jede Rolle hat ihren eigenen Umfang und ihre eigenen Rechte. Diese werden in der folgenden Tabelle zusammengefasst:

Rolle	Bereich	Rechte
Administrator	Katalog (alle Assets/Anmerkungen im Katalog)	Read, Delete, ViewRoles, ChangeOwnership, ChangeVisibility, ViewPermissions
Besitzer	Jedes Asset (Stammelement)	Read, Delete, ViewRoles, ChangeOwnership, ChangeVisibility, ViewPermissions
Mitwirkender	Jedes einzelne Asset und jede einzelne Anmerkung	Read*, Update, Delete, ViewRoles

Hinweis

*Wird dem Mitwirkenden die Leseberechtigung (Read) für das Objekt entzogen, werden ihm auch die anderen Rechte entzogen.

Hinweis

Die Rechte Read, Update, Delete und ViewRoles gelten für jedes Element (Asset oder Anmerkung), während die Rechte TakeOwnership, ChangeOwnership, ChangeVisibility und ViewPermissions nur für das Stammasset gelten. Delete gilt für ein Element sowie für alle dazugehörigen untergeordneten Elemente. Beim Löschen eines Assets werden also beispielsweise auch sämtliche Anmerkungen für dieses Asset gelöscht.

Berechtigungen

Eine Berechtigung ist eine Liste mit Zugriffssteuerungseinträgen. Jeder Zugriffssteuerungseintrag weist einem Sicherheitsprinzipal eine Gruppe von Rechten zu. Berechtigungen können nur für ein Asset (Stammelement) angegeben werden und gelten für das Asset und alle dazugehörigen untergeordneten Elemente.

In der Vorschauversion von Azure Data Catalog wird in der Berechtigungsliste nur das Recht Read unterstützt, um die Einschränkung der Sichtbarkeit eines Assets zu ermöglichen.

Standardmäßig ist jeder authentifizierte Benutzer zum Lesen aller Elemente im Katalog berechtigt, es sei denn, die Sichtbarkeit ist auf die Gruppe von Prinzipalen in den Berechtigungen beschränkt.

REST-API

Mit den Sichtelementanforderungen PUT und POST können Sie Rollen und Berechtigungen steuern. Neben der Elementnutzlast können zwei Systemeigenschaften angegeben werden: roles und permissions.

Hinweis

permissions gilt nur für ein Stammelement. Besitzer gilt nur für ein Stammelement. Bei der Erstellung eines Elements im Katalog wird standardmäßig der entsprechende Mitwirkende als derzeit authentifizierter Benutzer festgelegt. Soll ein Element für jeden Benutzer aktualisierbar sein, muss Mitwirkender in der Eigenschaft roles bei der Erstveröffentlichung des Elements auf den speziellen Sicherheitsprinzipal <Everyone> festgelegt werden (wie im folgenden Beispiel zu sehen). Mitwirkender kann nicht geändert werden (auch nicht vom Administrator oder Besitzer) und bleibt während der gesamten Lebensdauer eines Elements unverändert. Der einzige unterstützte Wert zum expliziten Festlegen des Mitwirkenden ist <Everyone>: Der Mitwirkende kann also nur ein Benutzer, der ein Element erstellt hat, oder <Everyone> sein.

Beispiele

Festlegen des Mitwirkenden auf <Everyone> beim Veröffentlichen eines Elements.

Die Objekt-ID des speziellen Sicherheitsprinzipals <Everyone> lautet „00000000-0000-0000-0000-000000000201“.

POSThttps://api.azuredatacatalog.com/catalogs/default/views/tables/?api-version=2016-03-30

Hinweis

Einige HTTP-Clientimplementierungen können Anforderungen als Reaktion auf eine 302-Antwort vom Server neu ausstellen, in der Regel werden die Autorisierungsheader jedoch aus der Anforderung entfernt. Der Autorisierungsheader ist für Anforderungen an Azure Data Catalog erforderlich. Vergewissern Sie sich daher, dass der Autorisierungsheader noch vorhanden ist, wenn eine Anforderung an einen von Azure Data Catalog festgelegten Umleitungsort neu ausgestellt wird. Dies wird im folgenden Beispielcode mithilfe des Objekts „.NET HttpWebRequest“ veranschaulicht.

Body

    {
        "roles": [
            {
                "role": "Contributor",
                "members": [
                    {
                        "objectId": "00000000-0000-0000-0000-000000000201"
                    }
                ]
            }
        ]
    }

Zuweisen von Besitzern und Einschränken der Sichtbarkeit für ein vorhandenes Stammelement: PUThttps://api.azuredatacatalog.com/catalogs/default/views/tables/042297b0...1be45ecd462a?api-version=2016-03-30

    {
        "roles": [
            {
                "role": "Owner",
                "members": [
                    {
                        "objectId": "c4159539-846a-45af-bdfb-58efd3772b43",
                        "upn": "user1@contoso.com"
                    },
                    {
                        "objectId": "fdabd95b-7c56-47d6-a6ba-a7c5f264533f",
                        "upn": "user2@contoso.com"
                    }
                ]
            }
        ],
        "permissions": [
            {
                "principal": {
                    "objectId": "27b9a0eb-bb71-4297-9f1f-c462dab7192a",
                    "upn": "user3@contoso.com"
                },
                "rights": [
                    {
                        "right": "Read"
                    }
                ]
            },
            {
                "principal": {
                    "objectId": "4c8bc8ce-225c-4fcf-b09a-047030baab31",
                    "upn": "user4@contoso.com"
                },
                "rights": [
                    {
                        "right": "Read"
                    }
                ]
            }
        ]
    }

Hinweis

Bei „PUT“ muss im Text keine Elementnutzlast angegeben werden: „PUT“ kann zur reinen Aktualisierung von Rollen und/oder Berechtigungen verwendet werden.

Nächste Schritte

Referenz für die Azure Data Catalog-REST-API

Azure Data Catalog – Entwicklerkonzepte

Wichtige Begriffe

Katalog

Benutzer

Objekte

Anmerkungen

Crowdsourcing von Anmerkungen und Benutzerperspektive (Meinungsvielfalt)

Assetobjektmodell

Systemeigenschaften

Allgemeine Eigenschaften

Allgemeine Stammeigenschaften

Allgemeine Nicht-Singleton-Anmerkungseigenschaften

Stammassettypen

Anmerkungstypen

Allgemeine Typen

Assetidentität

Benutzerdefinierte Datenquellenprotokoll-Spezifikation

DataSourceProtocol

DataSourceProtocolIdentityProperty

DataSourceProtocolIdentitySet

Rollen und Autorisierung

Rollen

Berechtigungen

REST-API

Beispiele

Body

Nächste Schritte

Zusätzliche Ressourcen