Azure Data Catalog – gyakori kérdések

Fontos

Az Azure Data Catalog 2024. május 15-én megszűnik.

Új Azure Data Catalog-fiókok már nem hozhatók létre.

Az adatkatalógus funkcióihoz használja a Microsoft Purview szolgáltatást, amely egységes adatszabályozást biztosít a teljes adattulajdonhoz.

Ha már használja az Azure Data Catalogot, létre kell hoznia egy migrálási tervet a szervezet számára, hogy 2024. május 15-ig a Microsoft Purview-ba költözjön.

Ez a cikk az Azure Data Catalog szolgáltatással kapcsolatos gyakori kérdésekre ad választ.

Mi az az Azure Data Catalog?

A Data Catalog a Microsoft Azure-ban üzemeltetett teljes körűen felügyelt szolgáltatás, amely regisztrációs és felderítési rendszerként szolgál a vállalati adatforrásokhoz. A Data Catalog segítségével minden felhasználó, az elemzőktől az adattudósokig és a fejlesztőkig, regisztrálhat, felderíthet, megérthet és felhasználhat adatforrásokat.

Milyen ügyfélproblémákat old meg?

A Data Catalog az adatforrások felderítésének és a "sötét adatoknak" a kihívásaival foglalkozik, hogy a felhasználók felfedezhessék és megérthessék a vállalati adatforrásokat.

Mik a célközönségei?

A Data Catalog műszaki és nem műszaki felhasználók számára készült, beleértve a következőket:

  • Adatfejlesztők, bi- és elemzési szakemberek: Kapcsolatok, akik az adatok és elemzési tartalmak mások számára történő előállításáért felelősek.
  • Adatgondnokok: Kapcsolatok, akik ismerik az adatokat, mit jelentenek, és hogyan kívánják használni.
  • Adatfelhasználók: Kapcsolatok, akiknek a munkájuk elvégzéséhez szükséges adatok könnyen felderíthetők, megérthetők és összekapcsolhatók a választott eszközzel.
  • Központi informatikai részleg: Kapcsolatok, akiknek több száz adatforrást kell felderítenie az üzleti felhasználók számára, és akiknek fenn kell tartaniuk az adatok felhasználásának és ki által történő felügyeletét.

Mennyi ideig érhető el a Data Catalog?

Az adatkatalógus 2025 augusztusáig érhető el. Ekkorra migrálnia kell.

Hová kell migrálnunk?

Migrálhat a Microsoft Purview szolgáltatásba, amely egységes adatszabályozást biztosít a teljes adattulajdonhoz.

Mi a rendelkezésre állása régiónként?

Az adatkatalógus-szolgáltatások jelenleg a következő adatközpontokban érhetők el:

  • USA nyugati régiója
  • USA keleti régiója
  • Nyugat-Európa
  • Észak-Európa
  • Kelet-Ausztrália
  • Délkelet-Ázsia

Milyen korlátai vannak az adategységek számának?

A Data Catalog ingyenes kiadása 5000 regisztrált adategységre korlátozódik.

A Data Catalog Standard kiadás legfeljebb 100 000 regisztrált adategységet támogat.

Az adatkatalógusban regisztrált objektumok( például táblák, nézetek, fájlok és jelentések) adategységnek számítanak.

Mik a támogatott adatforrás- és eszköztípusok?

A jelenleg támogatott adatforrások listáját a Data Catalog DSR-ben találja.

Hogyan másik adatforrás támogatását kéri?

A szolgáltatáskérések és egyéb visszajelzések elküldéséhez nyissa meg a Data Catalog webhelyet az Azure visszajelzési fórumain.

Miért jelenik meg egy "Katalógus már létezik" hibaüzenet, amikor új katalógust próbálok létrehozni?

Ha Power BI Pro-licenccel vásárol Office 365 E5 csomag, a Microsoft automatikusan létrehoz egy alapértelmezett katalógust az előfizetés régiójában. Ez a katalógus az ingyenes termékváltozatot használja. Az Office 365/Power BI felhasználói licenc kezelése a felügyeleti oldalon történik.

Az ilyen típusú adatkatalógus azonban nem rendelkezik Rendszergazda istrator beállítással, és nem látható az Azure Portalon. Az ilyen típusú adatkatalógus nem törölhető. Hasonlóképpen nem nevezheti át az adatkatalógust, és nem helyezheti át egy másik régióba.

A Power BI Pro-licenccel rendelkező felhasználói fiókok automatikusan hozzáférnek az adatkatalógushoz a Licencszerződés miatt, amikor a Power BI Pro-licenccel regisztráltak Office 365 E5 csomag. Ez a felhasználó teljes hozzáféréssel rendelkezik az adatkatalógus-objektumokhoz rendszergazdai jogosultságok nélkül. Ez a felhasználó nem része az Azure Data Catalog katalógusbeli felhasználói szerepkörének.

Hogyan regisztrálni az adataimat?

Adatok regisztrálása a Data Catalogban:

  1. Az Azure Data Catalog portál Közzététel területén indítsa el az Azure Data Catalog regisztrációs eszközét.
  2. Az Adatkatalógus adatforrás-regisztrációs eszközében jelentkezzen be ugyanazokkal a hitelesítő adatokkal, amelyeket az adatkatalógus-portál eléréséhez használ.
  3. Válassza ki az adatforrást és a regisztrálni kívánt konkrét objektumokat.

Milyen tulajdonságokat nyer ki a regisztrált adategységekhez?

Az egyes tulajdonságok adatforrásonként eltérőek, de a Data Catalog közzétételi szolgáltatás általában a következő információkat nyeri ki:

  • Eszköz neve
  • Objektumtípus
  • Eszköz leírása
  • Attribútum-/oszlopnevek
  • Attribútum/oszlop adattípusai
  • Attribútum/oszlop leírása

Fontos

Az adategységek adatkatalógusban való regisztrálása nem helyezi át vagy másolja az adatokat a felhőbe. Az eszközök adatforrásból való regisztrálása az eszközök metaadatait az Azure-ba másolja, de az adatok a meglévő adatforrás helyén maradnak. Ez alól a szabály alól kivételt képeznek az előnézeti rekordok vagy adatprofilok az objektumok regisztrálásakor történő feltöltése esetén. Ha előzetes verziót ad meg, a rendszer legfeljebb 20 rekordot másol át az egyes objektumokból, és pillanatképként tárolja őket a Data Catalogban. Adatprofil hozzáadásakor a rendszer kiszámítja az összesítő adatokat, és belefoglalja a katalógusban tárolt metaadatokba. Az összesítő információk lehetnek például a táblák mérete, az oszloponkénti null értékek százalékos aránya, illetve az oszlopok minimális, maximális és átlagértékei.

Feljegyzés

Az olyan adatforrások esetében, mint az SQL Server Analysis Services, amely első osztályú Leírás tulajdonsággal rendelkezik, a Data Catalog adatforrásregisztrációs eszköze kinyeri ezt a tulajdonságértéket. Az első osztályú Leírás tulajdonsággal nem rendelkező helyszíni SQL Server relációs adatbázisok esetében az adatkatalógus adatforrás-regisztrációs eszköze kinyeri az értéket az objektumok és oszlopok MS_Description kiterjesztett tulajdonságából. Ez a tulajdonság az SQL Azure-ban nem támogatott. További információ: Kiterjesztett tulajdonságok használata adatbázis-objektumokon.

Mennyi ideig tart, amíg az újonnan regisztrált objektumok megjelennek a katalógusban?

Miután regisztrálta az objektumokat a Data Catalogban, 5–10 másodperc lehet, amíg azok megjelennek az adatkatalógus portálján.

Hogyan jegyzetekkel egészíti ki és bővíti a regisztrált adategységek metaadatait?

A regisztrált objektumok metaadatainak megadásának legegyszerűbb módja az, ha kijelöli az objektumot az Adatkatalógus portálján, majd beírja az értékeket a kijelölt objektum tulajdonságok ablaktábláján vagy sémapaneljén.

A regisztrációs folyamat során néhány metaadatot, például szakértőket és címkéket is megadhat. A Data Catalog közzétételi szolgáltatásban megadott értékek az adott időpontban regisztrált összes objektumra érvényesek. Ha további megjegyzéseket szeretne látni a portálon a közelmúltban regisztrált objektumokról, válassza a Portál megtekintése gombot az adatkatalógus adatforrás-regisztrációs eszközének utolsó képernyőjén.

Hogyan törölni a regisztrált adatobjektumokat?

Az objektumot a portálon az objektum kiválasztásával, majd a Törlés gombra kattintva törölheti az Adatkatalógusból. Az objektum eltávolítása eltávolítja a metaadatokat a Data Catalogból, de nem befolyásolja az alapul szolgáló adatforrást.

Mi az a szakértő?

A szakértő olyan személy, aki tájékozottan tekint egy adatobjektumra. Egy objektumnak több szakértője is lehet. Egy szakértőnek nem kell egy objektum "tulajdonosának" lennie, hanem egyszerűen csak olyan személy, aki tudja, hogyan használhatók és használhatók az adatok.

Hogyan megosztani az adatokat a Data Catalog csapatával, ha problémákat tapasztalok?

Problémák bejelentéséhez, információk megosztásához és kérdések feltevéséhez látogasson el az Azure Data Catalog Q&A fórumára, vagy nyisson meg egy támogatási kérést.

Működik a katalógus egy másik, engem érdeklő adatforrással?

Aktívan dolgozunk azon, hogy további adatforrásokat adjunk hozzá a Data Cataloghoz. Ha egy adott adatforrást támogatottnak szeretne látni, javasolja (vagy ha már javasolta, hangoztasson támogatást) az Azure visszajelzési fórumainak adatkatalógusában.

Milyen engedélyekre van szükségem az objektumok adatkatalógusban való regisztrálásához?

A Data Catalog regisztrációs eszköz futtatásához engedélyekre van szüksége az adatforráshoz, amely lehetővé teszi a metaadatok forrásból való olvasását. Az előzetes verzió hozzáadásához olyan engedélyekkel kell rendelkeznie, amelyek lehetővé teszik a regisztrált objektumok adatainak beolvasását.

Az adatkatalógus azt is lehetővé teszi, hogy a katalógusgazdák korlátozzák, hogy mely felhasználók és csoportok adhatnak hozzá metaadatokat a katalógushoz. További információ: Az adatkatalógushoz és adategységekhez való hozzáférés biztonságossá tételéről.

Elérhetővé válik a Data Catalog a helyszíni üzembe helyezéshez is?

A Data Catalog egy felhőalapú szolgáltatás, amely a felhőalapú és a helyszíni adatforrásokkal együtt is képes hibrid adatforrás-felderítési megoldást nyújtani. Jelenleg nincsenek tervek a helyszíni adatkatalógus-szolgáltatás egy verziójára vonatkozóan.

Kinyerhetek több vagy gazdagabb metaadatot a regisztrált adatforrásokból?

Aktívan dolgozunk a Data Catalog képességeinek bővítésén. Ha több metaadatot szeretne kinyerni az adatforrásból a regisztráció során, javasolja (vagy szavazzon rá, ha már javasolták) az Azure Visszajelzési fórumok adatkatalógusában.

Ha oszlop-/séma-metaadatokat, előnézeteket vagy adatprofilokat szeretne hozzáadni olyan adatforrásokhoz, ahol ezeket a metaadatokat nem az adatforrásregisztrációs eszköz nyeri ki, a Data Catalog API-val hozzáadhatja ezeket a metaadatokat. További információ: Azure Data Catalog REST API.

Hogyan korlátozza a regisztrált adategységek láthatóságát, hogy csak bizonyos személyek fedezhessék fel őket?

Válassza ki az adatkatalógus adategységeit, majd válassza a Tulajdonjog átvétele gombot. Az adatkatalógusban lévő adategységek tulajdonosai módosíthatják a láthatósági beállításokat, hogy lehetővé tegyék az összes felhasználó számára, hogy felfedezzék a tulajdonban lévő eszközöket, vagy bizonyos felhasználókra korlátozzák a láthatóságot. További információ: Adategységek kezelése az Azure Data Catalogban.

Hogyan frissíteni az adategység regisztrációjának frissítését, hogy az adatforrás változásai megjelenjenek a katalógusban?

A katalógusban már regisztrált adategységek metaadatainak frissítéséhez regisztrálja újra az objektumokat tartalmazó adatforrást. Az adatforrás minden módosítása, például a táblákból vagy nézetekből hozzáadott vagy eltávolított oszlopok frissülnek a katalógusban, de a felhasználók által megadott széljegyzetek megmaradnak.

A kérdésemre itt nem ad választ. Hol találhatok válaszokat?