Módosított adatok rögzítése az Azure Data Lake Storage Gen2-ről az Azure SQL Database-be egy változásadat-rögzítési erőforrás használatával
A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics
Tipp.
Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!
Ebben a cikkben az Azure Data Factory felhasználói felületével hoz létre változásadat-rögzítő (CDC) erőforrást. Az erőforrás egy Azure Data Lake Storage Gen2-forrásból veszi fel a módosított adatokat, és valós időben hozzáadja azOkat az Azure SQL Database-hez.
Ebben a cikkben az alábbiakkal ismerkedhet meg:
- Hozzon létre egy CDC-erőforrást.
- CDC-tevékenység figyelése.
Ebben a cikkben módosíthatja és kibonthatja a konfigurációs mintát.
Előfeltételek
Mielőtt elkezdené a cikkben szereplő eljárásokat, győződjön meg arról, hogy rendelkezik az alábbi erőforrásokkal:
- Azure-előfizetés. Ha nem rendelkezik Azure-előfizetéssel, hozzon létre egy ingyenes Azure-fiókot.
- SQL-adatbázis. Az Azure SQL Database-t használja forrásadattárként. Ha nem rendelkezik SQL-adatbázissal, hozzon létre egyet az Azure Portalon.
- Storage-fiók. Céladattárként az Azure Data Lake Storage Gen2-ben tárolt Delta Lake-t használja. Ha nincs tárfiókja, a létrehozás lépéseit a Tárfiók létrehozása című témakörben találja.
CDC-összetevő létrehozása
Nyissa meg a Szerző panelt az adat-előállítóban. A Folyamatok alatt megjelenik a Change Data Capture (előzetes verzió) nevű új legfelső szintű összetevő.
Mutasson az Adatrögzítés módosítása (előzetes verzió) fölé, amíg három pont nem jelenik meg. Ezután válassza az Adatrögzítési műveletek módosítása (előzetes verzió) lehetőséget.
Válassza az Új CDC (előzetes verzió) lehetőséget. Ez a lépés megnyit egy úszó panelt az irányított folyamat elindításához.
A rendszer kéri, hogy nevezze el a CDC-erőforrást. Alapértelmezés szerint a név "adfcdc" egy számmal, amely 1-zel növekszik. Ezt az alapértelmezett nevet lecserélheti egy ön által választott névre.
Az adatforrás kiválasztásához használja a legördülő listát. Ebben a cikkben válassza a DelimitedText lehetőséget.
A rendszer egy társított szolgáltatás kiválasztását kéri. Hozzon létre egy új társított szolgáltatást, vagy válasszon ki egy meglévőt.
A Forrásbeállítások területen igény szerint speciális forráskonfigurációkat állíthat be, beleértve az oszlop- és sorhatárolókat is.
Ha nem manuálisan szerkessze ezeket a forrásbeállításokat, azok az alapértelmezett értékre vannak állítva.
A Tallózás gombbal válassza ki a forrásadatmappát.
Miután kiválasztotta a mappa elérési útját, a Folytatás gombra kattintva állítsa be az adatcélt.
A plusz (+) gombbal több forrásmappát is hozzáadhat. A többi forrásnak is ugyanazt a társított szolgáltatást kell használnia, amelyet már kiválasztott.
Válasszon ki egy céltípusértéket a legördülő listával. Ebben a cikkben válassza az Azure SQL Database lehetőséget.
A rendszer egy társított szolgáltatás kiválasztását kéri. Hozzon létre egy új társított szolgáltatást, vagy válasszon ki egy meglévőt.
Céltáblák esetén létrehozhat egy új céltáblát, vagy kiválaszthat egy meglévőt:
Céltábla létrehozásához válassza az Új entitások lapot, majd az Új táblák szerkesztése lehetőséget.
Meglévő tábla kijelöléséhez válassza a Meglévő entitások lapot, majd a jelölőnégyzet bejelölésével válasszon ki egy táblát. A táblázat adatainak megtekintéséhez használja az Előnézet gombot.
Ha a céltábla meglévő tábláinak neve megegyezik, akkor alapértelmezés szerint a Meglévő entitások csoportban vannak kiválasztva. Ha nem, az Új entitások területen új, egyező nevű táblák jönnek létre. Emellett az Új táblák szerkesztése gombbal is szerkesztheti az új táblákat .
A jelölőnégyzetek használatával több céltáblát is kiválaszthat az SQL-adatbázisból. Miután befejezte a céltáblák kiválasztását, válassza a Folytatás lehetőséget.
Megjelenik egy új lap a változásadatok rögzítéséhez. Ez a lap a CDC studio, ahol konfigurálhatja az új erőforrást.
A rendszer automatikusan létrehoz egy új leképezést. A legördülő listák használatával frissítheti a leképezés forrástáblájának és céltáblájának kijelölését.
A táblák kijelölése után a rendszer alapértelmezés szerint megfelelteti az oszlopokat az Automatikus megfeleltetés kapcsolóval. Az automatikus leképezés automatikusan leképezi az oszlopokat név szerint a fogadóban, felveszi az új oszlopmódosításokat a forrásséma fejlődésekor, és ezeket az információkat a támogatott fogadótípusokba alakítja.
Ha automatikus leképezést szeretne használni, és nem szeretne oszlopleképezéseket módosítani, lépjen közvetlenül a 18. lépésre.
Ha engedélyezni szeretné az oszlopleképezéseket, jelölje ki a leképezéseket, és kapcsolja ki az Automatikus leképezés kapcsolót. Ezután válassza az Oszlopleképezések gombot a leképezések megtekintéséhez.
Az Automatikus leképezés kapcsoló bekapcsolásával bármikor visszaállhat az automatikus leképezésre.
Az oszlopleképezések megtekintése. A legördülő listák segítségével szerkesztheti az oszlopleképezéseket a leképezési módszerhez, a Forrás oszlophoz és a Cél oszlophoz.
Ezen az oldalon a következőket teheti:
- További oszlopleképezések hozzáadása az Új leképezés gombbal. A legördülő listák segítségével kijelölhet leképezési metódust, forrásoszlopot és céloszlopot.
- Jelölje ki a Kulcsok oszlopot, ha nyomon szeretné követni a támogatott fogadótípusok törlési műveletét.
- Az Adatok előnézete alatt a Frissítés gombra kattintva megjelenítheti, hogy az adatok hogyan néznek ki a célhoz.
Ha a leképezés befejeződött, a nyíl gombra kattintva térjen vissza a fő CDC-vászonra.
Egy CDC-összetevőben több forrás-cél leképezést is hozzáadhat. A Szerkesztés gombbal további adatforrásokat és célokat vehet fel. Ezután válassza az Új leképezés lehetőséget , és a legördülő listák használatával állítson be egy új forrást és célt. Az automatikus leképezést egymástól függetlenül is be- és kikapcsolhatja.
A leképezések befejezése után állítsa be a CDC késését a Késés beállítása gombbal.
Válassza ki a CDC késését, majd kattintson az Alkalmaz gombra a módosítások elvégzéséhez.
Alapértelmezés szerint a késés 15 percre van állítva. A cikkben szereplő példa a valós idejű beállítást használja a késéshez. A valós idejű késés folyamatosan, 1 percnél rövidebb időközönként veszi fel a forrásadatok változásait.
Egyéb késések esetén (például ha 15 percet választ), a változásadat-rögzítés feldolgozni fogja a forrásadatokat, és felveszi a módosított adatokat az utolsó feldolgozott idő óta.
Megjegyzés:
Ha a támogatás ki van terjesztve a streamelési adatintegrációra (Azure Event Hubs és Kafka-adatforrások), a késés alapértelmezés szerint valós idejűre lesz állítva.
Miután befejezte a CDC konfigurálását, válassza az Összes közzététele lehetőséget a módosítások közzétételéhez.
Megjegyzés:
Ha nem teszi közzé a módosításokat, nem fogja tudni elindítani a CDC-erőforrást. A következő lépésben a Start gomb nem lesz elérhető.
Válassza a Start elemet a változásadat-rögzítés futtatásához.
A változásadatok rögzítésének monitorozása
Nyissa meg a Figyelés panelt az alábbi módszerek valamelyikével:
Válassza az Adatrögzítés módosítása (előzetes verzió) lehetőséget a CDC-erőforrások megtekintéséhez.
Az Adatrögzítés módosítása panel a változásadat-rögzítés forrás- és céladatait, állapotát és utolsó feldolgozott adatait jeleníti meg.
A további részletek megtekintéséhez válassza ki a CDC nevét. Láthatja, hogy hány módosítást (beszúrást, frissítést vagy törlést) olvastak és írtak, valamint egyéb diagnosztikai információkat.
Ha több leképezést is beállít a módosítási adatrögzítésben, minden leképezés más színként jelenik meg. Jelölje ki a sávot az egyes leképezések részleteinek megtekintéséhez, vagy használja a diagnosztikát a panel alján.