Kopírovanie údajov pomocou kopírovania aktivity
V kanáli údajov môžete použiť aktivitu Kopírovať na kopírovanie údajov medzi úchytmi údajov umiestnenými v cloude.
Po skopírovaní údajov môžete použiť iné aktivity na ďalšiu transformáciu a analýzu údajov. Aktivitu kopírovania môžete použiť aj na publikovanie výsledkov transformácie a analýzy pre Analytické nástroje (BI) a spotrebu aplikácie.
Ak chcete kopírovať údaje zo zdroja do cieľa, služba, ktorá spúšťa aktivitu Kopírovať, vykoná tieto kroky:
- Číta údaje zo zdrojového úložiska údajov.
- Vykoná serializáciu/deserializáciu, kompresiu/dekompresiu, mapovanie stĺpcov a podobne. Vykonáva tieto operácie na základe konfigurácie.
- Zapíše údaje do cieľového úložiska údajov.
Požiadavky
Na začiatok musíte splniť nasledujúce predpoklady:
konto nájomníka služby Microsoft Fabric s aktívnym predplatným, Vytvorte si bezplatné konto.
Uistite sa, že máte povolený pracovný priestor služby Microsoft Fabric.
Pridanie aktivity kopírovania pomocou asistenta kopírovania
Postupujte podľa týchto krokov a nastavte svoju aktivitu kopírovania pomocou asistenta kopírovania.
Začíname s asistentom kopírovania
Otvorte existujúci údajový kanál alebo vytvorte nový údajový kanál.
Začnite výberom položky Kopírovať údaje na plátne a otvorte nástroj Kopírovať asistenta . Alebo vyberte položku Použiť asistenta kopírovania z rozbaľovacieho zoznamu Kopírovať údaje na karte Aktivity na páse s nástrojmi.
Konfigurácia zdroja
Vyberte typ zdroja údajov z kategórie. Ako príklad použijete ukladací priestor objektu BLOB platformy Azure. Vyberte položku Azure Blob Storage a potom vyberte položku Ďalej.
Výberom položky Vytvoriť nové pripojenie vytvorte pripojenie k zdroju údajov.
Po výbere možnosti Vytvoriť nové pripojenie vyplňte požadované informácie o pripojení a potom vyberte položku Ďalej. Podrobnosti o vytváraní pripojenia pre jednotlivé typy zdrojov údajov nájdete v článku o jednotlivých konektoroch.
Ak máte existujúce pripojenia, môžete vybrať položku Existujúce pripojenie a z rozbaľovacieho zoznamu vybrať pripojenie.
Vyberte súbor alebo priečinok, ktoré sa má kopírovať v tomto kroku konfigurácie zdroja, a potom vyberte položku Ďalej.
Konfigurácia cieľa
Vyberte typ zdroja údajov z kategórie. Ako príklad použijete ukladací priestor objektu BLOB platformy Azure. Vyberte položku Ukladací priestor objektu BLOB platformy Azure a potom vyberte položku Ďalej.
Môžete vytvoriť nové pripojenie, ktoré odkazuje na nové konto úložiska objektu Blob platformy Azure pomocou krokov uvedených v predchádzajúcej časti, alebo použiť existujúce pripojenie z rozbaľovacieho zoznamu pripojenia. Možnosti Testovať pripojenie a Upraviť sú k dispozícii pre každé vybraté pripojenie.
Nakonfigurujte a priraďte svoje zdrojové údaje k cieľu. Potom výberom položky Ďalej dokončite cieľové konfigurácie.
Kontrola a vytvorenie aktivity kopírovania
Skontrolujte nastavenia aktivity kopírovania v predchádzajúcich krokoch a výberom tlačidla OK dokončite kroky. Prípadne sa môžete vrátiť k predchádzajúcim krokom a v prípade potreby upraviť nastavenia v nástroji.
Po dokončení sa aktivita kopírovania pridá na plátno kanála údajov. Všetky nastavenia vrátane rozšírených nastavení tejto aktivity kopírovania sú po výbere k dispozícii na kartách.
Teraz môžete buď uložiť dátový kanál pomocou tejto aktivity jednej kópie, alebo pokračovať v navrhovaní kanála údajov.
Pridanie aktivity kopírovania priamo
Ak chcete pridať aktivitu kopírovania priamo, postupujte podľa týchto krokov.
Pridanie aktivity kopírovania
Otvorte existujúci údajový kanál alebo vytvorte nový údajový kanál.
Pridajte aktivitu kopírovania výberom položky Pridať aktivitu>kanála Kopírovať aktivitu alebo výberom položky Kopírovať údaje>Pridať na plátno na karte Aktivity.
Konfigurácia všeobecných nastavení na karte Všeobecné
Informácie o konfigurácii všeobecných nastavení nájdete v téme Všeobecné.
Nakonfigurujte zdroj na karte Zdroj
Vyberte položku + Nové vedľa Pripojenie ion a vytvorte pripojenie k zdroju údajov.
V kontextovom okne vyberte typ zdroja údajov. Ako príklad použijete databázu Azure SQL. Vyberte položku Databáza Azure SQL a potom položku Pokračovať.
Prejde na stránku na vytvorenie pripojenia. Vyplňte požadované informácie o pripojení na paneli a potom vyberte položku Vytvoriť. Podrobnosti o vytváraní pripojenia pre jednotlivé typy zdrojov údajov nájdete v článku o jednotlivých konektoroch.
Po úspešnom vytvorení pripojenia sa vrátite na stránku kanála údajov. Potom vyberte položku Obnoviť , čím sa z rozbaľovacieho zoznamu načíta pripojenie, ktoré ste vytvorili. Môžete tiež vybrať existujúce pripojenie k databáze Azure SQL z rozbaľovacieho zoznamu priamo, ak ste ho už vytvorili predtým. Možnosti Testovať pripojenie a Upraviť sú k dispozícii pre každé vybraté pripojenie. Potom v type Pripojenie ion vyberte možnosť DatabázaAzure SQL.
Zadajte tabuľku, ktorá sa má skopírovať. Ak chcete zobraziť ukážku zdrojovej tabuľky, vyberte položku Zobraziť ukážku údajov . Na čítanie údajov zo zdroja môžete použiť aj procedúru Dotaz a uloženú.
Rozbaľte ponuku Rozšírené , aby ste zobrazili pokročilejšie nastavenia.
Konfigurácia cieľa na cieľovej karte
Vyberte cieľový typ. Môže ísť o interný ukladací priestor údajov prvej triedy z vášho pracovného priestoru, ako je napríklad Lakehouse, alebo vaše externé ukladací priestor údajov. Ako príklad použijete Lakehouse.
Vyberte si, či chcete použiť lakehouse v type ukladacieho priestoru údajov pracovného priestoru. Vyberte položku + Nové a prejdete na stránku vytvorenia Lakehouse. Zadajte názov svojho jazera a potom vyberte položku Vytvoriť.
Po úspešnom vytvorení pripojenia sa vrátite na stránku kanála údajov. Potom vyberte položku Obnoviť , čím sa z rozbaľovacieho zoznamu načíta pripojenie, ktoré ste vytvorili. Môžete si tiež vybrať existujúce pripojenie k Lakehouse z rozbaľovacieho zoznamu priamo, ak ste ho už predtým vytvorili.
Zadajte tabuľku alebo nastavte cestu k súboru na definovanie súboru alebo priečinka ako cieľa. Tu vyberte položku Tabuľky a zadajte tabuľku, ktorá sa má zapisovať údaje.
Rozbaľte ponuku Rozšírené , aby ste zobrazili pokročilejšie nastavenia.
Teraz môžete buď uložiť dátový kanál pomocou tejto aktivity jednej kópie, alebo pokračovať v navrhovaní kanála údajov.
Konfigurácia priradení na karte priradenia
Ak konektor, ktorý používate, podporuje mapovanie, môžete prejsť na kartu Mapovanie a konfigurovať priradenie.
Ak chcete importovať schému údajov, vyberte položku Importovať schémy.
Môžete vidieť, že sa zobrazuje automatické mapovanie. Zadajte stĺpce Source (Zdroj ) a Destination (Cieľ ). Ak vytvoríte novú tabuľku v cieli, môžete prispôsobiť názov stĺpca Cieľ tu. Ak chcete zapísať údaje do existujúcej cieľovej tabuľky, nemôžete upraviť existujúci názov stĺpca Cieľ . Môžete tiež zobraziť stĺpce Typ zdroja a cieľa.
Okrem toho môžete vybrať + Nové priradenie a pridať nové priradenie, výberom položky Vymazať vymažete všetky nastavenia mapovania a potom vyberte položku Obnoviť, čím obnovíte všetky zdrojové stĺpce priradenia.
Konfigurácia konverzie typu
Rozbaľte položku Nastavenia konverzie typu a v prípade potreby nakonfigurujte konverziu typu.
Podrobnosti nastavenia nájdete v nasledujúcej tabuľke.
Nastavenie | Description |
---|---|
Povoliť skrátenie údajov | Povoliť skrátenie údajov pri konvertovaní zdrojových údajov do cieľa pomocou iného typu počas kopírovania. Napríklad od desatinnej čiarky po celé číslo, a to od hodnoty DatetimeOffset po hodnotu Datetime. |
Považovať booleovskú hodnotu za číslo | Považovať booleovskú hodnotu za číslo. Napríklad považovať hodnotu true za 1. |
Formát dátumu | Reťazec formátu pri konvertovaní medzi dátumami a reťazcami, napríklad "yyyy-MM-dd". Ďalšie informácie nájdete v téme Vlastné reťazce formátu dátumu a času. Stĺpec dátumov sa dá čítať ako typ dátumu pre: • Amazon RDS pre SQL Server • Databáza Azure SQL • Spravovaná inštancia databázy Azure SQL • Azure Synapse Analytics • Formát textu s oddeľovačmi • Lakehouse Table • Formát parketu • SQL Server |
Formát dátumu a času | Reťazec formátu pri konvertovaní medzi dátumami bez posunu časového pásma a reťazcov. Napríklad "yyyy-MM-dd HH:mm:ss.fff". |
Formát funkcie DateTimeOffset | Reťazec formátu pri konvertovaní medzi dátumami s posunom časového pásma a reťazcami. Napríklad "yyyy-MM-dd HH:mm:ss.fff zzz". |
Formát časového rozpätia | Reťazec formátu pri konvertovaní medzi časovými obdobiami a reťazcami. Napríklad "dd.hh:mm:ss". |
Kultúry | Informácie o jazykovej verzii, ktoré sa majú použiť pri konvertovaní typov. Napríklad "en-us", "fr-fr". |
Konfigurácia ďalších nastavení na karte Nastavenia
Karta Nastavenia obsahuje nastavenia výkonu, pracovnej verzie a podobne.
Popis jednotlivých nastavení nájdete v nasledujúcej tabuľke.
Nastavenie | Description |
---|---|
Inteligentná optimalizácia priepustnosť | Zadajte hodnotu na optimalizáciu priepustnosť. Môžete si vybrať z nasledovného: • Automatické • Štandardné • Vyvážené • Maximum Ak vyberiete možnosť Automaticky, optimálne nastavenie sa použije dynamicky na základe dvojice zdroja – cieľa a vzoru údajov. Priepustnosť môžete tiež prispôsobiť a vlastná hodnota môže byť 2 – 256, zatiaľ čo vyššia hodnota znamená viac ziskov. |
Stupeň paralelného kopírovania | Zadajte stupeň paralelného spracovávania, ktorý by sa použil pri načítavaní údajov. |
Chybám | Pri výbere tejto možnosti môžete ignorovať niektoré chyby, ktoré sa vyskytli uprostred procesu kopírovania. Napríklad nekompatibilné riadky medzi zdrojom a cieľovím ukladacím priestorom, odstránenie súboru počas premiestňovania údajov atď. |
Povoliť zapisovanie do denníka | Pri výbere tejto možnosti môžete zapisovať do denníka skopírované súbory, vynechané súbory a riadky. |
Povolenie pracovnej verzie | Určte, či sa majú kopírovať údaje cez dočasný ukladací priestor. Umožnenie pracovnej verzie iba pre prospešné scenáre. |
Pripojenie konta pracovnej verzie | Keď vyberiete možnosť Povoliť spájanie, zadajte pripojenie zdroja údajov ukladacieho priestoru služby Azure ako dočasného úložiska. Vyberte položku + Nové a vytvorte fázové pripojenie, ak ho nemáte. |
Konfigurácia parametrov v kopírovanej aktivite
Parametre možno použiť na ovládanie správania kanála a jeho aktivít. Vlastnosť Add dynamic content (Pridať dynamický obsah) môžete použiť na určenie parametrov pre vlastnosti kopírovanej aktivity. Ako príklad uvádzame určenie lakehouse/skladu údajov/databázy KQL.
Vo svojom zdroji alebo cieli vyberte ako typ úložiska údajov pracovný priestor a ako typ úložiska údajov pracovného priestoru zadajte databázu KQL Data Warehouse/Lakehouse/, vyberte položku Pridať dynamický obsah v rozbaľovacom zozname služby Lakehouse alebo Data Warehouse alebo KQL Database.
V kontextovom okne Pridajte tablu s dynamickým obsahom na karte Parametre vyberte položku +.
Zadajte názov parametra a podľa potreby zadajte predvolenú hodnotu, alebo môžete po výbere položky Spustiť v kanáli zadať hodnotu parametra.
Všimnite si, že hodnota parametra by mala byť Lakehouse/Data Warehouse/KQL Database object ID. Ak chcete získať ID objektu Lakehouse,Data Warehouse/KQL Database, v pracovnom priestore otvorte databázu Lakehouse/Data Warehouse/KQL a ID sa nachádza po
/lakehouses/
alebo/datawarehouses/
/databases/
v URL adrese.ID objektu Lakehouse:
ID objektu skladu údajov:
ID objektu databázy KQL:
Výberom položky Uložiť sa vráťte na tablu Pridať dynamický obsah . Potom vyberte parameter, aby sa zobrazoval v poli výrazu. Potom vyberte OK. Vrátite sa na stránku kanála a môžete vidieť, že výraz parametra je zadaný po objekte Lakehouse object ID/object Warehouse ID/KQL Database ID objektu.
Súvisiaci obsah
Pripomienky
https://aka.ms/ContentUserFeedback.
Pripravujeme: V priebehu roka 2024 postupne zrušíme službu Problémy v službe GitHub ako mechanizmus pripomienok týkajúcich sa obsahu a nahradíme ju novým systémom pripomienok. Ďalšie informácie nájdete na stránke:Odoslať a zobraziť pripomienky pre