Kombinovanie súborov CSV

V doplnku Power Query môžete kombinovať viacero súborov z daného zdroja údajov. Tento článok popisuje, ako funguje prostredie, keď súbory, ktoré chcete skombinovať, sú súbory CSV. Ďalšie informácie: Kombinovanie prehľadu súborov

Tip

Spolu s týmto príkladom môžete sledovať stiahnutím vzorových súborov použitých v tomto článku z tohto odkazu na stiahnutie. Tieto súbory môžete umiestniť do zdroja údajov podľa vášho výberu, napríklad lokálneho priečinka, SharePoint priečinka, ukladacieho priestoru Azure Blob, ukladacieho priestoru Azure Data Lake alebo iného zdroja údajov, ktorý poskytuje zobrazenie systému súborov.

Pre zjednodušenie príklad v tomto článku používa konektor Priečinok. Ďalšie informácie: Priečinok

O použitých vzorových súboroch

Ak chcete kombinovať súbory, je nevyhnutné, aby všetky mali rovnakú štruktúru a rovnaké rozšírenie. Všetky súbory použité v tomto príklade majú rovnakú štruktúru a príponu (.csv).

K dispozícii je 12 súborov CSV, jeden za každý mesiac kalendárneho roka 2019. Nasledujúci obrázok zobrazuje prvých 15 riadkov súboru za mesiac január.

Vzorový súbor CSV za január 2019 zobrazujúci sekciu hlavičky a ostatné údaje, všetky oddelené čiarkami.

Počet riadkov sa líši od súboru k súboru, ale všetky súbory majú v prvých štyroch riadkoch sekciu hlavičky. Majú hlavičky stĺpcov v piatom riadku a údaje pre tabuľku začínajú v šiestom riadku a pokračujú vo všetkých nasledujúcich riadkoch.

Cieľom je spojiť všetkých 12 súborov do jednej tabuľky. Táto kombinovaná tabuľka obsahuje riadok hlavičky v hornej časti tabuľky a obsahuje zdrojový názov, dátum, krajinu, jednotky a údaje výnosov za celý rok v samostatných stĺpcoch za riadkom hlavičky.

Vzor konečnej kombinovanej tabuľky.

Ukážka tabuľky

Pri pripájaní k priečinku, v ktorom sa hosťujú súbory, ktoré chcete — v tomto príklade kombinovať, názov tohto priečinka je CSV Súbory, ktorému sa zobrazí dialógové okno — ukážka tabuľky, ktoré zobrazuje cestu k priečinku v ľavom hornom rohu. Ukážka údajov zobrazuje zobrazenie systému súborov.

Ukážka tabuľky pre zobrazenie systému súborov.

V tomto príklade vyberte položku Kombinovať.

Poznámka

V inej situácii môžete vybrať položku Transformovať údaje na ďalšie filtrovanie a transformáciu údajov pred kombináciou súborov. Výber možnosti Kombinovať sa odporúča len vtedy, ak si ste istí, že priečinok obsahuje iba súbory, ktoré chcete skombinovať.

Dialógové okno Kombinovanie súborov

Po výbere možnosti Kombinovať v ukážke tabuľky sa zobrazí dialógové okno Kombinovať súbory.

Dialógové okno Kombinovať súbory.

Poznámka

Power Query automaticky zistí, aký konektor sa má použiť na základe prvého súboru nájdeného v zozname. Ďalšie informácie o konektore CSV nájdete v téme Text/CSV.

V tomto príklade ponechajte všetky predvolené nastavenia (Príklad súboru nastaveného na prvý súbor a predvolené hodnoty pre pôvod súboru, oddeľovač a detekciu typu údajov).

Teraz vyberte položku Transformovať údaje v pravom dolnom rohu a prejdite na výstupný dotaz.

Výstupný dotaz

Po výbere položky Transformovať údaje v dialógovom okne Kombinovať súbory sa v dotaze, ktorý ste pôvodne vytvorili z pripojenia k lokálnemu priečinku, vrátite späť do editora power query. Výstupný dotaz teraz obsahuje názov zdrojového súboru v stĺpci najviac vľavo spolu s údajmi z každého zdrojového súboru v zostávajúcich stĺpcoch.

Výstupný dotaz pre kombinované súbory bez ďalších transformácií.

Údaje však nie sú v správnom tvare. Pred ich kombináciou musíte odstrániť prvé štyri riadky z každého súboru. Ak chcete vykonať túto zmenu v každom súbore pred ich skombinom, vyberte dotaz na súbor Transformovať vzor na table Dotazy na ľavej strane obrazovky.

Úprava dotazu transformovať vzorový súbor

V tomto dotaze na súbor Transform sample hodnoty v stĺpci Dátum označujú, že údaje sú za mesiac apríl, ktorý má formát YYYY-MM-DD. Apríl 2019.csv je prvý súbor, ktorý sa zobrazí v ukážke tabuľky.

Tabuľka zobrazujúca stĺpce údajov z apríla 2019 vrátane sekcie hlavičky v prvých štyroch riadkoch a nadpisov v piatom riadku.

Teraz musíte použiť novú množinu transformácií na čistenie údajov. Každá transformácia sa automaticky skonvertuje na funkciu v skupine dotazov Pomocníka, ktorá sa pred kombináciou údajov z každého súboru použije na každý súbor v priečinku.

Transformácie, ktoré je potrebné pridať do dotazu na súbor Transformovať vzorku, sú:

  1. Odstránenie horných riadkov: Ak chcete vykonať túto operáciu, vyberte ponuku ikon tabuľky v ľavom hornom rohu tabuľky a potom vyberte položku Odstrániť horné riadky.

    Odstráňte horné riadky v ponuke tabuľky.

    V dialógovom okne Odstrániť horné riadky zadajte 4 a potom vyberte tlačidlo OK.

    Dialógové okno Odstránenie horných riadkov.

    Po výbere možnosti OK už tabuľka nebude mať prvé štyri riadky.

    Vzorový dotaz s odstránenými riadkami.

  2. Použitie prvého riadka ako hlavičiek: Znova vyberte ikonu tabuľky a potom vyberte položku Použiť prvý riadok ako hlavičky.

    Ako ikonu hlavičiek použite prvý riadok.

    Výsledok tejto operácie povýši prvý riadok tabuľky na hlavičky nového stĺpca.

    Vzorová tabuľka propagovaná hlavičky.

Po dokončení tejto operácie sa power query predvolene pokúsi automaticky zistiť typy údajov stĺpcov a pridať nový krok zmeneného typu stĺpca.

Revízia výstupného dotazu

Keď sa vrátite k dotazu CSV Files, všimnete si, že posledným krokom je chyba s textom "Stĺpec "Stĺpec 1" tabuľky sa nenašiel. Dôvodom tejto chyby je, že predchádzajúci stav dotazu vykonával operáciu proti stĺpcu s názvom Stĺpec1. Ale z dôvodu zmien vykonaných v dotaze na súbor Transform Sample tento stĺpec už neexistuje. Ďalšie informácie: Riešenie chýb v doplnku Power Query

Výstupný dotaz s chybou na úrovni kroku.

Tento posledný krok dotazu môžete odstrániť z tably Použité kroky výberom ikony odstránenia X na ľavej strane názvu kroku. Po odstránení tohto kroku sa v dotaze zobrazia správne výsledky.

Skombinujte súbory bez chyby.

Všimnite si však, že žiadny zo stĺpcov odvodených zo súborov (dátum, krajina, jednotky, výnosy) im nepriradil konkrétny typ údajov. Priraďte správny typ údajov ku každému stĺpcu pomocou nasledujúcej tabuľky.

Názov stĺpca Typ údajov
Dátum Dátum
Krajina Text
Lekcie Celé číslo
Výnosy Mena

Po definovaní typov údajov pre každý stĺpec budete pripravení na načítanie tabuľky.

Vzor konečnej kombinovanej tabuľky.

Poznámka

Informácie o definovaní alebo zmene typov údajov stĺpcov nájdete v téme Typy údajov.

Overenie

Ak chcete overiť, či boli všetky súbory skombinované, môžete vybrať ikonu filtra v záhlaví stĺpca Source.Name, ktorá zobrazí všetky názvy súborov, ktoré boli skombinované. Ak sa zobrazí upozornenie "Zoznam môže byť neúplný", výberom položky Načítať viac v dolnej časti ponuky zobrazíte v stĺpci viac dostupných hodnôt.

Neúplný zoznam súborov, ktoré boli skombinované.

Po výbere položky Načítať viac sa zobrazia všetky dostupné názvy súborov.

Úplný zoznam súborov, ktoré boli skombinované.