Excel fájlformátum formátuma Azure Data Factory és Azure Synapse Analytics

A KÖVETKEZŐKRE VONATKOZIK: Azure Data Factory Azure Synapse Analytics

Kövesse ezt a cikket, ha a fájlban található Excel szeretné. A szolgáltatás a ".xls" és a ".xlsx" .xlsx.

Excel formátum a következő összekötőkhöz támogatott: Amazon S3,Amazon S3 Compatible Storage,Azure Blob,Azure Data Lake Storage Gen1,Azure Data Lake Storage Gen2, Azure Files,fájlrendszer, FTP, Google Cloud Storage,HDFS,HTTP, Oracle Cloud Storageés SFTP. Forrásként támogatott, de nem fogadóként.

Megjegyzés

A ".xls" formátum http használata esetén nem támogatott.

Adatkészlet tulajdonságai

Az adatkészletek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját az Adatkészletek cikkben olvashatja el. Ez a szakasz az adatkészlet által támogatott Excel listáját tartalmazza.

Tulajdonság Leírás Kötelező
típus Az adatkészlet type (típus) tulajdonságát a következőre kell Excel. Yes
location A fájl(nak) helybeállítása. Minden fájlalapú összekötő saját helytípussal és a alatt támogatott tulajdonságokkal location rendelkezik. Yes
sheetName (munkalap neve) Az Excel a munkalap nevét az adatok olvasása érdekében. Adja meg sheetName a következőt: vagy sheetIndex
sheetIndex (munkalapindex) A Excel 0-tól kezdődően az adatok beolvassa a munkalap indexét. Adja meg sheetName a következőt: vagy sheetIndex
Tartomány Az adott munkalap cellatartománya a szelektív adatok megkereséhez, például:
- Nincs megadva: a teljes munkalapot táblaként olvassa be az első nem üres sorból és oszlopból
- A3: beolvas egy táblát az adott cellából, dinamikusan észleli az alábbi sorokat és a jobb oldalon található összes oszlopot
- A3:H5: ezt a rögzített tartományt táblaként olvassa be
- A3:A3: beolvassa ezt az egyetlen cellát
No
firstRowAsHeader Meghatározza, hogy a megadott munkalap/tartomány első sorát oszlopneveket tartalmazó fejlécsorként kezelje-e.
Az engedélyezett értékek true (igaz) ésfalse (hamis) (alapértelmezett).
No
nullValue A null érték sztringes ábrázolását adja meg.
Az alapértelmezett érték egy üres sztring.
No
tömörítés A fájltömörítés konfigurálni kívánt tulajdonságok csoportja. Akkor konfigurálja ezt a szakaszt, ha a tevékenység végrehajtása során tömörítést/kifejtést szeretne. No
típus
( a alatt )
A JSON-fájlok olvasása/írása során használt tömörítési kodek.
Megengedett értékek: bzip2,gzip,deflate, ZipDeflate,TarGzip,Tar,snappy, vagy lz4. Az alapértelmezett érték nem tömörített.
Vegye figyelembe Copy tevékenység hogy a Copy tevékenység nem támogatja a "snappy" "lz4"-et, a leképezési adatfolyam pedig nem támogatja a "ZipDeflate", a "TarGzip" és a "Tar" adatfolyamot.
Vegye figyelembe, hogy amikor másolási tevékenységgel bontja ki a ZipDeflate-fájlokat, és fájlalapú fogadóadattárba ír, a rendszer a következő mappába bontja ki a fájlokat: .
Nem.
szint
( a alatt )
A tömörítési arány.
Az engedélyezett értékek az Optimális vagy a Leggyorsabb.
- - A tömörítési műveletnek a lehető leggyorsabban be kell fejeződni, még akkor is, ha az eredményül kapott fájl nincs optimálisan tömörítve.
- - A tömörítési műveletnek optimálisan tömörítve kell lennie, még akkor is, ha a művelet hosszabb ideig tart. További információkért lásd a Tömörítési szint témakört.
No

Az alábbiakban egy példát mutatunk be Excel Azure Blob-adatkészleten Storage:

{
    "name": "ExcelDataset",
    "properties": {
        "type": "Excel",
        "linkedServiceName": {
            "referenceName": "<Azure Blob Storage linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [ < physical schema, optional, retrievable during authoring > ],
        "typeProperties": {
            "location": {
                "type": "AzureBlobStorageLocation",
                "container": "containername",
                "folderPath": "folder/subfolder",
            },
            "sheetName": "MyWorksheet",
            "range": "A3:H5",
            "firstRowAsHeader": true
        }
    }
}

Másolási tevékenység tulajdonságai

A tevékenységek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját a Folyamatok cikkben olvashatja el. Ez a szakasz a forrás által támogatott Excel listáját tartalmazza.

Excel forrásként

A másolási tevékenység *forrás* szakaszában a következő tulajdonságok támogatottak.

Tulajdonság Leírás Kötelező
típus A másolási tevékenység forrásának type (típus) tulajdonságát ExcelSource (ExcelSource) értékre kell állítani. Yes
storeSettings Tulajdonságok csoportja arra, hogyan lehet adatokat beolvasni egy adattárból. Minden fájlalapú összekötő saját támogatott olvasási beállításokkal rendelkezik a storeSettings alatt. No
"activities": [
    {
        "name": "CopyFromExcel",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "ExcelSource",
                "storeSettings": {
                    "type": "AzureBlobStorageReadSettings",
                    "recursive": true
                }
            },
            ...
        }
        ...
    }
]

Adatfolyam-tulajdonságok leképezése

A leképezési adatfolyamokban a következő adattárakban olvashatja Excel formátumot: Azure Blob Storage,Azure Data Lake Storage Gen1,Azure Data Lake Storage Gen2és Amazon S3. A fájlokra Excel mutathat egy Excel vagy beágyazott adatkészlet használatával.

Forrástulajdonságok

Az alábbi táblázat a forrás által támogatott Excel sorolja fel. Ezeket a tulajdonságokat a Forrásbeállítások lapon szerkesztheti. Beágyazott adatkészlet használata esetén további fájlbeállításokat láthat, amelyek ugyanazok, mint az adatkészlet tulajdonságai szakaszban leírt tulajdonságok.

Név Leírás Kötelező Megengedett értékek Adatfolyam-szkript tulajdonság
Helyettesítő elérési utak A helyettesítő karakteres elérési úttal egyező összes fájl fel lesz feldolgozva. Felülbírálja az adatkészletben beállított mappát és elérési utat. nem Sztring[] helyettesítőpaths (helyettesítő karakterek)
Partíció gyökérútvonala Particionált fájladatokhoz megadhatja a partíció gyökérútvonalát, hogy a particionált mappákat oszlopként olvassa be nem Sztring partitionRootPath
Fájlok listája Azt határozza meg, hogy a forrás egy feldolgozni kívánt fájlokat felsoroló szövegfájlra mutasson-e nem true vagy false Filelist
A fájlnév tárolására kívánt oszlop Új oszlop létrehozása a forrásfájl nevével és elérési útával nem Sztring rowUrlColumn
A befejezés után Törölje vagy helyezze át a fájlokat a feldolgozás után. A fájl elérési útja a tároló gyökerében kezdődik nem Törlés: true vagy false
Mozgatni: ['<from>', '<to>']
purgeFiles
moveFiles
Szűrés az utolsó módosítás alapján A fájlok szűrése a legutóbbi módosított adatok alapján nem Időbélyeg modifiedAfter (módosítás után)
modifiedBefore
Nem található fájl engedélyezése Ha igaz, a rendszer nem ad vissza hibát, ha nem található fájl nem true vagy false ignoreNoFilesFound

Példa forrásra

Az alábbi kép egy példa az adatfolyamok Excel módú leképezési forráskonfigurációra.

Excel forrás

A kapcsolódó adatfolyam-szkript a következő:

source(allowSchemaDrift: true,
    validateSchema: false,
    wildcardPaths:['*.xls']) ~> ExcelSource

Beágyazott adatkészlet használata esetén a következő forrásbeállításokat láthatja az adatfolyam leképezésében.

Excel beágyazott adatkészlet

A kapcsolódó adatfolyam-szkript a következő:

source(allowSchemaDrift: true,
    validateSchema: false,
    format: 'excel',
    fileSystem: 'container',
    folderPath: 'path',
    fileName: 'sample.xls',
    sheetName: 'worksheet',
    firstRowAsHeader: true) ~> ExcelSourceInlineDataset

Következő lépések