Share via


Adatok átalakítása Synapse-jegyzetfüzet futtatásával

A KÖVETKEZŐKRE VONATKOZIK: Azure Data Factory Azure Synapse Analytics

Tipp

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésekig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyen!

A folyamat Azure Synapse notebooktevékenysége egy Synapse-jegyzetfüzetet futtat a Azure Synapse Analytics-munkaterületen. Ez a cikk az adatátalakítási tevékenységekről szóló cikkre épül, amely általános áttekintést nyújt az adatátalakításról és a támogatott átalakítási tevékenységekről.

Az Azure Synapse Analytics-jegyzetfüzettevékenységeket közvetlenül a Azure Data Factory Studio felhasználói felületén hozhatja létre. A Synapse-jegyzetfüzetek felhasználói felülettel történő létrehozásának részletes útmutatójáért tekintse meg az alábbiakat.

Jegyzetfüzet-tevékenység hozzáadása a Synapse-hez felhasználói felülettel rendelkező folyamathoz

Ha notebooktevékenységet szeretne használni a Synapse-hez egy folyamatban, hajtsa végre az alábbi lépéseket:

Általános beállítások

  1. Keressen a Jegyzetfüzet kifejezésre a folyamat Tevékenységek paneljén, és húzzon egy Jegyzetfüzet-tevékenységet a Synapse alatt a folyamatvászonra.
  2. Jelölje ki az új jegyzetfüzet-tevékenységet a vásznon, ha még nincs kijelölve.
  3. Az Általános beállítások területen adja meg a name (Név) mintát.
  4. (Beállítás) Leírást is megadhat.
  5. Időtúllépés: Egy tevékenység futtatásának maximális időtartama. Az alapértelmezett érték 12 óra, az engedélyezett maximális idő pedig 7 nap. Formátum: D.HH:MM:SS.
  6. Újrapróbálkozás: Az újrapróbálkozási kísérletek maximális száma.
  7. Újrapróbálkozási időköz (mp): Az egyes újrapróbálkozási kísérletek közötti másodpercek száma.
  8. Biztonságos kimenet: Ha be van jelölve, a tevékenység kimenete nem lesz rögzítve a naplózásban.
  9. Biztonságos bemenet: Az egyes újrapróbálkozási kísérletek közötti másodpercek száma

Azure Synapse Analytics (Összetevők) beállításai

Az Azure Synapse Analytics (Artifacts) lapon válasszon ki vagy hozzon létre egy új Azure Synapse Analytics társított szolgáltatást, amely végrehajtja a notebooktevékenységet.

Képernyőkép egy Jegyzetfüzet-tevékenység társított szolgáltatás lapjára.

Beállítások lap

  1. Válassza ki az új Synapse Notebook-tevékenységet a vásznon, ha még nincs kijelölve.

  2. Válassza a Settings (Beállítások) fület.

  3. Bontsa ki a Jegyzetfüzet listát, és válasszon ki egy meglévő jegyzetfüzetet a csatolt Azure Synapse Analyticsben (Artifacts).

  4. Kattintson a Megnyitás gombra annak a társított szolgáltatásnak a lapjának megnyitásához, ahol a kijelölt jegyzetfüzet található.

Megjegyzés

Ha a társított szolgáltatás munkaterület-erőforrás-azonosítója üres, a Megnyitás gomb le lesz tiltva.

A megnyitott gomb képernyőképe le van tiltva.

  1. Válassza a Beállítások lapot, és válassza ki a jegyzetfüzetet, valamint az opcionális alapparamétereket, hogy átadják a jegyzetfüzetnek.

    Képernyőkép a Jegyzetfüzet-tevékenység Beállítások lapjára.

  2. (Nem kötelező) A Synapse-jegyzetfüzet adatait is kitöltheti. Ha a következő beállítások üresek, a Rendszer magát a Synapse-jegyzetfüzetet fogja használni a futtatáshoz; Ha az alábbi beállítások nem üresek, ezek a beállítások maguk a Synapse-jegyzetfüzet beállításai helyébe lépnek.

    Tulajdonság Leírás
    Spark-készlet Hivatkozás a Spark-készletre. A listából kiválaszthatja az Apache Spark-készletet.
    Végrehajtó mérete A munkamenethez megadott Apache Spark-készletben lefoglalt végrehajtókhoz használandó magok és memória száma. Dinamikus tartalom esetén az érvényes értékek: Small/Medium/Large/XLarge/XXLarge.
    Végrehajtók dinamikus lefoglalása Ez a beállítás a Spark-alkalmazás végrehajtóinak lefoglalásához tartozó Spark-konfiguráció dinamikus kiosztási tulajdonságára van leképeződve.
    Minimális végrehajtók A feladathoz megadott Spark-készletben lefoglalandó végrehajtók minimális száma.
    Végrehajtók maximális mérete A feladathoz megadott Spark-készletben lefoglalandó végrehajtók maximális száma.
    Illesztőprogram mérete A feladathoz megadott Apache Spark-készletben megadott illesztőprogramhoz használandó magok és memória száma.

Azure Synapse Analytics-jegyzetfüzet tevékenységdefiníciója

Íme egy Azure Synapse Analytics-jegyzetfüzettevékenység JSON-mintadefiníciója:

{
    "activities": [
            {
                "name": "demo",
                "description": "description",
                "type": "SynapseNotebook",
                "dependsOn": [],
                "policy": {
                    "timeout": "7.00:00:00",
                    "retry": 0,
                    "retryIntervalInSeconds": 30,
                    "secureOutput": false,
                    "secureInput": false
                },
                "userProperties": [
                    {
                        "name": "testproperties",
                        "value": "test123"
                    }
                ],
                "typeProperties": {
                    "notebook": {
                        "referenceName": {
                            "value": "Notebookname",
                            "type": "Expression"
                        },
                        "type": "NotebookReference"
                    },
                    "parameters": {
                        "test": {
                            "value": "testvalue",
                            "type": "string"
                        }
                    },
                    "snapshot": true,
                    "sparkPool": {
                        "referenceName": {
                            "value": "SampleSpark",
                            "type": "Expression"
                        },
                        "type": "BigDataPoolReference"
                    }
                },
                "linkedServiceName": {
                    "referenceName": "AzureSynapseArtifacts1",
                    "type": "LinkedServiceReference"
                }
            }
        ]
    }

Azure Synapse Analytics-jegyzetfüzet tevékenységtulajdonságai

Az alábbi táblázat a JSON-definícióban használt JSON-tulajdonságokat ismerteti:

Tulajdonság Leírás Kötelező
name A folyamatban lévő tevékenység neve. Igen
leírás A tevékenység tevékenységeit leíró szöveg. Nem
típus Az Azure Synapse Analytics-jegyzetfüzettevékenység esetében a tevékenység típusa SynapseNotebook. Igen
jegyzetfüzet A Azure Synapse Analyticsben futtatandó jegyzetfüzet neve. Igen
sparkPool Az Azure Synapse Analytics-jegyzetfüzet futtatásához szükséges Spark-készlet. Nem
parameter A Azure Synapse Analytics-jegyzetfüzet futtatásához szükséges paraméter. További információ: Adatok átalakítása Synapse-jegyzetfüzet futtatásával Nem

Paramétercella kijelölése

Azure Data Factory megkeresi a paraméterek celláját, és a végrehajtási időpontban átadott paraméterek alapértelmezett értékeit használja. A végrehajtási motor egy új cellát ad hozzá a paramétercella alá bemeneti paraméterekkel az alapértelmezett értékek felülírásához. Az Adatok átalakítása Synapse-jegyzetfüzet futtatásával című témakörben olvashat.

A Synapse-jegyzetfüzet kimeneti értékének olvasása

A jegyzetfüzet cellakimeneti értékét a tevékenységben olvashatja, ehhez a panelhez az Adatok átalakítása Synapse-jegyzetfüzet futtatásával című témakörben olvashat.

Másik Synapse-jegyzetfüzet futtatása

A Synapse-jegyzetfüzetek tevékenységeiben más jegyzetfüzetekre is hivatkozhat a %run magic vagy az mssparkutils notebook segédprogram meghívásával. Mindkettő támogatja a beágyazott függvényhívásokat. A forgatókönyv alapján megfontolandó két módszer fő különbségei a következők:

  • %run magic a hivatkozott jegyzetfüzet összes celláját átmásolja a %run cellába, és megosztja a változókörnyezetet. Ha a notebook1 a notebook2-ra hivatkozik a-on keresztül %run notebook2 , és a notebook2 meghív egy mssparkutils.notebook.exit függvényt, a jegyzetfüzet1 celláinak végrehajtása leáll. Azt javasoljuk, hogy a %run magic parancsot használja, ha jegyzetfüzetfájlt szeretne "belefoglalni".
  • Az mssparkutils notebook segédprogramja metódusként vagy függvényként hívja meg a hivatkozott jegyzetfüzetet. A változókörnyezet nincs megosztva. Ha a notebook1 a notebook2-ra hivatkozik a-on keresztül mssparkutils.notebook.run("notebook2") , és a notebook2 meghív egy mssparkutils.notebook.exit függvényt, a notebook1 celláinak végrehajtása folytatódik. Azt javasoljuk, hogy akkor használja az mssparkutils notebook segédprogramokat, ha "importálni" szeretne egy jegyzetfüzetet.

Lásd: Azure Synapse Analytics-jegyzetfüzet tevékenységfuttatási előzményei

Lépjen a Monitorozás lap Folyamatfuttatások elemére, és láthatja az aktivált folyamatot. Nyissa meg a jegyzetfüzettevékenységet tartalmazó folyamatot a futtatási előzmények megtekintéséhez.

Képernyőkép egy jegyzetfüzet-tevékenység bemenetéről és kimenetéről.

A jegyzetfüzet-pillanatkép megnyitása esetén ez a funkció jelenleg nem támogatott.

A jegyzetfüzet-tevékenység bemenetét vagy kimenetét a bemenet vagy a Kimenet gombra kattintva tekintheti meg. Ha a folyamat felhasználói hibával meghiúsult, válassza ki a kimenetet az eredménymező ellenőrzéséhez a felhasználói hiba részletes visszakövetkeztetése megtekintéséhez.

Képernyőkép a notebooktevékenység kimeneti felhasználói hibájáról.