Megosztás a következőn keresztül:


Rövid útmutató: Adatok átalakítása Apache Spark-feladatdefinícióval

Ebben a rövid útmutatóban a Azure Synapse Analytics használatával fog létrehozni egy folyamatot az Apache Spark-feladatdefiníció használatával.

Előfeltételek

A Azure Synapse munkaterület létrehozása után kétféleképpen nyithatja meg a Synapse Studio:

  • Nyissa meg a Synapse-munkaterületet a Azure Portal. A Megnyitás Synapse Studio kártyán az Első lépések csoportban válassza a Megnyitás lehetőséget.
  • Nyissa meg Azure Synapse Analyticset, és jelentkezzen be a munkaterületre.

Ebben a rövid útmutatóban a "sampletest" nevű munkaterületet használjuk példaként. Automatikusan a Synapse Studio kezdőlapjára navigál.

Synapse Studio kezdőlapja

Folyamat létrehozása Apache Spark-feladatdefinícióval

A folyamatok a tevékenységek egy csoportjának végrehajtásához szükséges logikai folyamatot tartalmazzák. Ebben a szakaszban egy Apache Spark-feladatdefiníciós tevékenységet tartalmazó folyamatot fog létrehozni.

  1. Lépjen az Integrálás lapra. Válassza a folyamatfejléc melletti plusz ikont, és válassza a Folyamat lehetőséget.

    Új folyamat létrehozása

  2. A folyamat Tulajdonságok beállításai lapján adja meg a név bemutatóját.

  3. A Tevékenységek panel Synapse területén húzza a Spark-feladatdefiníciót a folyamatvászonra.

    spark-feladat definíciójának húzása

Apache Spark-feladatdefiníciós vászon beállítása

Miután létrehozta az Apache Spark-feladatdefiníciót, a rendszer automatikusan elküldi a Spark-feladatdefiníció vásznára.

Általános beállítások

  1. Válassza ki a spark-feladat definíciós modulját a vásznon.

  2. Az Általános lapon adja meg a név mintáját.

  3. (Beállítás) Leírást is megadhat.

  4. Időtúllépés: A tevékenységek futtatásának maximális időtartama. Az alapértelmezett érték hét nap, ami egyben az engedélyezett maximális időmennyiség is. Formátum: D.HH:MM:SS.

  5. Újrapróbálkozás: Az újrapróbálkozási kísérletek maximális száma.

  6. Újrapróbálkozási időköz: Az egyes újrapróbálkozási kísérletek közötti másodpercek száma.

  7. Biztonságos kimenet: Ha be van jelölve, a tevékenység kimenete nem lesz rögzítve a naplózásban.

  8. Biztonságos bemenet: Ha be van jelölve, a tevékenységből származó bemenet nem lesz rögzítve a naplózásban.

    spark-feladat definíciója – általános

Beállítások lap

Ezen a panelen hivatkozhat a futtatandó Spark-feladatdefinícióra.

  • Bontsa ki a Spark-feladatdefiníciók listáját, és válasszon ki egy meglévő Apache Spark-feladatdefiníciót. Új Apache Spark-feladatdefiníciót is létrehozhat, ha az Új gombra kattint, és hivatkozik a futtatni kívánt Spark-feladatdefinícióra.

  • (Nem kötelező) Az Apache Spark-feladatdefinícióval kapcsolatos információkat is kitöltheti. Ha a következő beállítások üresek, a spark-feladat definíciójának beállításai lesznek használva a futtatáshoz; Ha a következő beállítások nem üresek, ezek a beállítások maguk a Spark-feladatdefiníció beállításait cserélik le.

    Tulajdonság Leírás
    Fő definíciós fájl A feladathoz használt fő fájl. Válasszon ki egy PY/JAR/ZIP fájlt a tárolóból. A Fájl feltöltése lehetőséget választva feltöltheti a fájlt egy tárfiókba.
    Minta: abfss://…/path/to/wordcount.jar
    Almappákból származó hivatkozások A fő definíciós fájl gyökérmappájából beolvasva ezek a fájlok referenciafájlokként lesznek hozzáadva. A "jars", "pyFiles", "files" vagy "archives" nevű mappák be lesznek vizsgálva, és a mappák neve megkülönbözteti a kis- és nagybetűket.
    Főosztály neve A teljes azonosító vagy a fő definíciós fájlban található főosztály.
    Minta: WordCount
    Parancssori argumentumok Parancssori argumentumokat az Új gombra kattintva adhat hozzá. Meg kell jegyezni, hogy a parancssori argumentumok hozzáadása felülbírálja a Spark-feladatdefiníció által definiált parancssori argumentumokat.
    Minta: abfss://…/path/to/shakespeare.txtabfss://…/path/to/result
    Apache Spark-készlet A listából kiválaszthatja az Apache Spark-készletet.
    Python-kódhivatkozás További Python-kódfájlok, amelyeket referenciaként használnak a fő definíciós fájlban.
    Támogatja a fájlok (.py, .py3, .zip) "pyFiles" tulajdonságba való továbbítását. Felülbírálja a Spark-feladatdefinícióban definiált "pyFiles" tulajdonságot.
    Referenciafájlok További fájlok a fő definíciós fájlban való hivatkozáshoz.
    Végrehajtók dinamikus lefoglalása Ez a beállítás a Spark-konfiguráció Spark-alkalmazás-végrehajtók foglalásának dinamikus foglalási tulajdonságára képez le leképezést.
    Minimális végrehajtók A feladathoz a megadott Spark-készletben lefoglalandó végrehajtók minimális száma.
    Végrehajtók maximális mérete A feladathoz megadott Spark-készletben lefoglalandó végrehajtók maximális száma.
    Illesztőprogram mérete A feladathoz megadott Apache Spark-készletben megadott illesztőprogramhoz használandó magok és memória száma.
    Spark-konfiguráció Adja meg a Spark konfigurációs tulajdonságainak értékeit a következő témakörben: Spark-konfiguráció – Alkalmazástulajdonságok. A felhasználók használhatják az alapértelmezett konfigurációt és a testre szabott konfigurációt.

    spark-feladat definíciójának pipline-beállításai

  • Dinamikus tartalmak hozzáadásához kattintson a Dinamikus tartalom hozzáadása gombra, vagy nyomja le az Alt+Shift+D billentyűparancsot. A Dinamikus tartalom hozzáadása lapon a kifejezések, függvények és rendszerváltozók bármilyen kombinációját használhatja a dinamikus tartalomhoz való hozzáadáshoz.

    dinamikus tartalom hozzáadása

Felhasználói tulajdonságok lap

Ebben a panelen tulajdonságokat adhat hozzá az Apache Spark-feladatdefiníciós tevékenységhez.

felhasználói tulajdonságok

Következő lépések

A Azure Synapse Analytics támogatásával kapcsolatos további információkért tekintse meg az alábbi cikkeket: