Azure Data Lake Analytics migrálása a Azure Synapse Analyticsbe

Az Azure Data Lake Analytics 2024. február 29-én megszűnik. További információ ezzel a bejelentéssel.

Ha már használja az Azure Data Lake Analytics, létrehozhat egy migrálási tervet, amely Azure Synapse Analyticset a szervezet számára.

A Microsoft elindította a Azure Synapse Analyticset, amelynek célja, hogy a data lake-eket és az adattárházat is összehozza egy egyedi big data-elemzési élmény érdekében. Segít összegyűjteni és elemezni az adatokat az adathiány megoldása érdekében, és segít a csapatoknak a közös munkában. Emellett a Synapse és az Azure Machine Learning és a Power BI integrációja lehetővé teszi a szervezetek számára, hogy betekintést nyerjenek az adataikból, és gépi tanulást hajtsanak végre az összes intelligens alkalmazásba.

A dokumentum bemutatja, hogyan hajthatja végre a migrálást az Azure Data Lake Analytics-ból a Azure Synapse Analyticsbe.

  • 1. lépés: Felkészültség felmérése
  • 2. lépés: Felkészülés a migrálásra
  • 3. lépés: Adatok és alkalmazásterhelések migrálása
  • 4. lépés: Átállás az Azure Data Lake Analytics-ról a Azure Synapse Analyticsre

1. lépés: Felkészültség felmérése

  1. Tekintse meg az Apache Sparkot a Azure Synapse Analyticsben, és ismerje meg az Azure Data Lake Analytics és a Spark főbb különbségeit az Azure Synapse Analyticsben.

    Elem Azure Data Lake Analytics Spark a Synapse-on
    Díjszabás Elemzési egység óránként Virtuális magonkénti óra
    Motor Azure Data Lake Analytics Apache Spark
    Alapértelmezett programnyelv U-SQL T-SQL, Python, Scala, Spark SQL és .NET
    Adatforrások Azure Data Lake Storage Azure Blob Storage, Azure Data Lake Storage
  2. Tekintse át a migrálási felméréshez készült kérdőívet , és sorolja fel azokat a lehetséges kockázatokat, amelyeket figyelembe kell vennie.

2. lépés: Felkészülés a migrálásra

  1. Azonosítsa a migrálni kívánt feladatokat és adatokat.

    • Használja ki ezt a lehetőséget, hogy megtisztítsa azokat a feladatokat, amelyeket már nem használ. Hacsak nem tervezi az összes feladat egyszerre történő migrálását, ez az idő alatt azonosíthatja a fázisokban migrálható feladatok logikai csoportjait.
    • Értékelje ki az adatok méretét, és ismerje meg az Apache Spark adatformátumát. Tekintse át az U-SQL-szkripteket, értékelje ki a szkriptek újraírási erőfeszítéseit, és ismerje meg az Apache Spark-kód fogalmát.
  2. Határozza meg, hogy a migrálás milyen hatással lesz a vállalatra. Például azt, hogy megengedhet-e magának állásidőt a migrálás során.

  3. Hozzon létre egy migrálási tervet.

3. lépés: Adatok és alkalmazásterhelés migrálása

  1. Migrálja az adatokat Azure Data Lake Storage Gen1-ből Azure Data Lake Storage Gen2.

    Azure Data Lake Storage Gen1 kivonása 2024 februárjában lesz, lásd a hivatalos bejelentést. Javasoljuk, hogy először is migrálja az adatokat a Gen2-be. Lásd: Az Azure Data Lake Analytics U-SQL-fejlesztők Apache Spark-adatformátumainak ismertetése, valamint a fájl és az U-SQL-táblákban tárolt adatok áthelyezése az Azure Synapse Analytics számára való elérhetővé tételéhez. A migrálási útmutató további részletei itt találhatók.

  2. Alakítsa át az U-SQL-szkripteket Sparkra. Tekintse meg az Azure Data Lake Analytics U-SQL-fejlesztők Apache Spark-kódfogalmainak ismertetése című témakört, amely az U-SQL-szkriptek Sparkra való átalakítását ismerteti.

  3. Alakítsa át vagy hozza létre újra a feladat-vezénylési folyamatokat az új Spark-programba.

4. lépés: Átvágás az Azure Data Lake Analytics-ról a Azure Synapse Analyticsre

Miután biztos abban, hogy alkalmazásai és számítási feladatai stabilak, megkezdheti az Azure Synapse Analytics használatát az üzleti forgatókönyvek kielégítéséhez. Kapcsolja ki az Azure-Data Lake Analytics futó többi folyamatot, és vonja ki az Azure Data Lake Analytics-fiókokat.

Migrálási felmérés kérdőíve

Kategória Kérdések Referencia
A migrálás méretének kiértékelése Hány Azure-Data Lake Analytics-fiókja van? Hány folyamat van használatban? Hány U-SQL-szkript van használatban? Minél több adatot és szkriptet kell migrálni, annál több UDO/UDF van használatban a szkriptekben, annál nehezebb a migrálás. A migráláshoz szükséges időt és erőforrásokat a projekt méretének megfelelően kell megtervezni.
Adatforrás Mekkora az adatforrás mérete? Milyen típusú adatformátumot kell feldolgozni? Az Azure Data Lake Analytics U-SQL-fejlesztők Apache Spark-adatformátumainak ismertetése
Adatkimenet Megtartja a kimeneti adatokat későbbi használatra? Ha a kimeneti adatokat U-SQL-táblákba menti a rendszer, hogyan kezelheti azokat? Ha a kimeneti adatokat gyakran használják és U-SQL-táblákba menti, módosítania kell a szkripteket, és a kimeneti adatokat Spark által támogatott adatformátumra kell módosítania.
Adatok migrálása Elkészítette a tárolási migrálási tervet? Azure Data Lake Storage migrálása Gen1-ről Gen2-be
U-SQL-szkriptek átalakítása Használja az UDO/UDF -t (.NET, python stb.)? Ha a fenti válasz igen, melyik nyelvet használja az UDO-ban/UDF-ben, és az átalakítás során felmerülő problémákat? Az összevont lekérdezést használja az U-SQL? Az Azure Data Lake Analytics U-SQL-fejlesztők Apache Spark-kódfogalmainak ismertetése

Következő lépések