Oktatóanyag: Adatok másolása Blob Storage-SQL Database a Data Factory

Megjegyzés

Ez a cikk a Data Factory 1-es verziójára vonatkozik. Ha a Data Factory szolgáltatás aktuális verzióját használja, tekintse meg a másolási tevékenység oktatóanyagát.

Ebben az oktatóanyagban egy adat-előállítót hoz létre egy folyamat segítségével, amely adatokat másol a Blob Storage-ból a SQL Database.

A másolási tevékenység végzi az adattovábbítást az Azure Data Factoryban. Egy olyan, globálisan elérhető szolgáltatás működteti, amely biztonságos, megbízható és méretezhető módon másolja át az adatokat a különböző adattárak között. A Másolás tevékenységgel kapcsolatos részletekért tekintse meg a Data Movement Activities (Adattovábbítási tevékenységek) című cikket.

Megjegyzés

A szolgáltatás részletes áttekintését Data Factory a Bevezetés a Azure Data Factory cikkbe.

Az oktatóanyag előfeltételei

Az oktatóanyag megkezdéséhez a következő előfeltételeknek kell megfelelnie:

  • Azure-előfizetés. Ha nem rendelkezik előfizetéssel, mindössze néhány perc alatt létrehozhat egy ingyenes próbafiókot. További részletekért tekintse meg az ingyenes próbaverziót tartalmazó cikket.
  • Azure Storage-fiók. Ebben az oktatóanyagban a blobtárolót használjuk forrásadattárként. Ha még nem áll rendelkezésre Azure Storage-fiók, a létrehozás lépéseit a Tárfiók létrehozása cikkben talál.
  • Azure SQL Database:. Ebben az oktatóanyagban Azure SQL Database a tárolót céladattárként. Ha nincs adatbázisa a Azure SQL Database, az oktatóanyagban lásd: Adatbázis létrehozása és konfigurálása a Azure SQL Database egy ilyen adatbázis létrehozásához.
  • SQL Server 2012/2014 vagy Visual Studio 2013. A SQL Server Management Studio vagy Visual Studio létrehozhat egy mintaadatbázist, és megtekintheti az eredményadatokat az adatbázisban.

Blob Storage-fiók nevének és kulcsának gyűjtése

Ehhez az oktatóanyaghoz szüksége lesz az Azure Storage-fiók fióknevére és fiókkulcsjára. Jegyezze fel az Azure Storage-fiók fióknevét és fiókkulcsát.

  1. Jelentkezzen be az Azure Portal.

  2. Kattintson a Minden szolgáltatás elemre a bal oldali menüben, és válassza a Storage lehetőséget.

    Tallózás – Storage fiókok

  3. A Storage panelen válassza ki az oktatóanyagban használni kívánt Azure Storage-fiókot.

  4. Válassza az Access keys (Hozzáférési kulcsok) hivatkozást a SETTINGS (BEÁLLÍTÁSOK) alatt.

  5. Kattintson a fióknév szövegmező melletti másolás (kép) Storage gombra, és mentse/illessze be valahová (például egy szövegfájlba).

  6. Ismételje meg az előző lépést a key1 másolásához vagy megjegyzéshez.

    Storage hozzáférési kulcs

  7. Zárja be az összes panelt az X gombra kattintva.

A SQL, adatbázis és felhasználónevek gyűjtése

Ehhez az oktatóanyaghoz szüksége lesz SQL kiszolgáló, adatbázis és felhasználó nevére. Jegyezze fel a kiszolgáló, az adatbázis és a felhasználó nevét a Azure SQL Database.

  1. A Azure Portal kattintson a Minden szolgáltatás elemre a bal oldalon, és válassza a SQL lehetőséget.
  2. A SQL adatbázisok panelen válassza ki az oktatóanyagban használni kívánt adatbázist. Jegyezze fel az adatbázis nevét.
  3. Az adatbázis SQL panelen kattintson a BEÁLLÍTÁSOK alatt a Tulajdonságok elemre.
  4. Jegyezze fel a SERVER NAME (KISZOLGÁLÓNÉV) és a SERVER ADMIN LOGIN (KISZOLGÁLÓ-RENDSZERGAZDAI BEJELENTKEZÉS) értékét.
  5. Zárja be az összes panelt az X gombra kattintva.

Azure-szolgáltatások hozzáférésének engedélyezése SQL kiszolgálóhoz

Győződjön meg arról, hogy az Azure-szolgáltatásokhoz való hozzáférés engedélyezése beállítás be van kapcsolva a kiszolgálón, hogy a Data Factory szolgáltatás hozzáfér a kiszolgálóhoz. A beállítás ellenőrzéséhez és bekapcsolásához hajtsa végre a következő lépéseket:

  1. Kattintson a Minden szolgáltatás központra a bal oldalon, majd SQL kiszolgálókra.
  2. Válassza ki a kiszolgálót, és kattintson a BEÁLLÍTÁSOK területen a Tűzfal elemre.
  3. A Tűzfalbeállítások panelen kattintson a BE kapcsolóra az Azure-szolgáltatások hozzáférésének engedélyezése beállítás mellett.
  4. Zárja be az összes panelt az X gombra kattintva.

A Blob Storage és SQL Database

Most készítse elő az Azure Blob Storage-Azure SQL Database és -tárolót az oktatóanyaghoz az alábbi lépések elvégzésével:

  1. Indítsa el a Jegyzettömböt. Másolja a következő szöveget, és mentseemp.txta C:\ADFGetStarted mappába a merevlemezen.

    John, Doe
    Jane, Doe
    
  2. Az Azure Storage Explorer vagy egy hasonló eszköz használatával hozza létre az adftutorial tárolót, és töltse fel az emp.txt fájlt a tárolóba.

  3. A következő SQL-szkript használatával hozza létre az emp táblát az Azure SQL Database-ben.

    CREATE TABLE dbo.emp
    (
        ID int IDENTITY(1,1) NOT NULL,
        FirstName varchar(50),
        LastName varchar(50),
    )
    GO
    
    CREATE CLUSTERED INDEX IX_emp_ID ON dbo.emp (ID);
    

    Ha a SQL Server 2012/2014 van telepítve: kövesse a Managing Azure SQL Database using SQL Server Management Studio (Az Azure SQL Database kezelése a SQL Server Management Studio használatával) útmutatót a kiszolgálóhoz való csatlakozáshoz, és futtassa a SQL szkriptet.

    Ha az ügyfél nem férhet hozzá a logikai SQL-kiszolgálóhoz, konfigurálnia kell a tűzfalat a kiszolgáló számára, hogy engedélyezze a hozzáférést a gépről (IP-cím). A tűzfal kiszolgálóhoz való konfigurálásának lépéseit ebben a cikkben olvashatja el.

Adat-előállító létrehozása

Megfelelt az előfeltételeknek. Adat-előállítót az alábbi módszerek egyikével hozhat létre. Az oktatóanyag végrehajtásához kattintson az egyik lehetőségre a fenti legördülő listában, vagy kattintson az alábbi hivatkozásokra.

Megjegyzés

Az oktatóanyagban található adatfeldolgozási folyamat adatokat másol egy forrásadattárból egy céladattárba. A bemeneti adatokat nem alakítja át kimeneti adatok létrehozásához. Az adatok Azure Data Factoryval történő átalakításának útmutatásáért olvassa el az adatok Hadoop-fürt segítségével történő átalakítására szolgáló első folyamat létrehozását ismertető oktatóanyagot.

Összefűzhet két tevékenységet (vagyis egymás után futtathatja őket), ha az egyik tevékenység kimeneti adatkészletét a másik tevékenység bemeneti adatkészleteként állítja be. Lásd a Data Factorybeli ütemezést és végrehajtást ismertető cikket.