Importálás Azure SQL Database-ből

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk azt ismerteti, hogyan használható az Adatok importálása modul a Machine Learning Studio (klasszikus) használatával adatok Azure SQL Database vagy Azure SQL Data Warehouse.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Az adatok adatbázisból való importálásához meg kell adnia a kiszolgáló és az adatbázis nevét, valamint egy SQL-utasítást, amely meghatározza a táblát, a nézetet vagy a lekérdezést.

Az adatok Azure-adatbázisokban való tárolása általában drágább, mint az Azure-beli táblák vagy blobok használata. Az előfizetés típusától függően az adatbázisban tárolható adatok mennyisége is korlátokba eshet. Az SQL Azure Database azonban nem számít fel tranzakciós díjat, így ez a lehetőség ideális a kisebb mennyiségű gyakran használt információhoz, például az adatkeresési táblákhoz vagy adatszótárakhoz való gyors hozzáféréshez.

Akkor is ajánlott egy Azure-adatbázisban tárolni az adatokat, ha az olvasás előtt szűrni szeretné az adatokat, vagy ha az előrejelzéseket vagy metrikákat vissza szeretné menteni az adatbázisba jelentéskészítésre.

Adatok importálása Azure SQL Database vagy SQL Data Warehouse

Az Adatimport varázsló használata

A modul egy új varázslóval segít kiválasztani a tárolási lehetőséget, választani a meglévő előfizetések és fiókok közül, és gyorsan konfigurálni az összes beállítást.

  1. Adja hozzá az Adatok importálása modult a kísérlethez. A modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja .

  2. Kattintson az Adatok importálása varázsló indítása elemre , és kövesse az utasításokat.

  3. Ha a konfigurálás befejeződött, az adatok a kísérletbe való másoláshoz kattintson a jobb gombbal a modulra, és válassza a Kijelölt futtatása lehetőséget.

Ha egy meglévő adatkapcsolatot kell szerkesztenie, a varázsló betölti az összes korábbi konfigurációs adatot, így nem kell elölről kezdenie

Tulajdonságok manuális beállítása az Adatok importálása modulban

A következő lépések ismertetik, hogyan konfigurálhatja manuálisan az importálási forrást.

  1. Adja hozzá az Adatok importálása modult a kísérlethez. Ezt a modult a (klasszikus) Studióban, az Adatbemenet és -kimenet kategóriában találja .

  2. Az Adatforrás mezőbenválassza a Azure SQL Database.

  3. Adja meg a következő beállításokat a Azure SQL Database vagy Azure SQL Data Warehouse.

    Adatbázis-kiszolgáló neve: Írja be az Azure által létrehozott kiszolgálónevet. Általában a következő formában van: <generated_identifier>.database.windows.net.

    Adatbázis neve: Írja be egy meglévő adatbázis nevét az előbb megadott kiszolgálón.

    Kiszolgálói felhasználói fiók neve: Írja be egy olyan fiók felhasználónevét, amely rendelkezik hozzáférési engedélyekkel az adatbázishoz.

    Kiszolgálói felhasználói fiók jelszava: Adja meg a megadott felhasználói fiók jelszavát.

    Adatbázis-lekérdezés: Írjon vagy illesszen be egy SQL-utasítást, amely leírja az olvasni kívánt adatokat. Mindig ellenőrizze a SQL utasítást, és ellenőrizze előre a lekérdezés eredményeit egy olyan eszközzel, mint Visual Studio Server Explorer vagy SQL Server Data Tools.

    Megjegyzés

    Az Adatok importálása modul csak az adatbázisnév, a felhasználói fiók neve és a jelszó megadását támogatja hitelesítő adatként.

  4. Ha a Machine Learning beolvasott adatkészlet várhatóan nem változik a kísérlet futtatásai között, válassza a Gyorsítótárazott eredmények használata lehetőséget.

    Ha ez a beállítás be van jelölve, és nincsenek más módosítások a modul paramétereiben, a kísérlet betölti az adatokat a modul első futtatásakor, majd ezt követően az adatkészlet gyorsítótárazott verzióját használja.

    Ha újra be szeretné tölteni az adatkészletet a kísérlet minden egyes iterációja során, törölje ennek a beállításnak a kijelölését. A rendszer minden alkalommal újra betölti az adatkészletet a forrásból, amikor bármilyen paraméter módosul az Adatok importálása során.

  5. Futtassa a kísérletet.

    Ahogy az Adatok importálása betölti az adatokat a Studióba (klasszikus), némi implicit típuskonverzió is elvégezhető a forrásadatbázisban használt adattípustól függően.

Results (Eredmények)

Ha az importálás befejeződött, kattintson a kimeneti adatkészletre, és válassza a Képi megjelenítés lehetőséget, hogy lássa, sikeresen importálta-e az adatokat.

Igény szerint módosíthatja az adatkészletet és annak metaadatait a Studio (klasszikus) eszközeivel:

Példák

Az Azure-adatbázisokból származó adatok gépi tanulásban való használatára az alábbi cikkekben és kísérletekben talál példát:

  • Kiskereskedelmi előrejelzés – 1/6. lépés – adat-előfeldolgozás: A kiskereskedelmi előrejelzési sablon egy tipikus forgatókönyvet szemléltet, amely az Azure SQLDB-ben tárolt adatokat használja elemzésre.

    Emellett bemutat néhány hasznos technikát is, például az Azure SQLDB-t arra, hogy adatkészleteket ad át különböző fiókokban található kísérletek között, előrejelzéseket takarít meg és kombinál, valamint hogyan hozhat létre azure SQLDB-t a gépi tanuláshoz.

  • A Machine Learning használata SQL Data Warehouse: Ez a cikk bemutatja, hogyan hozható létre regressziós modell az árak előrejelzése Azure SQL Data Warehouse.

  • Az Azure ML használata Azure SQL Data Warehouse: Ez a cikk egy fürtözési modellt hoz létre az AdventureWorks szolgáltatásban az Adatok importálása és az Adatok exportálása Azure SQL Data Warehouse.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Gyakori kérdések

Szűrhetők az adatok a forrásból való beolvasott adatokra?

Az Adatok importálása modul nem támogatja a szűrést az adatok olvasása során. Javasoljuk, hogy hozzon létre egy nézetet, vagy határozzon meg egy lekérdezést, amely csak a szükséges sorokat hozza létre.

Megjegyzés

Ha azt találják, hogy a szükségesnél több adatot töltöttek be, felülírhatja a gyorsítótárazott adatkészletet egy új adatkészlet beolvasásával, és a régebbi, nagyobb adatokkal azonos néven mentheti őket.

Miért jelenik meg a "Type Decimal is not supported" (A decimális típus nem támogatott) hibaüzenet?

Ha egy adatbázisból SQL adatokat, előfordulhat, hogy egy nem támogatott adattípusról szóló hibaüzenet jelenik meg.

Ha a SQL-adatbázisból lekért adatok olyan adattípusokat tartalmaznak, amelyek az Machine Learning-ban nem támogatottak, az adatok beolvasása előtt konvertálja vagy konvertálja a tizedes törteket támogatott adatokká. Az Adatok importálása nem képes automatikusan végrehajtani a pontosság elvesztését eredményező átalakításokat.

További információ a támogatott adattípusokkal kapcsolatban: Modul adattípusok.

Mi történik, ha az adatbázis egy másik földrajzi régióban van? Az Adatok importálása továbbra is elérhető az adatbázishoz? Hol tárolja a rendszer az adatokat?

Ha az adatbázis a gépi tanulási fióktól eltérő régióban található, az adatelérés lassabb lehet. Emellett az előfizetésbe való be- és ki- és becsatért díjat kell fizetnie, ha a számítási csomópont a tárfióktól eltérő régióban található.

A kísérlethez a munkaterületre beolvasott adatok a kísérlethez társított tárfiókba kerülnek.

Miért nem jelennek meg helyesen bizonyos karakterek?

Machine Learning UTF-8 kódolást támogatja. Ha az adatbázis sztringoszlopai más kódolást használnak, előfordulhat, hogy a karakterek importálása helytelen.

Az egyik lehetőség az adatok exportálása egy CSV-fájlba az Azure Storage-ban, és a CSV használata kódolással az egyéni elválasztók, a kódlap és így tovább paraméterek megadásához.

Modulparaméterek

Name Tartomány Típus Alapértelmezett Description
Adatforrás Lista Adatforrás vagy fogadó Azure Blob Storage Az adatforrás lehet HTTP, FTP, névtelen HTTPS vagy FTPS, azure blobtárolóban lévő fájl, Azure-tábla, Azure SQL Database, helyszíni SQL Server-adatbázis, Hive-tábla vagy OData-végpont.
HDFS-kiszolgáló URI-ja bármelyik Sztring Nincs HDFS REST-végpont
Adatbázis-kiszolgáló neve bármelyik Sztring Nincs Azure Storage-tárfiók neve
Adatbázis neve bármelyik SecureString Nincs Azure Storage-kulcs
Kiszolgálói felhasználói fiók neve bármelyik Sztring Nincs Azure-tároló neve
Kiszolgálói felhasználói fiók neve Lista (részkészlet) URL-cím tartalma OData Adattípus
Adatbázis-lekérdezés bármelyik Sztring Nincs Adattípus
Gyorsítótárazott eredmények használata IGAZ/HAMIS Logikai HAMIS leírás

Kimenetek

Név Típus Description
Eredményadatkészlet Adattábla Adatkészlet letöltött adatokkal

Kivételek

Kivétel Description
0027-es hiba Kivétel történik, ha két objektumnak azonos méretűnek kell lennie, de nem azok.
0003-as hiba Kivétel történik, ha egy vagy több bemenet null vagy üres.
0029-es hiba Kivétel történik, ha érvénytelen URI-t ad át.
0030-as hiba a kivétel akkor jelentkezik, ha nem lehet letölteni egy fájlt.
0002-es hiba Kivétel történik, ha egy vagy több paramétert nem lehetett a megadott típusról a cél metódus által megkövetelt típusra átalakítani.
0009-es hiba Kivétel történik, ha az Azure Storage-fiók neve vagy a tároló neve helytelenül van megadva.
0048-as hiba Kivétel történik, ha nem lehet megnyitni egy fájlt.
0015-ös hiba Kivétel történik, ha az adatbázis-kapcsolat meghiúsult.
0046-os hiba Kivétel történik, ha nem lehet könyvtárat létrehozni a megadott elérési úton.
0049-es hiba Kivétel történik, ha nem lehet fájlokat elemezni.

A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.

Az API-kivételek listájáért tekintse meg a Machine Learning REST API hibakódokat.

Lásd még

Adatok importálása
Adatok exportálása
Importálás webes URL-ről HTTP-kapcsolaton keresztül
Importálás Hive-lekérdezésből
Importálás Azure-táblából
Importálás Azure Blob Storage
Importálás adatcsatorna-szolgáltatókból
Importálás helyszíni adatbázisból SQL Server adatbázisból