Adatok exportálása

Adathalmaz írása az Azure-beli felhőalapú tárolás különböző formáiba, például táblák, blobok és Azure SQL Database-adatbázisok

Kategória: adatok bemenete és kimenete

Megjegyzés

Akövetkezőkre vonatkozik: Machine learning Studio (klasszikus)

Ez a tartalom csak a Studióra vonatkozik (klasszikus). Hasonló drag and drop-modulok lettek hozzáadva a Azure Machine Learning Designerhez. Ebben a cikkben további információt talál a két verzió összehasonlításávalkapcsolatban.

Modul áttekintése

Ez a cikk azt ismerteti, hogyan használható az adatexportálási modul Azure Machine learning Studio (klasszikus), az eredmények, a köztes adatok és a munkaadatoknak a kísérletekből a Azure Machine learning Studio (klasszikus) kívüli Felhőbeli tárolási célhelyekre való mentéséhez.

Ez a modul támogatja a következő felhőalapú adatszolgáltatások exportálását vagy mentését:

  • Exportálás a kaptár-lekérdezésbe: az adatírást egy HDInsight Hadoop-fürtben lévő kaptár-táblába.

  • Exportálás Azure SQL Databaseba: mentse az adatAzure SQL Database vagy a Azure SQL Data Warehouse.

  • Exportálás az Azure Table-be: adatmentés a Table Storage szolgáltatásba az Azure-ban. A Table Storage hasznos nagy mennyiségű adattároláshoz. Táblázatos formátumot biztosít, amely méretezhető, olcsó és magasan elérhető.

  • Exportálás az azure blob Storageba: az Azure-ban tárolt blob serviceba menti az adatvesztést. Ez a beállítás képek, strukturálatlan szöveg vagy bináris adat esetén hasznos. A Blob serviceban tárolt adatmennyiség megoszthatók nyilvánosan, vagy menthetők biztonságos alkalmazás-adattárakban.

Megjegyzés

Az adatexportálási modul nem támogatja az Azure Blob Storage-fiókhoz való csatlakozást, ha engedélyezve van a "biztonságos átvitel szükséges" beállítás.

  • Az adatletöltés: Az adatok letöltéséhez, hogy az Excelben vagy más alkalmazásban is megnyithatók legyenek, használjon olyan modult, mint például a CSV konvertálása vagy a TSV formátumra való átalakítás , hogy az adatokat egy adott formátumban készítse elő, majd töltse le az adatokat.

  • Az adatkészletet kiállító modulok eredményeit letöltheti, ha a jobb gombbal a kimenetre kattint, és kiválasztja az adatkészlet letöltése lehetőséget. Alapértelmezés szerint az adatexportálás CSV-formátumban történik.

  • Modul definíciójának vagy kísérleti gráfjának letöltése: Egy új PowerShell-függvénytár segítségével letöltheti a kísérlet teljes metaadatait vagy egy adott modul részleteit. A Azure Machine Learning könyvtár PowerShell-verziója kísérleti kiadás, de számos hasznos parancsmaggal rendelkezik:

    • Get-AmlExperiment a munkaterület összes kísérletét listázza.

    • Export-AmlExperimentGraph a teljes kísérlet definíciójának exportálása egy JSON-fájlba.

    • Download-AmlExperimentNodeOutput lehetővé teszi bármely modul kimeneti portjain található információk kinyerését.

      További információ: PowerShell-modul Azure Machine learning Studio (klasszikus).

Az exportálási beállítások konfigurálása

  1. Adja hozzá az adatexportálási modult a kísérlethez a Studio (klasszikus) szolgáltatásban. Ez a modul a bemeneti és a kimeneti kategóriában található.

  2. Az exportálni kívánt adatelemet tartalmazó modulba csatlakoztasson adatexportálást .

  3. Kattintson duplán az adatexportálás elemre a Tulajdonságok ablaktábla megnyitásához.

  4. Az adatcél mezőben válassza ki a felhőalapú tárolás típusát, ahová menteni szeretné az adatait. Ha módosítja ezt a beállítást, az összes többi tulajdonság alaphelyzetbe áll. Ügyeljen arra, hogy először ezt a lehetőséget válassza.

  5. Adja meg a megadott Storage-fiók eléréséhez szükséges fióknevet és hitelesítési módszert.

    A tárolási típustól és attól függően, hogy a fiók biztonságos-e, lehet, hogy meg kell adnia a fiók nevét, a fájltípust, a hozzáférési kulcsot vagy a tároló nevét. A hitelesítést nem igénylő források esetében általában elegendő az URL-cím ismerete.

    Az egyes típusokra vonatkozó példákért tekintse meg a következő témaköröket:

  6. A lehetőség, a gyorsítótárazott eredmények használata lehetővé teszi a kísérlet megismétlését anélkül, hogy minden alkalommal ugyanazt az eredményt kellene átírnia.

    Ha kijelöli ezt a beállítást, a rendszer a kísérlet futtatásakor minden alkalommal a tárolóba írja az eredményeket, függetlenül attól, hogy módosultak-e a kimeneti adatokat.

    Ha ezt a beállítást választja, az adatexportáláskor a gyorsítótárazott adatértékek lesznek elérhetők, ha vannak ilyenek. Az új eredmények csak akkor jönnek létre, ha van egy felsőbb rétegbeli változás, amely hatással lenne az eredményekre.

  7. Futtassa a kísérletet.

Példák

Az adatexportálási modul használatával kapcsolatos példákért tekintse meg a Azure AI Gallery:

Technikai megjegyzések

Ez a szakasz megvalósítási részleteket, tippeket és válaszokat tartalmaz a gyakori kérdésekre.

Tipp

Nem tudja, hogyan vagy hol tárolja az adatait? Tekintse meg ezt az útmutatót az adatelemzési folyamat általános adatforgatókönyvei: speciális elemzési forgatókönyvek Azure Machine learning

Megvalósítás részletei

  • Ez a modul korábban a Writer nevet kapta. Ha már van olyan kísérlete, amely az író modult használja, a rendszer átnevezi a modult az adatexportálásra , amikor frissíti a kísérletet.

  • Nem minden modul készít olyan kimenetet, amely kompatibilis az adatexportálási célhelyekkel. Például az exportálási adat nem mentheti a SVMLight formátumra konvertált adatkészletet. Az adatexportálás a következő formátumokat támogatja:

    • Adatkészlet (Azure ML belső formátum)
    • .NET DataTable
    • CSV fejlécekkel vagy anélkül
    • TSV fejlécekkel vagy anélkül

Ismert problémák

  • Ha kijelöli az Azure-tábla lehetőséget az adatai kimenetének helyeként, időnként előfordulhat, hogy hiba történt a megadott táblába való írás során. Ha ez történik, előfordulhat, hogy a rendszer az adatfájlokat egy blobba írja.

    Ha ez a hiba történik, és később nem tud olvasni a várt táblából, próbálja meg egy Azure Storage segédprogram használatával ellenőriznie a blobokat a Storage-fiók megadott tárolójában.

  • Jelenleg nem menthet blobot egy megadott kaptár-táblába. Ha köztes eredményeket kell írnia, kerülje a kaptár-tábla használatát a HDInsight-ben, és használja helyette a blob Storage vagy a Table Storage használatát.

  • Ha a HDFS lehetőséget választja a kimeneti adatokat tároló helyként, a rendszer a következő hibaüzenetet adja vissza: "Microsoft. Analytics. kivételek. ErrorMapping + ModuleException".

Várt bemenetek

Név Típus Leírás
Adathalmaz Adattábla Az írni kívánt adatkészlet.

Modul paramétereinek

Ez a táblázat felsorolja az összes exportálási beállításra vonatkozó paramétereket. Más paraméterek dinamikusak, és a kiválasztott adatoktól függően változnak.

Name Tartomány Típus Alapértelmezett Leírás
Adja meg az adatcélhelyet Lista DataSourceOrSink Blob service az Azure Storage-ban Jelezze, hogy az adatcél egy fájl a blob Service, egy fájl a Table Service, egy SQL- adatbázis az Azure-ban vagy egy struktúra-tábla.
Gyorsítótárazott eredmények használata IGAZ/HAMIS Logikai HAMIS Válassza ezt a lehetőséget, ha el szeretné kerülni az eredmények szükségtelen újraírását. Ha a kísérlet során bármilyen változás történik, az exportálási művelet mindig végrehajtja és új eredményeket ír. Ha azonban semmi sem módosult, és ezt a beállítást választotta, az exportálási művelet nem kerül végrehajtásra az azonos eredmények újraírásának elkerülése érdekében.

Kivételek

Kivétel Leírás
0057-es hiba Kivétel keletkezik, amikor egy már létező fájlt vagy blobot próbál létrehozni.
0,001-es hiba Kivétel történik, ha az adatkészlet egy vagy több megadott oszlopa nem található.
0027 hiba Kivétel történik, ha két objektumnak azonos méretűnek kell lennie, de nem.
0079-es hiba Kivétel történik, ha az Azure Storage-beli tároló neve helytelenül van megadva.
0052-es hiba Kivétel történik, ha az Azure-fiókhoz tartozó Storage-hozzáférési kulcs helytelenül van megadva.
0064-es hiba Kivétel történik, ha az Azure-fiókhoz tartozó fióknév vagy tároló-hozzáférési kulcs helytelenül van megadva.
0071-es hiba Kivétel történik, ha a megadott hitelesítő adatok helytelenek.
0018 hiba Kivétel történik, ha a bemeneti adatkészlet érvénytelen.
0029 hiba Kivétel történik, ha a rendszer érvénytelen URI-értéket ad át.
0003 hiba Kivétel történik, ha egy vagy több bemenet null értékű vagy üres.

A Studio (klasszikus) modulokra vonatkozó hibák listáját itt tekintheti meg: Machine learning hibakódok.

Az API-kivételek listáját itt tekintheti meg: Machine Learning REST API hibakódok.

Lásd még

Adatimportálás
Adatok bevitele és kimenete
Adatátalakítás
Az Azure Table Storage és az Azure SQL Database összehasonlítása
A-Z modulok listája