Exportera data

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skriver en datauppsättning till olika former av molnbaserad lagring i Azure, till exempel tabeller, blobar och Azure SQL databaser

Kategori: Indata och utdata

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Exportera data i Machine Learning Studio (klassisk) för att spara resultat, mellanliggande data och arbetsdata från dina experiment till molnlagringsmål utanför Machine Learning Studio (klassisk).

Den här modulen stöder export eller sparande av data till följande molndatatjänster:

  • Exportera till Hive-fråga: Skriv data till en Hive-tabell i ett HDInsight Hadoop-kluster.

  • Exportera till Azure SQL Database: Spara data till Azure SQL Database eller Azure SQL Data Warehouse.

  • Exportera till Azure Table: Spara data till tabellagringstjänsten i Azure. Tabellagring är bra för lagring av stora mängder data. Det ger ett tabellformat som är skalbart, prisvärt och med hög tillgång.

  • Exportera till Azure Blob Storage: Sparar data till Blob Service i Azure. Det här alternativet är användbart för bilder, ostrukturerad text eller binära data. Data i Blob Service kan delas offentligt eller sparas i skyddade programdatalager.

Anteckning

Exportera data-modulen stöder inte anslutning till Azure Blob Storage-konto om alternativet "Säker överföring krävs" är aktiverat.

  • Ladda ned data: Om du vill ladda ned dina data så att du kan öppna dem i Excel eller ett annat program använder du en modul som Convert to CSV (Konvertera till CSV) eller Convert to TSV (Konvertera till TSV) för att förbereda data i ett visst format och sedan ladda ned data.

  • Du kan ladda ned resultatet av valfri modul som matar ut en datauppsättning genom att högerklicka på utdata och välja Ladda ned datauppsättning. Som standard exporteras data i CSV-format.

  • Ladda ned en moduldefinition eller ett experimentdiagram: Med ett nytt PowerShell-bibliotek kan du ladda ned fullständiga metadata för experimentet eller information om en viss modul. PowerShell för Machine Learning är en experimentell version, men har många användbara cmdlets:

    • Get-AmlExperiment visar en lista över alla experiment på en arbetsyta.
    • Export-AmlExperimentGraph exporterar en definition av det fullständiga experimentet till en JSON-fil.
    • Download-AmlExperimentNodeOutput låter dig extrahera informationen som anges på utdataportarna för valfri modul.

Så här konfigurerar du Exportera data

  1. Lägg till modulen Exportera data i experimentet i Studio (klassisk). Du hittar den här modulen i kategorin Indata och Utdata.

  2. Anslut Exportera data till modulen som innehåller de data som du vill exportera.

  3. Dubbelklicka på Exportera data för att öppna fönstret Egenskaper.

  4. För Datamål väljer du den typ av molnlagring där du vill spara dina data. Om du gör några ändringar i det här alternativet återställs alla andra egenskaper. Så var noga med att välja det här alternativet först!

  5. Ange ett kontonamn och en autentiseringsmetod som krävs för att få åtkomst till det angivna lagringskontot.

    Beroende på lagringstyp och om kontot är skyddat kan du behöva ange kontonamn, filtyp, åtkomstnyckel eller containernamn. För källor som inte kräver autentisering räcker det vanligtvis att känna till URL:en.

    Exempel på varje typ finns i följande avsnitt:

  6. Med alternativet Använd cachelagrade resultat kan du upprepa experimentet utan att skriva om samma resultat varje gång.

    Om du avmarkerar det här alternativet skrivs resultatet till lagring varje gång experimentet körs, oavsett om utdata har ändrats.

    Om du väljer det här alternativet använder Exportera data cachelagrade data, om det är tillgängligt. Nya resultat genereras bara när det finns en överordnad ändring som skulle påverka resultatet.

  7. Kör experimentet.

Exempel

Exempel på hur du använder modulen Exportera data finns i Azure AI Gallery:

  • Textklassificering: Det här exemplet använder Exportera data för att spara mellanliggande resultat och använder sedan Importera data för att hämta dem från lagringen för senare steg i experimentet.

  • Detaljhandelsprognossteg 1 av 6 – förbearbetning av data: Mallen för detaljhandelsprognoser illustrerar en maskininlärningsuppgift baserat på data som lagras i Azure SQL Database. Den visar flera användbara tekniker, till exempel hur du skapar en Azure SQL-databas för maskininlärning, använder Azure SQL-databasen för att skicka datauppsättningar mellan experiment i olika konton, sparar och kombinerar prognoser.

  • Skapa och distribuera en maskininlärningsmodell med SQL Server på en virtuell Azure-dator: Den här artikeln visar hur du kan använda en SQL Server-databas som finns på en virtuell Azure-dator som källa för lagring av träningsdata och de förutsägelser som genereras av experimentet. Den illustrerar också hur relationsdatabasen kan användas för funktionsutveckling och funktionsval.

  • Så här använder du Azure ML med Azure SQL Data Warehouse: Den här artikeln visar hur du kan skapa en maskininlärningsmodell med hjälp av data i Azure SQL Data Warehouse.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Implementeringsdetaljer

  • Den här modulen hette tidigare Writer. Om du har ett befintligt experiment som använder writer-modulen byter modulen namn till Exportera data när du uppdaterar experimentet.

  • Det är inte alla moduler som producerar utdata som är kompatibla med Export Data-mål . Exportera data kan till exempel inte spara en datauppsättning som har konverterats till SVMLight-formatet. Exportera data stöder följande format:

    • Datauppsättning (azure ML internt format)
    • .NET DataTable
    • CSV med eller utan rubriker
    • TSV med eller utan rubriker

Kända problem

  • När du väljer Azure-tabell som plats för att mata ut dina data kan det ibland finnas ett fel när du skriver till den angivna tabellen. När detta inträffar kan data skrivas till en blob i stället.

    Om det här felet inträffar och du senare inte kan läsa från den förväntade tabellen kan du prova att använda ett Azure Storage-verktyg för att kontrollera blobarna i den angivna containern i ditt lagringskonto.

  • För närvarande kan du inte spara en blob i en angiven Hive-tabell. Om du behöver skriva mellanliggande resultat bör du undvika att använda en Hive-tabell i HDInsight och använda bloblagring eller tabellagring i stället.

  • Om du för närvarande väljer HDFS som plats för att spara utdata returneras följande felmeddelande: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Förväntade indata

Namn Typ Description
Datamängd Datatabell Datauppsättningen som ska skrivas.

Modulparametrar

Den här tabellen innehåller parametrar som gäller för alla exportdataalternativ . Andra parametrar är dynamiska och ändras beroende på vilket datamål du väljer.

Name Intervall Typ Standardvärde Description
Ange datamål Lista DataSourceOrSink Blob-tjänst i Azure Storage Ange om datamålet är en fil i Blob Service, en fil i Table Service, en SQL databas i Azure eller en Hive-tabell.
Använda cachelagrade resultat TRUE/FALSE Boolesk FALSE Välj det här alternativet för att undvika att skriva om resultat i onödan. Om något ändras uppströms i experimentet, kommer Exportera data alltid att köra och skriva nya resultat. Men om inget har ändrats och du har valt det här alternativet körs inte Exportera data för att undvika att skriva om samma resultat.

Undantag

Undantag Description
Fel 0057 Ett undantag inträffar när du försöker skapa en fil eller blob som redan finns.
Fel 0001 Ett undantag inträffar om det inte går att hitta en eller flera angivna kolumner i datauppsättningen.
Fel 0027 Ett undantag inträffar när två objekt måste ha samma storlek, men det är de inte.
Fel 0079 Ett undantag inträffar om containernamnet i Azure Storage har angetts felaktigt.
Fel 0052 Ett undantag inträffar om lagringsåtkomstnyckeln för Azure-kontot har angetts felaktigt.
Fel 0064 Ett undantag inträffar om kontonamnet eller lagringsåtkomstnyckeln för Azure-kontot har angetts felaktigt.
Fel 0071 Ett undantag inträffar om de angivna autentiseringsuppgifterna är felaktiga.
Fel 0018 Ett undantag inträffar om indatauppsättningen inte är giltig.
Fel 0029 Ett undantag inträffar när en ogiltig URI skickas.
Fel 0003 Ett undantag inträffar om en eller flera indata är null eller tomma.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Importera data
Indata och utdata
Datatransformering
Jämföra Azure Table Storage och Azure SQL Database
A-Z-modullista