Konverteringar av data format

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Den här artikeln innehåller de moduler som finns i Azure Machine Learning Studio (klassisk) för att konvertera data mellan olika fil format som används i Machine Learning.

De format som stöds är:

  • Data uppsättnings formatet som används i hela Azure Machine Learning.
  • Det arff -format som används av wekas. Wekas är en Java-baserad uppsättning med Machine Learning-algoritmer med öppen källkod.
  • SVMLight -formatet. SVMLight-formatet utvecklades för SVMLight Framework för Machine Learning. Den kan också användas av Vowpal Wabbit.
  • De Flat -filformat (TSV) och kommaavgränsade (CSV) flata fil format som stöds av de flesta Relations databaser. Dessa format stöds också i stor utsträckning av R och python.

När du konverterar data till dessa format kan du enklare flytta resultat och data mellan olika ramverk för maskin inlärning eller lagrings metoder.

Anteckning

Dessa data konverterings moduler konverterar bara hela data uppsättningen till ett angivet format. Om du behöver göra en data inmatning, trunkering, konvertering av datum-och tids format eller andra modifieringar av värdena, använder du modulerna i data omvandlingeneller visar listan över relaterade uppgifter.

Vanliga data konverterings scenarier

Du använder vanligt vis data konverterings moduler om du behöver flytta data från ett Azure Machine Learning experiment till ett annat maskin inlärnings verktyg eller en plattform. Du kan också använda modulerna för att exportera data från Machine Learning i ett format som kan användas av en databas eller andra verktyg. Exempel:

Uppgift Använd den här
Du måste spara en mellanliggande data uppsättning som ska användas i Excel eller för att importera till en databas. Använd modulen CSV eller TSV för att förbereda data i rätt format. Hämta sedan data eller spara dem till Azure Storage.
Du vill återanvända data från experimentet i R-eller python-kod. Använd modulen CSV eller TSV för att förbereda data. Högerklicka sedan på den konverterade data uppsättningen för att Hämta python-koden som du behöver för att få åtkomst till data uppsättningen.
Du har hamnat på experimentet och data mellan Wekas och Azure Machine Learning. Använd arff -modulen för att förbereda data. Hämta sedan resultaten.
Du måste förbereda data i SVMlight-ramverket. Förbered data med hjälp av modulen konvertera till SVMLight . Hämta sedan de resulterande data.
Skapa data som ska användas med Vowpal Wabbit. Använd SVMLight -formatet. Ändra sedan filerna enligt beskrivningen i artikeln. Spara filen i Azure Blob Storage som ska användas med en Vowpal Wabbit-modul i Azure Machine Learning.
Data är inte i tabell format. Tvingar den till ett data uppsättnings format med hjälp av modulen konvertera till data uppsättning .

Om du behöver importera data till Azure Machine Learning eller transformera data i enskilda kolumner använder du dessa moduler innan du utför data konverteringen:

Uppgift Använd den här
Importera data från den här datorn till Azure Machine Learning. Ladda upp data uppsättningar i CSV-format enligt beskrivningen i Importera dina utbildnings data till Azure Machine Learning Studio (klassisk).
Importera data från en moln data källa, inklusive Hadoop eller Azure. Använd modulen Importera data .
Spara Machine Learning-datauppsättningar till Azure Blob Storage, ett Hadoop-kluster eller annan molnbaserad lagring. Använd modulen Exportera data .
Ändra data typen för kolumner eller Cast-kolumner till ett annat format eller en annan typ. Använd modulerna Redigera metadata eller Använd SQL-transformering i Azure Machine Learning. Om du är kompetent med R eller python kan du prova att köra python-skriptet eller köra R-skript moduler.
Avrunda, gruppera eller normalisera numeriska data. Använd åtgärden Använd matematik, gruppera data i lager platsereller normalisera Datamoduler.

Lista över moduler

Kategorin data format konverteringar innehåller följande moduler:

Se även