Conversies van gegevens indeling

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

In dit artikel vindt u een lijst met de modules in Azure Machine Learning Studio (klassiek) voor het converteren van gegevens over verschillende bestands indelingen die worden gebruikt in machine learning.

De ondersteunde indelingen zijn onder andere:

  • De indeling van de gegevensset die in azure machine learning wordt gebruikt.
  • De ARFF -indeling die wordt gebruikt door Fridge. Fridge is een open-source op Java gebaseerde set machine learning-algoritmen.
  • De SVMLight -indeling. De SVMLight-indeling is ontwikkeld voor het SVMLight -framework voor machine learning. Het kan ook worden gebruikt door Vowpal Wabbit.
  • De platte bestands indelingen met door tabs gescheiden (TSV) en door KOMMA'S gescheiden (CSV) die worden ondersteund door de meeste relationele data bases. Deze indelingen worden ook algemeen ondersteund door R en python.

Wanneer u gegevens naar deze indelingen converteert, kunt u de resultaten en gegevens gemakkelijker verplaatsen tussen verschillende machine learning frameworks of opslag mechanismen.

Notitie

Deze modules voor gegevens conversie converteren de volledige gegevensset alleen naar een opgegeven indeling. Als u Casting, afkap ping, conversie van datum-en tijd notaties of andere manipulatie van de waarden wilt uitvoeren, gebruikt u de modules in gegevens transformatieof bekijkt u de lijst met gerelateerde taken.

Veelvoorkomende scenario's voor gegevens conversie

Normaal gesp roken gebruikt u de modules voor gegevens conversie als u gegevens wilt verplaatsen van een Azure Machine Learning experiment naar een ander machine learning hulp programma of platform. U kunt ook de modules gebruiken om gegevens uit Machine Learning te exporteren in een indeling die kan worden gebruikt door een Data Base of andere hulpprogram ma's. Bijvoorbeeld:

Taak Gebruik deze
U moet een tussenliggende gegevensset opslaan voor gebruik in Excel of importeren in een Data Base. Gebruik de CSV -module of de TSV -module om de gegevens in de juiste indeling voor te bereiden. Vervolgens kunt u de gegevens downloaden of opslaan in Azure Storage.
U wilt gegevens opnieuw gebruiken uit uw experiment in R-of python-code. Gebruik de CSV -module of de TSV -module om de gegevens voor te bereiden. Klik vervolgens met de rechter muisknop op de geconverteerde gegevensset om de python-code op te halen die u nodig hebt voor toegang tot de gegevensset.
U gaat uw experiment en gegevens overbrengen tussen Fridge en Azure Machine Learning. Gebruik de ARFF -module om de gegevens voor te bereiden. Down load vervolgens de resultaten.
U moet gegevens voorbereiden in het SVMlight-Framework. Gebruik de module Convert to SVMLight om de gegevens voor te bereiden. Down load vervolgens de resulterende gegevens.
Maak gegevens om te gebruiken met Vowpal Wabbit. Gebruik de SVMLight -indeling. Wijzig vervolgens de bestanden zoals beschreven in het artikel. Sla het bestand in Azure Blob Storage op om te gebruiken met een Vowpal Wabbit-module in Azure Machine Learning.
De gegevens hebben geen tabellaire indeling. Converteer het naar een gegevensset-indeling met behulp van de module converteren naar dataset .

Als u gegevens wilt importeren in Azure Machine Learning of gegevens wilt transformeren in afzonderlijke kolommen, gebruikt u deze modules voordat u gegevens conversie uitvoert:

Taak Gebruik deze
Gegevens importeren van mijn computer in Azure Machine Learning. Upload gegevens sets in CSV-indeling zoals beschreven in uw trainings gegevens importeren in azure machine learning Studio (klassiek).
Gegevens importeren uit een gegevens bron in de Cloud, waaronder Hadoop of Azure. De module gegevens importeren gebruiken.
Machine learning gegevens sets opslaan in Azure Blob Storage, een Hadoop-cluster of andere opslag op basis van de Cloud. Gebruik de module gegevens exporteren .
Wijzig het gegevens type van kolommen of cast-kolommen in een andere notatie of type. Gebruik in Azure Machine Learning de modules meta gegevens bewerken of SQL-transformatie-trans formatie Toep assen . Als u werkt met R of python, kunt u het uitvoeren van het script python of het uitvoeren van r-script modules.
Numerieke gegevens worden afgerond, gegroepeerd of genormaliseerd. Gebruik de bewerking wiskunde Toep assen, gegevens groeperen in opslag locatiesof gegevens modules normaliseren .

Lijst met modules

De categorie voor de conversies van gegevens indelingen bevat deze modules:

  • Converteren naar ARFF: converteert gegevens invoer naar de kenmerk relatie bestands indeling die wordt gebruikt door de Fridge-toolset.
  • Converteren naar CSV: converteert een gegevensset naar een indeling met door komma's gescheiden waarden.
  • Converteren naar gegevensset: converteert gegevens invoer naar de indeling van de interne gegevensset die wordt gebruikt door Azure machine learning.
  • Converteren naar SVMLight: Hiermee wordt de invoer van gegevens geconverteerd naar de indeling die wordt gebruikt door het SVMLight-Framework.
  • Converteren naar TSV: Hiermee wordt de invoer van gegevens geconverteerd naar de indeling met door tabs gescheiden waarden.

Zie ook