Converteren naar TSV

Hiermee wordt de gegevens invoer geconverteerd naar een door tabs gescheiden indeling

Categorie: gegevens indeling conversies

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de module Convert to TSV in azure machine learning Studio (klassiek) gebruikt om alle gegevensset te converteren van de interne indeling die wordt gebruikt door alle Azure machine learning Studio (klassieke) modules, naar een plat bestand in een door tabs gescheiden indeling.

TSV-bestanden (door tabs gescheiden waarden) zijn compatibel met veel externe hulpprogram ma's, waaronder:

  • R en python

  • Excel en Power Pivot

  • Alle relationele data bases

Als uw experiment bijvoorbeeld een tussenliggende gegevensset heeft die u wilt opslaan voor hergebruik in een ander hulp programma of als u wilt aanroepen vanaf code, converteert u deze naar de TSV-indeling en klikt u met de rechter muisknop op de geconverteerde gegevensset om de python-code op te halen die nodig is voor toegang tot de gegevensset.

Converteren naar TSV gebruiken

Gebruik de module converteren naar TSV wanneer u een gegevensset in een door tabs gescheiden indeling moet downloaden.

  1. Voeg de conversie naar TSV toe aan uw experiment. U kunt deze module vinden in de categorie gegevens indeling conversies in azure machine learning Studio (klassiek).

  2. Verbind de module met een andere datset of een module die een gegevensset in tabel vorm uitvoert.

  3. Voer het experiment uit of klik met de rechter muisknop op alleen de module converteren naar TSV en selecteer geselecteerde uitvoeren.

Resultaten

Wanneer de conversie is voltooid, kunt u de gegevensset openen, deze aanroepen vanuit R-of python-code, deze gebruiken in een Jupyter-notebook of opslaan in een lokaal bestand.

Als u de gegevensset wilt downloaden, dubbelklikt u op de module-uitvoer en geeft u aan of u de datset wilt openen of opslaan.

  • Als u openenselecteert, wordt de gegevensset geladen met het hulp programma dat de computer standaard gebruikt om te openen. TSV-bestanden. Dit is normaal gesp roken micro soft Excel.

  • Als u gegevensset downloadenselecteert, wordt het bestand standaard opgeslagen met de naam van de module plus een GUID die de werk ruimte-id voor stelt. U kunt echter de optie Opslaan als selecteren tijdens het downloaden en de bestands naam of-locatie wijzigen.

Voorbeelden

Hoewel er geen specifieke voor beelden zijn van deze indeling, ziet u voor beelden van hoe indelings conversie wordt gebruikt door deze voorbeeld experimenten te verkennen in de Azure AI Gallery:

Technische opmerkingen

Deze sectie bevat implementatie details, tips en antwoorden op veelgestelde vragen.

Vereisten voor TSV-indeling

Door tabs gescheiden waarden (TSV) is een tekst indeling die wordt gebruikt voor het opslaan van gegevens in een tabellaire structuur. Het is vergelijkbaar met de CSV-indeling, maar het scheidings teken is een tab in plaats van een komma.

De TSV-indeling is een nuttig alternatief voor de CSV-indeling als uw gegevens komma's bevatten. Komma's zijn zeer gebruikelijk in tekst gegevens en ze worden gebruikt in Europese getalnotaties.

Een probleem met de indeling met door tabs gescheiden waarden is dat tabposities vaak als witruimte worden beschouwd in ongestructureerde tekst. De IANA-standaard voor TSV bevordert echter schone en nauw keurige parsering van TSV-bestanden door tabbladen in velden niet toe te staan.

Houd rekening met de volgende vereisten voor TSV-bestanden in Azure Machine Learning Studio (klassiek):

  • De module converteren naar TSV ondersteunt de uitvoer van één rij met koppen als de gegevensset kolom namen bevat.

  • De TSV-provider ondersteunt alleen UTF-8-teken codering.

  • Bij het lezen van of schrijven naar TSV-bestanden, kunnen de prestaties langzamer zijn dan met andere indelingen (zoals CSV).

Verwachte invoer

Naam Type Beschrijving
Gegevensset Gegevens tabel Invoer gegevensset

Uitvoer

Naam Type Beschrijving
Gegevensset voor resultaten GenericTsv Uitvoer gegevensset

Zie ook

Conversies van gegevens indeling
Module lijst a-Z