Share via


Een gegevensset van ML-studio (klassiek) migreren naar Azure Machine Learning

Belangrijk

Ondersteuning voor Azure Machine Learning Studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden op die datum over te stappen naar Azure Machine Learning .

Vanaf 1 december 2021 kunt u geen nieuwe Machine Learning Studio-resources (klassiek) maken (werkruimte- en webserviceplan). Tot en met 31 augustus 2024 kunt u de bestaande Experimenten en webservices van Machine Learning Studio (klassiek) blijven gebruiken. Zie voor meer informatie:

Machine Learning Studio -documentatie (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet bijgewerkt.

In dit artikel leert u hoe u een Studio-gegevensset (klassiek) migreert naar Azure Machine Learning. Zie het artikel over migratieoverzicht voor meer informatie over het migreren vanuit Studio (klassiek).

U hebt drie opties om een gegevensset te migreren naar Azure Machine Learning. Lees elke sectie om te bepalen welke optie het beste is voor uw scenario.

Waar zijn de gegevens? Migratieoptie
In Studio (klassiek) Optie 1: Download de gegevensset vanuit Studio (klassiek) en upload deze naar Azure Machine Learning.
Cloudopslag Optie 2: Een gegevensset registreren bij een cloudbron.

Optie 3: Gebruik de module Gegevens importeren om gegevens op te halen uit een cloudbron.

Notitie

Azure Machine Learning ondersteunt ook code-first-werkstromen voor het maken en beheren van gegevenssets.

Vereisten

De gegevensset downloaden van Studio (klassiek)

De eenvoudigste manier om een Studio-gegevensset (klassiek) te migreren naar Azure Machine Learning, is door uw gegevensset te downloaden en te registreren in Azure Machine Learning. Hiermee maakt u een nieuwe kopie van uw gegevensset en uploadt u deze naar een Azure Machine Learning-gegevensarchief.

U kunt de volgende typen gegevenssets van Studio (klassiek) rechtstreeks downloaden.

  • Tekst zonder opmaak (.txt)
  • Door komma's gescheiden waarden (CSV) met een koptekst (.csv) of zonder (.nh.csv)
  • Door tabs gescheiden waarden (TSV) met een header (.tsv) of zonder (.nh.tsv)
  • Excel-bestand
  • Zip-bestand (.zip)

Gegevenssets rechtstreeks downloaden:

  1. Ga naar uw Studio-werkruimtehttps://studio.azureml.net (klassiek).

  2. Selecteer in de linkernavigatiebalk het tabblad Gegevenssets .

  3. Selecteer de gegevensset(s) die u wilt downloaden.

  4. Selecteer Downloaden in de onderste actiebalk.

    AScreenshot showing how to download a dataset in Studio (classic).

Voor de volgende gegevenstypen moet u de module Converteren naar CSV gebruiken om gegevenssets te downloaden.

  • SVMLight-gegevens (.svmlight)
  • ARFF-gegevens (Attribute Relation File Format) (.arff)
  • R-object of werkruimtebestand (. RData)
  • Gegevenssettype (.data). Het gegevenssettype is het interne gegevenstype Studio (klassiek) voor module-uitvoer.

Uw gegevensset converteren naar een CSV en de resultaten downloaden:

  1. Ga naar uw Studio-werkruimtehttps://studio.azureml.net (klassiek).

  2. Maak een nieuw experiment.

  3. Sleep de gegevensset die u wilt downloaden naar het canvas en zet deze neer.

  4. Voeg een module Converteren naar CSV toe.

  5. Verbinding maken de Converteer naar csv-invoerpoort naar de uitvoerpoort van uw gegevensset.

  6. Voer het experiment uit.

  7. Klik met de rechtermuisknop op de module Converteren naar CSV .

  8. Selecteer Resultatengegevensset>Downloaden.

    Screenshot showing how to setup a convert to CSV pipeline.

Uw gegevensset uploaden naar Azure Machine Learning

Nadat u het gegevensbestand hebt gedownload, kunt u het registreren als een gegevensasset in Azure Machine Learning:

  1. Ga naar Azure Machine Learning-studio

  2. Selecteer Gegevens onder Assets in het linkernavigatievenster. Selecteer Maken op het tabblad Gegevensassets Screenshot highlights Create in the Data assets tab.

  3. Geef uw gegevensasset een naam en een optionele beschrijving. Selecteer vervolgens de optie Tabellair onder Type in de sectie Gegevenssettypen van de vervolgkeuzelijst.

    Notitie

    U kunt OOK ZIP-bestanden uploaden als gegevensassets. Als u een ZIP-bestand wilt uploaden, selecteert u Bestand voor type in de sectie Gegevenssettypen van de vervolgkeuzelijst. Screenshot shows data asset source choices.

  4. Selecteer voor de gegevensbron de optie 'Uit lokale bestanden' om uw gegevensset te uploaden.

  5. Kies voor bestandsselectie eerst waar u uw gegevens wilt opslaan in Azure. U selecteert een Azure Machine Learning-gegevensarchief. Zie Verbinding maken naar opslagservices voor meer informatie over gegevensarchieven. Upload vervolgens de gegevensset die u eerder hebt gedownload.

  6. Volg de stappen om de instellingen en het schema voor het parseren van gegevens voor uw gegevensasset in te stellen.

  7. Zodra u bij de stap Controleren bent, klikt u op Maken op de laatste pagina

Gegevens importeren uit cloudbronnen

Als uw gegevens zich al in een cloudopslagservice bevinden en u uw gegevens op de systeemeigen locatie wilt bewaren. U kunt een van de volgende opties gebruiken:

Opnamemethode Beschrijving
Een Azure Machine Learning-gegevensset registreren Gegevens opnemen uit lokale en online gegevensbronnen (Blob, ADLS Gen1, ADLS Gen2, Bestandsshare, SQL DB).

Hiermee maakt u een verwijzing naar de gegevensbron, die tijdens runtime lazily wordt geëvalueerd. Gebruik deze optie als u deze gegevensset herhaaldelijk opent en geavanceerde gegevensfuncties wilt inschakelen, zoals gegevensversiebeheer en bewaking.
Gegevensmodule importeren Gegevens opnemen uit onlinegegevensbronnen (Blob, ADLS Gen1, ADLS Gen2, Bestandsshare, SQL DB).

De gegevensset wordt alleen geïmporteerd in de huidige ontwerppijplijnuitvoering.

Notitie

Studio-gebruikers (klassiek) moeten er rekening mee houden dat de volgende cloudbronnen niet systeemeigen worden ondersteund in Azure Machine Learning:

  • Hive-query
  • Azure-tabel
  • Azure Cosmos DB
  • On-premises SQL Database

We raden gebruikers aan hun gegevens te migreren naar een ondersteunde opslagservices met behulp van Azure Data Factory.

Een Azure Machine Learning-gegevensset registreren

Gebruik de volgende stappen om een gegevensset te registreren bij Azure Machine Learning vanuit een cloudservice:

  1. Maak een gegevensarchief dat de cloudopslagservice koppelt aan uw Azure Machine Learning-werkruimte.

  2. Registreer een gegevensset. Als u een Studio-gegevensset (klassiek) migreert, selecteert u de instelling tabellaire gegevensset.

Nadat u een gegevensset hebt geregistreerd in Azure Machine Learning, kunt u deze gebruiken in de ontwerpfunctie:

  1. Maak een nieuw ontwerppijplijnconcept.
  2. Vouw in het modulepalet aan de linkerkant de sectie Gegevenssets uit .
  3. Sleep de geregistreerde gegevensset naar het canvas.

De module Gegevens importeren gebruiken

Gebruik de volgende stappen om gegevens rechtstreeks te importeren in uw ontwerppijplijn:

  1. Maak een gegevensarchief dat de cloudopslagservice koppelt aan uw Azure Machine Learning-werkruimte.

Nadat u het gegevensarchief hebt gemaakt, kunt u de module Gegevens importeren in de ontwerpfunctie gebruiken om er gegevens uit op te nemen:

  1. Maak een nieuw ontwerppijplijnconcept.
  2. Zoek in het modulepalet aan de linkerkant de module Gegevens importeren en sleep deze naar het canvas.
  3. Selecteer de module Gegevens importeren en gebruik de instellingen in het rechterdeelvenster om uw gegevensbron te configureren.

Volgende stappen

In dit artikel hebt u geleerd hoe u een Studio-gegevensset (klassiek) migreert naar Azure Machine Learning. De volgende stap bestaat uit het opnieuw bouwen van een Studio-trainingspijplijn (klassiek).

Zie de andere artikelen in de studiomigratiereeks (klassiek):

  1. Overzicht van migratie.
  2. Gegevenssets migreren.
  3. Bouw een trainingspijplijn (klassiek) van Studio opnieuw.
  4. Bouw een Studio-webservice (klassiek) opnieuw op.
  5. Integreer een Azure Machine Learning-webservice met client-apps.
  6. R-script uitvoeren migreren.