Kolomtransformatie selecteren

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Hiermee maakt u een transformatie waarmee dezelfde subset van kolommen wordt geselecteerd als in de opgegeven gegevensset

Categorie: Gegevenstransformatie/manipulatie

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

In dit artikel wordt beschreven hoe u de module Kolommen transformeren selecteren in Machine Learning Studio (klassiek) gebruikt. Het doel van de module Kolommen transformeren selecteren is ervoor te zorgen dat er altijd een voorspelbare, consistente set kolommen wordt gebruikt in downstream machine learning bewerkingen.

Deze module is met name handig voor taken zoals scoren, waarvoor specifieke kolommen zijn vereist. Wijzigingen in de beschikbare kolommen kunnen het experiment breken of de resultaten wijzigen.

U gebruikt de transformatie Kolommen selecteren om een set kolommen te maken en op te slaan. Gebruik vervolgens de module Transformatie toepassen om deze selecties toe te passen op nieuwe gegevens.

Kolommen transformeren gebruiken

In dit scenario wordt ervan uitgenomen dat u functieselectie wilt gebruiken om een dynamische set kolommen te genereren die wordt gebruikt voor het trainen van een model. Om ervoor te zorgen dat kolomselecties hetzelfde zijn voor het scoreproces, gebruikt u de module Kolommen transformeren selecteren om de kolomselecties vast te leggen en ze elders in het experiment toe te passen.

  1. Voeg een invoerset toe aan uw experiment in Studio (klassiek).

  2. Voeg een exemplaar van Functieselectie op basis van filters toe.

  3. Verbinding maken modules en configureer de functieselectiemodule om automatisch een aantal beste functies in de invoerset te vinden.

  4. Voeg een exemplaar van Train Model toe en gebruik de uitvoer van Filter Based Feature Selection als invoer voor de training.

    Belangrijk

    Omdat het belang van de functie wordt bepaald op basis van de waarden in de kolom, kunt u niet van tevoren weten welke kolommen beschikbaar zijn voor invoer voor Train Model.

  5. Voeg nu een exemplaar van de module Kolommen transformeren selecteren toe.

    Hiermee wordt een kolomselectie gegenereerd als een transformatie die kan worden opgeslagen of toegepast op andere gegevenssets. Deze stap zorgt ervoor dat de kolommen die worden geïdentificeerd door functieselectie, worden opgeslagen voor hergebruik door andere modules.

  6. Voeg de module Score Model toe.

    Maak geen verbinding met de invoerset.

    Voeg in plaats daarvan de module Transformatie toepassen toe en verbind de uitvoer van de functieselectietransformatie.

    Belangrijk

    U kunt niet verwachten dat u Filter Based Feature Selection kunt toepassen op de score-gegevensset en dezelfde resultaten krijgt. Omdat functieselectie is gebaseerd op waarden, kan deze een andere set kolommen kiezen, waardoor de scoring-bewerking mislukt.

  7. Voer het experiment uit.

Dit proces van het opslaan en vervolgens toepassen van een kolomselectie zorgt ervoor dat hetzelfde gegevensschema beschikbaar is voor training en scoren.

Voorbeelden

Zie de volgende informatie voor voorbeelden van het gebruik van Azure AI Gallery:

Verwachte invoer

Naam Type Description
Gegevensset met gewenste kolommen Gegevenstabel Gegevensset met gewenste set kolommen

Uitvoerwaarden

Naam Type Description
Selectietransformatie voor kolommen ITransform-interface Transformatie waarmee dezelfde subset van kolommen wordt geselecteerd als in de opgegeven gegevensset.

Uitzonderingen

Uitzondering Description
Fout 0003 Uitzondering treedt op als een of meer invoer null of leeg zijn.

Zie ook

Manipulatie
Kolommen in gegevensset selecteren