Trans formatie aantal samen voegingen

Hiermee maakt u een set functies op basis van de tabel counts

Categorie: leren met aantallen

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u in Azure Machine Learning Studio (klassiek) de module aantal samen voegingen kunt gebruiken om twee sets onderdelen op basis van aantallen te combi neren. Door twee sets gerelateerde aantallen en functies samen te voegen, kunt u de dekking en distributie van de functies mogelijk verbeteren.

Leren van aantallen is met name handig voor grote gegevens sets met functies voor hoge kardinaliteit. De mogelijkheid om meerdere gegevens sets te combi neren in functie sets op basis van tellers zonder dat u de gegevens sets opnieuw hoeft te verwerken, maakt het gemakkelijker om statistieken op zeer grote gegevens sets te verzamelen en toe te passen op nieuwe gegevens sets. Tabellen met aantallen kunnen bijvoorbeeld worden gebruikt voor het verzamelen van informatie over terabytes aan gegevens. U kunt deze statistieken opnieuw gebruiken om de nauw keurigheid van voorspellende modellen in kleine gegevens sets te verbeteren.

Voor het samen voegen van twee sets onderdelen op basis van aantallen moeten de functies zijn gemaakt met behulp van tabellen die hetzelfde schema hebben: dat wil zeggen dat beide sets dezelfde kolommen moeten gebruiken en dezelfde namen en gegevens typen hebben.

Trans formatie voor aantal samen voegingen configureren

  1. Als u de trans formatie aantal samen voegingenwilt gebruiken, moet u ten minste één op Count gebaseerde trans formatie hebben gemaakt en moet deze trans formatie aanwezig zijn in uw werk ruimte. Als u een trans formatie op basis van tellers van een ander experiment hebt opgeslagen, kijkt u in de groep transforms . Als u de trans formatie in het huidige experiment hebt gemaakt, koppelt u de uitvoer van de volgende modules:

    • Bouw trans formatie. Hiermee maakt u een nieuwe trans formatie op basis van het aantal en de bron gegevens.

    • Wijzig de para meters voor het aantal tabellen. Neemt een bestaande trans formatie als invoer en voert een bijgewerkte trans formatie uit.

    • Importeer de tabel Count. Deze module ondersteunt achterwaartse compatibiliteit met oudere experimenten die op tellingen op basis van tellers worden gebruikt. Als u de tabel aantal importeren hebt gebruikt om de distributie van waarden in een gegevensset te analyseren en vervolgens de waarden hebt geconverteerd naar functies met behulp van de afgeschafte Count Featurizer module, gebruikt u de tabel aantal importeren om de resultaten te converteren naar een trans formatie.

  2. Voeg het transformatie module aantal samen voegingen toe aan het experiment en Verbind een trans formatie met elke invoer.

    Tip

    De tweede trans formatie is een optionele invoer: u kunt dezelfde trans formatie twee keer verbinden of niets verbinden met de tweede invoer poort.

  3. Als u niet wilt dat de tweede gegevensset gelijk wordt gewogen met de eerste, geeft u een waarde op voor de verval factor. De waarde die u typt, geeft aan hoe de set functies van de tweede trans formatie moet worden gewogen.

    De standaard waarde van 1 vergelijkt bijvoorbeeld beide sets met functies. Een waarde van 0,5 betekent dat de functies in de tweede set de helft van het gewicht van die in de eerste set zouden hebben.

  4. U kunt eventueel een exemplaar van de module Apply trans formatie toevoegen en de trans formatie Toep assen op een gegevensset.

Voorbeelden

Voor voor beelden van hoe deze module wordt gebruikt, raadpleegt u de Azure AI Gallery:

  • Leren met aantallen: binaire classificatie: demonstreert hoe u de modules Learning with Count gebruikt voor het genereren van functies uit kolommen met categorische-waarden voor een binair classificatie model.

  • Leren met aantallen: classificatie met meer klassen met NYC taxi-gegevens: demonstreert hoe u het leer proces met Count-modules gebruikt voor het uitvoeren van een multi klasse-classificatie op de openbaar beschik bare NYC-gegevensset. In het voor beeld wordt gebruikgemaakt van een logistiek-regressie cursus met een multi klasse om dit probleem te model leren.

  • Leren met aantallen: binaire classificatie met NYC taxi-gegevens: demonstreert hoe u het leer proces met Count-modules gebruikt voor het uitvoeren van een binaire classificatie op de openbaar beschik bare NYC-gegevensset. In het voor beeld wordt een logistiek-regressie met twee klassen gebruikt om het probleem te model leren.

Verwachte invoer

Naam Type Beschrijving
Vorige telling trans formatie ITransform-interface De te bewerken trans formatie
Nieuwe telling trans formatie ITransform-interface De trans formatie die moet worden toegevoegd (optioneel)

Module parameters

Naam Type Bereik Optioneel Beschrijving Standaard
Verval factor Drijvendekommagetal Vereist 1.0 f De verval factor die moet worden vermenigvuldigd met de trans formatie tellen bij de juiste invoer poort

Outputs

Naam Type Beschrijving
Samengevoegde tellings transformatie ITransform-interface De samengevoegde trans formatie

Uitzonderingen

Uitzondering Beschrijving
Fout 0003 Uitzonde ring treedt op als een of meer invoer waarden null of leeg zijn.
Fout 0086 Uitzonde ring treedt op wanneer een telling van een trans formatie ongeldig is.

Zie ook

Leren met aantallen