Transformering av sammanfognings antal

Skapar en uppsättning funktioner baserat på en antal tabeller

Kategori: inlärning med antal

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Översikt över modul

Den här artikeln beskriver hur du använder Transform -modulen sammanslagning i Azure Machine Learning Studio (klassisk) för att kombinera två uppsättningar med räknade funktioner. Genom att slå samman två uppsättningar av relaterade antal och funktioner kan du eventuellt förbättra täckningen och distributionen av funktionerna.

Inlärning från antal är särskilt användbart i stora data mängder med funktioner för hög kardinalitet. Möjligheten att kombinera flera data uppsättningar i Count-baserade funktions uppsättningar utan att behöva bearbeta data uppsättningarna gör det enklare att samla in statistik på mycket stora data uppsättningar och tillämpa dem på nya data uppsättningar. Till exempel kan Count-tabeller användas för att samla in information över terabyte data. Du kan använda den här statistiken igen för att förbättra noggrannheten i förutsägande modeller på små data mängder.

Om du vill sammanfoga två uppsättningar med Count-baserade funktioner måste funktionerna ha skapats med tabeller som har samma schema: det vill säga båda uppsättningarna måste använda samma kolumner och ha samma namn och data typer.

Så här konfigurerar du transformering av sammanslagnings antal

  1. Om du vill använda transformering av sammanslagna antal måste du skapa minst en räknad omvandling och den omvandlingen måste finnas i din arbets yta. Om du har sparat en räknad omvandling från ett annat experiment tittar du i gruppen Transforms . Om du har skapat omvandlingen i det aktuella experimentet ansluter du utdata för följande moduler:

  2. Lägg till transformeringen sammanslagnings antal i experimentet och Anslut en omvandling till varje inmatad.

    Tips

    Den andra omvandlingen är en valfri Indatatyp – du kan ansluta samma transformering två gånger eller ansluta ingenting på den andra Indataporten.

  3. Om du inte vill att den andra data mängden ska vägas lika med det första anger du ett värde för minsknings faktorn. Värdet som du anger anger hur uppsättningen funktioner från den andra omvandlingen ska vägas.

    Standardvärdet 1 viktar till exempel båda uppsättningarna med funktioner lika. Värdet 0,5 innebär att funktionerna i den andra uppsättningen har hälften av vikten av de i den första uppsättningen.

  4. Du kan också lägga till en instans av modulen Använd omvandling och tillämpa omvandlingen på en data uppsättning.

Exempel

Exempel på hur den här modulen används finns i Azure AI Gallery:

  • Inlärning med antal: binära klassificering: visar hur du använder modulerna inlärning med antal för att generera funktioner från kolumner med kategoriska-värden för en binär klassificerings modell.

  • Inlärning med antal: multiklass-klassificering med NYC taxi-data: visar hur du använder modulerna inlärning med antal för att utföra multiklass-klassificering på den offentligt tillgängliga NYC taxi-datauppsättningen. Exemplet använder en logistisk Regressions Regressions Regressions modell för att modellera det här problemet.

  • Inlärning med antal: binära klassificering med NYC taxi-data: visar hur du använder modulerna inlärning med antal för att utföra binära klassificeringar på den offentligt tillgängliga NYC taxi-datauppsättningen. Exemplet använder en logistik Regressions Regressions modell med två klasser för att modellera problemet.

Förväntade indata

Namn Typ Beskrivning
Transformering av föregående räkning ITransform-gränssnitt Transformeringen i beräkningen som ska redige ras
Transformering av ny räkning ITransform-gränssnitt Den beräknings transformering som ska läggas till (valfritt)

Parametrar för modul

Namn Typ Intervall Valfritt Beskrivning Standardvärde
Minsknings faktor Float Obligatorisk 1,0 f Minsknings faktorn som ska multipliceras med uppräknings omvandlingen i rätt dataport

Utdata

Namn Typ Beskrivning
Transformering av sammanfogad räkning ITransform-gränssnitt Den sammanfogade transformeringen

Undantag

Undantag Beskrivning
Fel 0003 Undantag uppstår om en eller flera indata är null eller tomma.
Fel 0086 Ett undantag inträffar när en räknings omvandling är ogiltig.

Se även

Inlärning med antal