Ändra tabellparametrar för antal

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Ändrar de parametrar som används för att skapa funktioner från antal

Kategori: Learning med antal

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Ändra antal tabellparametrar i Machine Learning Studio (klassisk) för att ändra hur funktioner genereras från en count-tabell.

För att skapa antalsbaserade funktioner använder du i allmänhet Byggräkningstransform för att bearbeta en datauppsättning och skapa en antalstabell, och från den antalstabellen genererar du en ny uppsättning funktioner.

Men om du redan har skapat en antalstabell kan du använda modulen Ändra antal tabellparametrar för att redigera definitionen av hur antal data bearbetas. På så sätt kan du skapa en annan uppsättning count-baserad statistik baserat på befintliga data, utan att behöva analysera datauppsättningen på nytt.

Så här konfigurerar du parametrar för att ändra antal

  1. Leta upp den transformering som du vill ändra i gruppen Transformeringar och lägg till den i experimentet.

    Du bör tidigare ha kört ett experiment som skapade en count-transformering.

    • Ändra en sparad transformering: Leta upp transformeringen i gruppen Transformeringar och lägg till den i experimentet.

    • Ändra en omvandling av antal som skapats i samma experiment: Om omvandlingen inte har sparats, men är tillgänglig som utdata i det aktuella experimentet (till exempel kontrollera utdata från modulen Byggräkningstransformering), kan du använda den direkt genom att ansluta modulerna.

  2. Lägg till modulen Modify Count Table Parameters (Ändra antal tabellparametrar) och anslut transformeringen som indata.

  3. I fönstret Egenskaper i modulen Modify Count Table Parameters ( Ändra antal tabellparametrar) anger du ett värde som ska användas som tröskelvärde förgarbage bin.

    Det här värdet anger det minsta antal förekomster som måste hittas för varje funktionsvärde för att antal ska kunna användas. Om värdets frekvens är mindre än tröskelvärdet för skräplager räknas inte värdeetikettparet som ett diskret objekt. I stället placeras alla objekt med värden som är lägre än tröskelvärdet i ett enda "skräplager".

    Om du använder en liten datamängd och du räknar och tränar på samma data är ett bra startvärde 1.

  4. För Ytterligare tidigare pseudoexempel skriver du ett tal som anger antalet ytterligare pseudoexempel som ska inkluderas. Du behöver inte ange de här exemplen. pseudoexempel genereras baserat på den tidigare fördelningen.

  5. För Lapiansk brusskala anger du ett positivt flyttalsvärde som representerar skalan som används för att introducera brus som samplas från en lapiansk distribution. När du anger ett skalningsvärde införlivas en viss acceptabel brusnivå i modellen, så det är mindre troligt att modellen påverkas av ouppnåeliga värden i data.

  6. I Utdatafunktioner inkluderar väljer du den metod som ska användas när du skapar antalsbaserade funktioner för inkludering i transformeringen.

    • CountsOnly: Skapa funktioner med hjälp av antal.

    • LogOddsOnly: Skapa funktioner med hjälp av loggen för riskförhållandet.

    • BothCountsAndLogOdds: Skapa funktioner med både antal och loggoder.

  7. Välj alternativet Ignorera back off-kolumn om du vill åsidosätta flaggan i IsBackOff utdata när du skapar funktioner. När du väljer det här alternativet skapas antalsbaserade funktioner även om kolumnen inte har några betydande antal värden.

  8. Kör experimentet. Du kan sedan spara utdata från Ändra antal tabellparametrar som en ny transformering om du vill.

Exempel

Exempel på hur den här modulen finns i Azure AI Gallery:

  • Learning med antal: Binär klassificering: Visar hur du använder inlärningen med moduler för antal för att generera funktioner från kolumner med kategoriska värden för en binär klassificeringsmodell.

  • Learning med antal: Klassificering med flera klasser med taxidata från NEWC:exempel Visar hur du använder inlärningen med antal moduler för att utföra multiklassklassificering på den offentligt tillgängliga taxidatamängden i New York. Exemplet använder en logistisk regressions learner med flera klasser för att modellera det här problemet.

  • Learning med antal: Binär klassificering med NYC-taxidata: Visar hur du använder inlärningen med antal moduler för att utföra binär klassificering på den offentligt tillgängliga newc-taxidatamängden. Exemplet använder en logistisk regressions learner med två klasser för att modellera det här problemet.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Det är statistiskt säkert att räkna och träna på samma datauppsättning om du anger parametern Lapians brusskala.

Förväntade indata

Namn Typ Description
Räkna transformering ITransform-gränssnitt Beräkningstransformeringen som ska tillämpas

Modulparametrar

Namn Typ Intervall Valfritt Standardvärde Description
Tröskelvärde för skräplager Float >= 0,0f Obligatorisk 10.0f Tröskelvärdet under vilket ett kolumnvärde kommer att visas mot skräpfacket
Ytterligare tidigare pseudoexempel Float >= 0,0f Obligatorisk 42.0f De ytterligare pseudoexempel som följer efter tidigare distributioner som ska tas med
Lapiansk brusskala Float >= 0,0f Obligatorisk 0.0f Skalan för den lapianska fördelning som bruset samplas från
Utdatafunktioner omfattar OutputFeatureType Obligatorisk BothCountsAndLogOdds Funktionerna som ska matas ut
Ignorera back off-kolumn Boolesk Obligatorisk falskt Om du vill ignorera kolumnen IsBackOff i utdata

Utdata

Namn Typ Description
Ändrad transformering ITransform-gränssnitt Den ändrade transformeringen

Undantag

Undantag Description
Fel 0003 Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0086 Undantag inträffar när en beräkningstransformering är ogiltig.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Learning med antal