Změnit parametry tabulky Count

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Upraví parametry používané k vytváření funkcí z počtů.

kategorie: Učení s počty

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak pomocí modulu parametry tabulky pro úpravu počtu v aplikaci Machine Learning Studio (classic) změnit způsob, jakým se funkce generují z tabulky Count.

Obecně platí, že pokud chcete vytvořit funkce založené na počtu, použijte transformaci počítání sestavení ke zpracování datové sady a vytvoření tabulky Count a z této tabulky Count Vygenerujte novou sadu funkcí.

Pokud jste však již vytvořili tabulku Count, můžete k úpravě definice způsobu zpracování dat počtu použít modul parametry tabulky pro úpravu počtu . To vám umožní vytvořit na základě stávajících dat jinou sadu statistik založených na počtu, aniž byste museli znovu analyzovat datovou sadu.

Postup konfigurace parametrů změnit počet

  1. Najděte transformaci, kterou chcete upravit, ve skupině transformes a přidejte ji do experimentu.

    Dříve byste měli spustit experiment, který vytvořil transformaci počtu.

    • Úprava uložené transformace: Najděte transformaci ve skupině transformes a přidejte ji do experimentu.

    • Chcete-li upravit transformaci počtu vytvořenou v rámci stejného experimentu: Pokud transformace nebyla uložena, ale je k dispozici jako výstup v rámci aktuálního experimentu (například, podívejte se do výstupu modulu pro inventarizaci sestavení ), můžete ho použít přímo propojením modulů.

  2. Přidejte modul parametrů tabulky pro úpravu počtu a připojte transformaci jako vstup.

  3. V podokně vlastnosti modulu parametry tabulky pro úpravu počtu zadejte hodnotu, která se má použít jakoprahová hodnota pro zásobník paměti.

    Tato hodnota určuje minimální počet výskytů, které musí být nalezeny pro každou hodnotu funkce, aby bylo možné použít počty. Pokud je frekvence hodnoty menší než prahová hodnota paměti, dvojice popisek hodnoty se nepočítá jako diskrétní položka; místo toho jsou všechny položky s počty nižšími než prahová hodnota umístěna v jednom "paměti".

    Pokud používáte malou datovou sadu a provádíte počítání a školení pro stejná data, dobrá počáteční hodnota je 1.

  4. Pro Další příklady příkazů pseudozadejte číslo, které označuje počet dalších pseudo příkladů, které mají být zahrnuty. Tyto příklady nemusíte zadávat. pseudo příklady jsou generovány na základě předchozí distribuce.

  5. U Laplacian škály šumuzadejte kladnou hodnotu s plovoucí desetinnou čárkou, která představuje měřítko, které se používá pro představení ukázek hluku z distribuce Laplacian. Když nastavíte hodnotu škálování, bude do modelu začleněna určitá přijatelná úroveň hluku, takže model bude méně pravděpodobný vlivem nezobrazených hodnot v datech.

  6. V části výstupní funkcevyberte metodu, která má být použita při vytváření funkcí založených na čítačích pro zahrnutí do transformace.

    • CountsOnly: vytváření funkcí pomocí počtů.

    • LogOddsOnly: Vytvořte funkce pomocí protokolu poměru lichá.

    • BothCountsAndLogOdds: Vytvářejte funkce pomocí obou počtů i log lichá.

  7. Vyberte možnost Ignorovat sloupec , pokud chcete při vytváření funkcí přepsat IsBackOff příznak ve výstupu. Když vyberete tuto možnost, funkce založené na počtu se vytvoří i v případě, že sloupec nemá významné hodnoty počtu.

  8. Spusťte experiment. Pak můžete v případě potřeby uložit výstup parametrů tabulky pro úpravu počtu jako novou transformaci.

Příklady

Příklady toho, jak tento modul najdete Azure AI Gallery:

  • Učení with counts: binární klasifikace: ukazuje, jak používat moduly učení s počty, abyste vygenerovali funkce ze sloupců hodnot kategorií pro binární klasifikační model.

  • Učení with counts: třídy NYC taxislužby data: ukázka ukazuje, jak používat moduly Learning s počty pro provádění klasifikace s více třídami na veřejně dostupné datové sadě NYC taxislužby. Ukázka používá k modelování tohoto problému více tříd logistické regrese.

  • Učení with counts: binární klasifikace s NYC taxislužby daty: ukazuje, jak používat moduly učení s počty pro provádění binární klasifikace na veřejně dostupné datové sadě NYC taxislužby. V ukázce se k modelování tohoto problému používá se dvěma třídami logistické regrese.

Technické poznámky

Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.

Pokud nastavíte parametr Laplacian Noise Scale, je statisticky bezpečným počtem a vlakem se stejnou datovou sadou.

Očekávané vstupy

Název Typ Description
Počítání transformace Rozhraní ITransform Výpočet transformace, která se má použít

Parametry modulu

Název Typ Rozsah Volitelné Výchozí Description
Prahová hodnota pro zásobník paměti Float >= 0.0 f Vyžadováno 10.0 f Prahová hodnota, pod kterou bude hodnota sloupce natrénuje proti přihrádce paměti
Další příklady předchozích pseudo Float >= 0.0 f Vyžadováno 42.0 f Další pseudo příklady, které následují předchozí distribuce, které mají být zahrnuty
Laplacian stupnice hluku Float >= 0.0 f Vyžadováno 0,0 f Měřítko distribuce Laplacian, ze které se předává ukázka šumu
Mezi funkce výstupu patří OutputFeatureType Vyžadováno BothCountsAndLogOdds Funkce pro výstup
Ignorovat sloupec pro obnovení Logická hodnota Vyžadováno false (nepravda) Zda se má ignorovat sloupec IsBackOff ve výstupu

Výstupy

Název Typ Description
Upravená transformace Rozhraní ITransform Upravená transformace

Výjimky

Výjimka Description
Chyba 0003 K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné.
Chyba 0086 K výjimce dojde, pokud je transformace počítání neplatná.

seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.

seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.

Viz také

Učení s počty