Machine Learning modulbeskrivningar

Det här avsnittet innehåller en översikt över alla moduler som ingår i Azure Machine Learning Studio (klassisk), som är en interaktiv, visuell arbetsyta för att enkelt skapa och testa förutsägelsemodeller.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Vad är en modul?

I Machine Learning Studio (klassisk) är en modul ett byggblock för att skapa experiment. Varje modul kapslar in en specifik maskininlärningsalgoritm, funktion eller kodbibliotek som kan agera på data på din arbetsyta. Modulerna är utformade för att acceptera anslutningar från andra moduler för att dela och ändra data.

Koden som körs i varje modul kommer från många källor. Dessa omfattar bibliotek och språk med öppen källkod, algoritmer som utvecklats av Microsoft Research och verktyg för att arbeta med Azure och andra molntjänster.

Tips

Letar du efter maskininlärningsalgoritmer? Se kategorin Machine Learning, som innehåller moduler för beslutsträd, klustring, neurala nätverk med mera. Kategorierna Träna och Utvärdera innehåller moduler som hjälper dig att träna och testa dina modeller.

Genom att ansluta och konfigurera moduler kan du skapa ett arbetsflöde som läser data från externa källor, förbereder dem för analys, tillämpar maskininlärningsalgoritmer och genererar resultat.

När ett experiment är öppet i Machine Learning Studio (klassisk) kan du se en fullständig lista över aktuella moduler i navigeringsfönstret till vänster. Du drar dessa byggstenar till experimentet och ansluter dem sedan för att skapa ett fullständigt arbetsflöde för maskininlärning, som kallas för ett experiment.

Ibland uppdateras moduler för att lägga till nya funktioner eller för att ta bort äldre kod. När detta inträffar fortsätter alla experiment som du har skapat som använder modulen att köras. Nästa gång du öppnar experimentet uppmanas du dock att uppgradera modulen eller att använda en annan modul.

Exempel

Ett exempel på hur du skapar ett fullständigt maskininlärningsexperiment finns i följande självstudier:

Modulkategorier

För att göra det enklare att hitta relaterade moduler grupperas maskininlärningsverktygen i Machine Learning Studio (klassisk) efter dessa kategorier.

Dataformatkonverteringar

Använd de här modulerna för att konvertera data till något av de format som används av andra maskininlärningsverktyg eller -format.

  • Indata och utdata

    Använd de här modulerna för att läsa data och modeller från molndatakällor, inklusive Hadoop-kluster, Azure Table Storage och webb-URL:er. Du kan också använda dessa moduler för att skriva resultat till lagring eller till en databas.

  • Datatransformering

    Använd de här modulerna för att förbereda data för analys. Du kan ändra datatyper, flagga kolumner som funktioner eller etiketter, generera funktioner och skala eller normalisera data.

  • Filter

    Transformera numeriska data som härletts från digital signalbearbetning.

  • Lära dig med antal

    Använd gemensamma sannolikhetsfördelningar för att skapa funktioner som på ett kompakt sätt beskriver stora datamängder.

  • Manipulation

    Den här gruppen innehåller en mängd olika verktyg för datavetenskap. Du kan till exempel ta bort eller ersätta saknade värden, välja en delmängd av kolumner, lägga till en kolumn eller sammanfoga två datauppsättningar.

  • Exempel och delning

    Dividera en datauppsättning med kriterier eller efter storlek, för att skapa tränings- och testuppsättningar eller för att isolera vissa rader.

  • Skala och minska

    Transformera numeriska data.

Val av funktion

Använd de här modulerna för att identifiera de bästa funktionerna i dina data med hjälp av brett utforskade statistiska metoder.

Machine Learning

Den här gruppen innehåller de flesta maskininlärningsalgoritmer som stöds av Machine Learning.

Den innehåller även moduler som är avsedda att stödja algoritmer genom att träna modeller, generera poäng och utvärdera modellprestanda.

  • Utvärdera

    När du har tränat en modell kan du använda dessa verktyg för att mäta modellens noggrannhet.

  • Initiera

    De här modulerna tillhandahåller maskininlärningsalgoritmer som du kan anpassa genom att ange parametrar. Algoritmerna i det här avsnittet är grupperade efter typ:

  • Poäng

    Använd de här modulerna för att skicka nya data via algoritmen och generera en uppsättning resultat för utvärdering. Du kan också använda resultatet av bedömning som en del av en förutsägelsetjänst.

  • Träna

    De här modulerna tränar en initierad maskininlärningsmodell på data som du anger.

OpenCV-biblioteksmoduler

De här modulerna ger dig enkel åtkomst till ett populärt bibliotek med öppen källkod för bildbearbetning och bildklassificering.

R-språkmoduler

Använd de här modulerna för att lägga till anpassad R-kod i experimentet eller implementera en maskininlärningsmodell som baseras på ett R-paket.

Python-språkmoduler

Använd de här modulerna för att lägga till anpassad Python-kod i experimentet.

Statistikfunktioner

Använd de här modulerna för att beräkna sannolikhetsfördelningar, skapa anpassade beräkningar och utföra en mängd andra uppgifter relaterade till numeriska variabler.

Textanalys

Använd de här modulerna för att utföra funktions-hashing och namngiven entitetsigenkänning, eller förbearbeta text med hjälp av bearbetningsverktyg för naturligt språk.

Tidsserie

Använd de här modulerna för att utvärdera avvikelser i trender med hjälp av algoritmer som är särskilt utformade för tidsseriedata.

Machine Learning Studio-moduler (klassisk) försöker inte duplicera dataintegreringsverktyg som stöds i andra verktyg, till exempel Azure Data Factory. Modulerna innehåller i stället funktioner som är specifika för maskininlärning:

  • Normalisering, gruppering och skalning av data
  • Beräkning av statistisk fördelning av data
  • Konvertering till andra maskininlärningsformat
  • Import av data som används för maskininlärningsexperiment och export av resultat
  • Textanalys, funktionsval och minskning av antalet dimensioner

Om du behöver mer avancerade funktioner för datamanipulering och lagring kan du läsa följande:

Se även