Tabell för antal import

Importerar en tidigare skapad tabell med antal

Kategori: Inlärning med antal

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra och släpp-moduler har lagts till i Azure Machine Learning designer. Läs mer i den här artikeln om att jämföra de två versionerna.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Import Count Table i Azure Machine Learning Studio (klassisk).

Syftet med modulen Import Count Table (Importantaltabell) är att låta kunder som har skapat en tabell med count-baserad statistik med hjälp av en tidigare version av Azure Machine Learning att uppgradera sina experiment. Den här modulen sammanfogar de befintliga count-tabellerna med nya data.

Allmän information om antalstabeller och hur de används för att skapa funktioner finns i Inlärning med antal.

Viktigt

Den här modulen tillhandahålls enbart för bakåtkompatibilitet med experiment som använder den inaktuella buildantaltabellen och inaktuella moduler för Count Featurizer. Vi rekommenderar att du uppgraderar experimentet för att använda de nya modulerna för att dra nytta av nya funktioner.

För alla nya experiment rekommenderar vi att du använder följande moduler:

Så här konfigurerar du importantalstabell

  1. I Azure Machine Learning Studio (klassisk) öppnar du ett experiment som innehåller en count-tabell som skapats med hjälp av den inaktuella modulen Build Count Table.

  2. Lägg till modulen Import Count Table (Importantaltabell) i experimentet.

  3. Anslut de två utdata från modulen Build Count Table (inaktuell) till matchande indataportar i importantalstabellen.

    Om du har en annan datauppsättning med antal som du vill sammanfoga med den importerade count-tabellen ansluter du den till indata längst till höger för modulen Import Count Table.

  4. Använd alternativet Inventeringstyp för att ange var och hur count-tabellen lagras:

    • Datauppsättning: De data som används för att skapa antal sparas som en datauppsättning i Azure Machine Learning Studio (klassisk).

    • Blob: De data som används för att skapa antal lagras som en blockblob i Windows Azure Storage.

    • MapReduce: De data som används för att skapa antal lagras som en blob i Windows Azure Storage.

      Det här alternativet rekommenderas vanligtvis för mycket stora datamängder. För att komma åt antalet måste du aktivera HDInsight-klustret. Ett MapReduce-jobb startas för att utföra inventeringen. Båda dessa aktiviteter kan medföra kostnader för lagring och beräkning.

      Mer information finns i HDInsight på Azure.

    När du har specificerat datalagringsläget kan du behöva ange ytterligare anslutningsinformation för data, även om du tidigare använde en Import Data-modul i experimentet för att komma åt data. Det beror på att modulen Count Featurizer (inaktuell) kommer åt datalagringen separat för att kunna läsa data och skapa de tabeller som krävs.

  5. Använd alternativet Antal tabelltyper för att ange format och lagringsläge för den tabell som används för att lagra antal.

    • Ordlista: Använder en tabell för ordlisteantal.

      Alla kolumnvärden i de valda kolumnerna behandlas som strängar och hashas med hjälp av en bitmatris med en storlek på upp till 31 bitar. Därför representeras alla kolumnvärden av ett icke-negativt 32-bitars heltal.

    • CMSketch: Använder en tabell som sparats i minsta skisstabell för antal.

      Med det här formatet används flera oberoende hash-funktioner med ett mindre intervall för att förbättra minneseffektiviteten och minska risken för hash-kollisioner.

    I allmänhet bör du använda ordlistealternativet för mindre datamängder (<1 GB) och använda cmsketch-alternativet för större datamängder.

  6. Kör experimentet.

  7. När du är klar högerklickar du på utdata för modulen Importera antal tabeller, väljer Spara som transformering och skriver ett namn för transformeringen. När du gör detta sparas de sammanslagna antalstabellerna och eventuella featuriseringsparametrar som du har tillämpat i ett format som kan tillämpas på en ny datauppsättning.

Exempel

Utforska exempel på count-baserad featurization med hjälp av dessa exempelexperiment i Azure AI Gallery:

Anteckning

Alla dessa galleriexperiment har skapats med hjälp av den tidigare och nu inaktuella versionen av modulerna Inlärning med antal. När du öppnar experimentet i Studio (klassisk) uppgraderas experimentet automatiskt för att använda de nyare modulerna.

Förväntade indata

Namn Typ Description
Räkna metadata Datatabell Metadata för antalen
Antalstabell Datatabell Antalstabellen
Räknad datauppsättning Datatabell Den datauppsättning som används för att räkna

Modulparametrar

Namn Typ Intervall Valfritt Standardvärde Description
Inventeringstyp CountingType Obligatorisk Inventeringstyp

Utdata

Namn Typ Description
Räkna transformering ITransform-gränssnitt Beräkningstransformeringen

Undantag

Undantag Description
Fel 0003 Undantaget inträffar om en eller flera indata är null eller tomma.
Fel 0018 Undantaget inträffar om indatauppsättningen inte är giltig.

En lista över fel som är specifika för Studio-moduler (klassisk) finns i Machine Learning felkoder.

En lista över API-undantag finns i Machine Learning REST API felkoder.

Se även

Lära dig med antal