Tabel aantal importeren

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Hiermee importeert u een eerder gemaakte tabel met tellingen

Categorie: Learning met tellingen

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Import Count Table in Machine Learning Studio (klassiek) gebruikt.

Het doel van de module Import Count Table is om klanten die een tabel met statistieken op basis van tellingen hebben gemaakt met behulp van een eerdere versie van Machine Learning hun experiment te upgraden. In deze module worden de bestaande teltabellen samengevoegd met nieuwe gegevens.

Zie Voor algemene informatie over het aantal tabellen en hoe ze worden gebruikt om functies te maken, Learning met tellingen.

Belangrijk

Deze module is uitsluitend bedoeld voor achterwaartse compatibiliteit met experimenten die gebruikmaken van de afgeschafte Build Count Table en afgeschafte Count Featurizer-modules. U wordt aangeraden uw experiment bij te werken om de nieuwere modules te gebruiken, zodat u kunt profiteren van nieuwe functies.

Voor alle nieuwe experimenten raden we u aan de volgende modules te gebruiken:

Import count table configureren

  1. Open Machine Learning Studio (klassiek) een experiment met een count-tabel die is gemaakt met behulp van de afgeschafte module Build Count Table.

  2. Voeg de module Import Count Table toe aan het experiment.

  3. Verbinding maken uitvoer van de module Build Count Table (afgeschaft) toe aan de overeenkomende invoerpoorten van de Import Count Table.

    Als u een andere gegevensset met tellingen hebt die u wilt samenvoegen met de geïmporteerde count-tabel, verbindt u deze met de meest rechtse invoer voor de module Import Count Table .

  4. Gebruik de optie Teltype om op te geven waar en hoe de teltabel wordt opgeslagen:

    • Gegevensset: de gegevens die worden gebruikt voor het bouwen van tellingen, worden opgeslagen als een gegevensset in Machine Learning Studio (klassiek).

    • Blob: De gegevens die worden gebruikt om tellingen te bouwen, worden opgeslagen als een blok-blob in Windows Azure-opslag.

    • MapReduce: de gegevens die worden gebruikt om tellingen te bouwen, worden opgeslagen als een blob in Windows Azure-opslag.

      Deze optie heeft doorgaans de voorkeur voor zeer grote gegevenssets. Als u toegang wilt krijgen tot de tellingen, moet u het HDInsight-cluster activeren. Er wordt een MapReduce-taak gestart om de telling uit te voeren. Voor beide activiteiten kunnen opslag- en rekenkosten in rekening worden brengen.

      Zie HDInsight op Azure voor meer informatie.

    Nadat u de gegevensopslagmodus hebt opgegeven, moet u mogelijk aanvullende verbindingsgegevens voor de gegevens opgeven, zelfs als u eerder een module Gegevens importeren in het experiment hebt gebruikt om toegang te krijgen tot gegevens. Dat komt doordat de module Count Featurizer (afgeschaft) afzonderlijk toegang heeft tot de gegevensopslag om de gegevens te lezen en de vereiste tabellen te bouwen.

  5. Gebruik de optie Tabeltype tellen om de indeling en opslagmodus op te geven van de tabel die wordt gebruikt voor het opslaan van tellingen.

    • Woordenlijst: maakt gebruik van een woordenlijsttellingstabel.

      Alle kolomwaarden in de geselecteerde kolommen worden behandeld als tekenreeksen en worden gehasht met behulp van een bit-matrix van maximaal 31 bits. Daarom worden alle kolomwaarden vertegenwoordigd door een niet-negatief 32-bits geheel getal.

    • CMSketch: maakt gebruik van een tabel die is opgeslagen in de minimale tekentabel aantal.

      Met deze indeling worden meerdere onafhankelijke hash-functies met een kleiner bereik gebruikt om de geheugenefficiëntie te verbeteren en de kans op hash-bots te verminderen.

    Over het algemeen moet u de optie Woordenlijst gebruiken voor kleinere gegevenssets (<1 GB) en de optie CMSketch gebruiken voor grotere gegevenssets.

  6. Voer het experiment uit.

  7. Wanneer u klaar is, klikt u met de rechtermuisknop op de uitvoer van de module Import Count Table , selecteert u Opslaan als transformatie en typt u een naam voor de transformatie. Wanneer u dit doet, worden de samengevoegde tellingstabellen en eventuele featurization-parameters die u mogelijk hebt toegepast, opgeslagen in een indeling die kan worden toegepast op een nieuwe gegevensset.

Voorbeelden

Bekijk voorbeelden van op count gebaseerde featurization met behulp van deze voorbeeldexperimenten in de Azure AI Gallery:

Notitie

Deze galerieexperimenten zijn allemaal gemaakt met behulp van de eerdere en nu afgeschafte versie van de Learning met counts-modules. Wanneer u het experiment opent in Studio (klassiek), wordt het experiment automatisch bijgewerkt om de nieuwere modules te gebruiken.

Verwachte invoer

Naam Type Description
Metagegevens tellen Gegevenstabel De metagegevens van de tellingen
Tabel aantal Gegevenstabel De tabel Count
Getelde gegevensset Gegevenstabel De gegevensset die wordt gebruikt voor het tellen

Moduleparameters

Naam Type Bereik Optioneel Standaard Beschrijving
Teltype CountingType Vereist Het teltype

Uitvoerwaarden

Naam Type Description
Transformatie tellen ITransform-interface De teltransformator

Uitzonderingen

Uitzondering Description
Fout 0003 Uitzondering treedt op als een of meer invoer null of leeg zijn.
Fout 0018 Er treedt een uitzondering op als de invoerset ongeldig is.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Learning met counts