Tabel met aantal importeren

Hiermee wordt een eerder gemaakte tabel met tellingen geïmporteerd

Categorie: leren met aantallen

Notitie

Van toepassing op : machine learning Studio (klassiek)

Deze inhoud is alleen van toepassing op Studio (klassiek). Er zijn Vergelijk bare modules voor slepen en neerzetten toegevoegd aan Azure Machine Learning Designer. In dit artikel vindt u meer informatie over de twee versies.

Module overzicht

In dit artikel wordt beschreven hoe u de module aantal importeren tabel in azure machine learning Studio (klassiek) gebruikt.

Het doel van de module voor het importeren van tellingen is het toestaan van klanten die een tabel met op tellingen gebaseerde statistieken hebben gemaakt met behulp van een eerdere versie van Azure machine learning om hun experiment bij te werken. Deze module voegt de bestaande Count-tabellen samen met nieuwe gegevens.

Zie Learning withcounts (Engelstalig) voor algemene informatie over het tellen van tabellen en hoe deze worden gebruikt om functies te maken.

Belangrijk

Deze module wordt alleen gebruikt voor achterwaartse compatibiliteit met experimenten die gebruikmaken van de afgeschafte tabel build Count en Featurizer modules met afgeschaft aantal. U kunt het experiment het beste upgraden naar de nieuwere modules om te profiteren van nieuwe functies.

Voor alle nieuwe experimenten raden we u aan de volgende modules te gebruiken:

Tabel met import aantallen configureren

  1. Open in Azure Machine Learning Studio (klassiek) een experiment met een aantal tabellen die zijn gemaakt met behulp van de tabel module voor afgeschafte buildnummers.

  2. Voeg de module aantal import tabellen toe aan het experiment.

  3. Verbind de twee uitvoer van de module samenstel aantal tabellen (afgeschaft) met de overeenkomende invoer poorten van de tabel import Count.

    Als u een andere gegevensset hebt van aantallen die u wilt samen voegen met de tabel aantal geïmporteerde items, verbindt u deze met de meest rechtse invoer voor de module aantal import-tabellen .

  4. Gebruik de optie voor het type tellen om op te geven waar en hoe de aantal tabellen worden opgeslagen:

    • Gegevensset: de gegevens die worden gebruikt voor het maken van tellingen worden opgeslagen als een gegevensset in azure machine learning Studio (klassiek).

    • BLOB: de gegevens die worden gebruikt voor het bouwen van tellingen worden opgeslagen als een blok-Blob in Windows Azure Storage.

    • MapReduce: de gegevens die worden gebruikt voor het maken van tellingen worden opgeslagen als een BLOB in Windows Azure Storage.

      Deze optie verdient doorgaans de voor keur voor zeer grote gegevens sets. Als u de aantallen wilt openen, moet u het HDInsight-cluster activeren. Er wordt een MapReduce-taak gestart om de telling uit te voeren. Beide activiteiten kunnen opslag-en reken kosten in beslag nemen.

      Zie HDInsight op Azurevoor meer informatie.

    Nadat u de modus voor gegevens opslag hebt opgegeven, moet u mogelijk aanvullende verbindings gegevens voor de gegevens opgeven, zelfs als u eerder een import gegevens module in het experiment hebt gebruikt voor toegang tot gegevens. Dat komt doordat de module Count Featurizer (afgeschaft) de gegevens opslag afzonderlijk opent om de gegevens te lezen en de vereiste tabellen te bouwen.

  5. Gebruik de optie voor het tabel type aantal om de indeling en de opslag modus op te geven van de tabel die wordt gebruikt voor het opslaan van tellingen.

    • Dictionary: maakt gebruik van een tabel met aantal woorden lijsten.

      Alle kolom waarden in de geselecteerde kolommen worden behandeld als teken reeksen en worden gehasht met behulp van een bit matrix van Maxi maal 31 bits. Daarom worden alle kolom waarden weer gegeven door een niet-negatief 32-bits geheel getal.

    • CMSketch: gebruikt een tabel die is opgeslagen in de tabel minimum aantal schetsen.

      Met deze indeling worden meerdere onafhankelijke hash-functies met een kleiner bereik gebruikt om de geheugen efficiëntie te verbeteren en de kans op hash-conflicten te verminderen.

    Over het algemeen moet u de optie woorden lijst gebruiken voor kleinere gegevens sets (<1 GB) en de optie CMSketch gebruiken voor grotere data sets.

  6. Voer het experiment uit.

  7. Als u klaar bent, klikt u met de rechter muisknop op de uitvoer van de module aantal importeren tabellen , selecteert u Opslaan als transformerenen typt u een naam voor de trans formatie. Wanneer u dit doet, worden de tabellen met samengevoegde aantallen en eventuele parametrisatie-para meters die u hebt toegepast, opgeslagen in een indeling die kan worden toegepast op een nieuwe gegevensset.

Voorbeelden

Bekijk voor beelden van parametrisatie op basis van het aantal, met behulp van deze voorbeeld experimenten in de Azure AI Gallery:

Notitie

Deze galerie experimenten zijn allemaal gemaakt met behulp van de eerdere en nu afgeschafte versie van de modules Learning with counts . Wanneer u het experiment in Studio (klassiek) opent, wordt het experiment automatisch geüpgraded om de nieuwere modules te gebruiken.

Verwachte invoer

Naam Type Beschrijving
Meta gegevens tellen Gegevens tabel De meta gegevens van de tellingen
Aantal tabel Gegevens tabel De tabel aantal
Gegevensset met aantallen Gegevens tabel De gegevensset die wordt gebruikt voor het tellen

Module parameters

Naam Type Bereik Optioneel Standaard Beschrijving
Type telling CountingType Vereist Het type telling

Outputs

Naam Type Beschrijving
Trans formatie tellen ITransform-interface De telling van de trans formatie

Uitzonderingen

Uitzondering Beschrijving
Fout 0003 Uitzonde ring treedt op als een of meer invoer waarden null of leeg zijn.
Fout 0018 Uitzonde ring treedt op als de ingevoerde gegevensset ongeldig is.

Zie machine learning fout codesvoor een lijst met fouten die specifiek zijn voor Studio-modules (Classic).

Zie Machine Learning rest API fout codesvoor een lijst met API-uitzonde ringen.

Zie ook

Leren met aantallen