Importieren einer Anzahltabelle

Importiert eine zuvor erstellte Tabelle mit Zählungen.

Kategorie: lernen mit Anzahlen

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Import count Table in Azure Machine Learning Studio (klassisch) verwenden.

Der Zweck des Moduls Import count Table besteht darin, dass Kunden, die eine Tabelle mit count-basierten Statistiken erstellt haben, eine frühere Version von Azure Machine Learning verwenden, um ihr Experiment zu aktualisieren. Mit diesem Modul werden die vorhandenen count-Tabellen mit neuen Daten zusammengeführt.

Allgemeine Informationen zu count-Tabellen und deren Verwendung zum Erstellen von-Funktionen finden Sie unter Learning with Counts (erlernen mit Zählungen).

Wichtig

Dieses Modul wird ausschließlich zur Abwärtskompatibilität mit Experimenten bereitgestellt, die die als veraltet markierte Tabelle "Build count" und die veralteten count featurizer-Module verwenden. Es wird empfohlen, dass Sie das Experiment aktualisieren, um die neueren Module zu verwenden, um die Vorteile der neuen Features zu nutzen.

Bei allen neuen Experimenten empfiehlt es sich, die folgenden Module zu verwenden:

Konfigurieren der Tabelle "Import Anzahl"

  1. Öffnen Sie in Azure Machine Learning Studio (klassisch) ein Experiment, das eine count-Tabelle enthält, die mit dem veralteten Build count Table-Modul erstellt wurde.

  2. Fügen Sie dem Experiment das Modul Import count Table hinzu.

  3. Verbinden Sie die beiden Ausgaben des Moduls Build count Table (deprecated) mit den übereinstimmenden eingabeports der Tabelle Import count.

    Wenn Sie über ein anderes Dataset mit Anzahlen verfügen, das Sie mit der importierten Anzahl Tabelle zusammenführen möchten, verbinden Sie es mit der äußersten rechten Eingabe für das Modul Import count Table .

  4. Verwenden Sie die Option Zähltyp , um anzugeben, wo und wie die Anzahl Tabelle gespeichert wird:

    • DataSet: die Daten, die zum Erstellen von Anzahlen verwendet werden, werden in Azure Machine Learning Studio (klassisch) als DataSet gespeichert.

    • BLOB: die zum Erstellen von Anzahlen verwendeten Daten werden als blockblob im Windows Azure-Speicher gespeichert.

    • MapReduce: die zum Erstellen von Anzahlen verwendeten Daten werden als BLOB im Windows Azure-Speicher gespeichert.

      Diese Option wird in der Regel für sehr große Datasets bevorzugt. Für den Zugriff auf die Zählungen müssen Sie den hdinsight-Cluster aktivieren. Ein MapReduce-Auftrag wird gestartet, um die Zählung auszuführen. Beide Aktivitäten können Speicher-und computekosten verursachen.

      Weitere Informationen finden Sie unter hdinsight in Azure.

    Nachdem Sie den Datenspeicher Modus angegeben haben, müssen Sie möglicherweise zusätzliche Verbindungsinformationen für die Daten bereitstellen, auch wenn Sie zuvor ein Import Data -Modul im Experiment verwendet haben, um auf Daten zuzugreifen. Dies liegt daran, dass das count featurizer (deprecated)-Modul separat auf den Datenspeicher zugreift, um die Daten zu lesen und die erforderlichen Tabellen zu erstellen.

  5. Verwenden Sie die Option count Table Type , um das Format und den Speicher Modus der Tabelle anzugeben, die zum Speichern von Zählungen verwendet wird.

    • Dictionary: verwendet eine Wörterbuch Anzahl Tabelle.

      Alle Spaltenwerte in den ausgewählten Spalten werden als Zeichenfolgen behandelt und werden mit einem Bitarray auf 31 Bits gehasht. Daher werden alle Spaltenwerte als nicht negative ganze 32-Bit-Zahlen dargestellt.

    • Cmsketch: verwendet eine Tabelle, die in der count minimal Sketch-Tabelle gespeichert ist.

      In diesem Format werden mehrere unabhängige Hash Funktionen mit einem kleineren Bereich verwendet, um die Arbeitsspeicher Effizienz zu verbessern und die Wahrscheinlichkeit von Hash Konflikten zu reduzieren.

    Im Allgemeinen sollten Sie die Dictionary -Option für kleinere Datasets (<1 GB) verwenden und die cmsketch -Option für größere Datasets verwenden.

  6. Führen Sie das Experiment aus.

  7. Wenn Sie fertig sind, klicken Sie mit der rechten Maustaste auf die Ausgabe des Moduls Import count Table , wählen Sie als Transformation speichern aus, und geben Sie einen Namen für die Transformation ein. Wenn Sie dies tun, werden die zusammengeführten Anzahl Tabellen und die von Ihnen möglicherweise angewendeten featureerstellungs Parameter in einem Format gespeichert, das auf ein neues Dataset angewendet werden kann.

Beispiele

Erkunden Sie die Beispiele für die count-basierte featurearisierung mithilfe der folgenden Beispiel Experimente in der Azure AI Gallery:

Hinweis

Diese Katalog Experimente wurden alle mit dem früheren erstellt und sind nun als veraltet markiert, Version der Module Learning with Counts . Wenn Sie das Experiment in Studio (klassisch) öffnen, wird das Experiment automatisch aktualisiert, um die neueren Module zu verwenden.

Erwartete Eingaben

Name Typ BESCHREIBUNG
Count metadata Datentabelle Die Metadaten der Zählungen.
Count table Datentabelle Die Anzahl Tabelle
Gezähltes DataSet Datentabelle Das zum zählen verwendete Dataset.

Modulparameter

Name Typ Range Optional Standard BESCHREIBUNG
Zähltyp CountingType Erforderlich Der Zähltyp.

Ausgaben

Name Typ BESCHREIBUNG
Zählen der Transformation ITransform-Schnittstelle Die Zähl Transformation

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0018 Eine Ausnahme tritt auf, wenn das Eingabedataset nicht gültig ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning Rest-API-Fehler Codes.

Weitere Informationen

Lernen mit Zählungen