Exportieren nach Azure Table

In diesem Artikel wird beschrieben, wie Sie die Option in Azure exportieren im Export Data -Modul in Azure Machine Learning Studio (klassisch) verwenden.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Diese Option ist nützlich, wenn Sie Ergebnisse oder zwischen Daten aus einem Machine Learning-Experiment in eine Azure-Tabelle exportieren möchten. Der Azure-Tabellen Speicherdienst ist ein Daten Verwaltungsdienst in Azure, der große Mengen strukturierter, nicht relationaler Daten speichern kann. Dabei handelt es sich um einen nosql-Datenspeicher, der authentifizierte Aufrufe von innerhalb und außerhalb von Azure akzeptiert.

Vorgehensweise beim Exportieren von Daten in eine Azure-Tabelle

  1. Fügen Sie Ihrem Experiment das Modul zum Exportieren von Daten hinzu. Sie finden dieses Modul in der Kategorie Dateneingabe und-Ausgabe in Studio (klassisch).

  2. Verbinden Sie Sie mit dem Modul, das die Daten erzeugt, die Sie in den Azure-Tabellen Speicher exportieren möchten.

  3. Geben Sie an, ob Sie Daten in eine öffentliche freigegebene Ressource oder ein privates Speicherkonto exportieren möchten, für das Anmelde Informationen erforderlich sind, indem Sie die Option Authentifizierungstyp festlegen.

    • Public (SAS-URL): Wählen Sie diese Option, wenn das Konto den Zugriff über die SAS-URL unterstützt. Geben oder fügen Sie im Feld Table SAS URI (Tabellen-SAS-URI ) den vollständigen URI ein, der das Konto und das öffentliche BLOB definiert.

      Die SAS-URL ist eine zeitgebundene Zugriffs-URL, die Sie mithilfe eines Azure Storage-Hilfsprogramms generieren können. Auf einer Seite, auf die über die SAS-URL zugegriffen werden kann, können Daten nur mit diesen Formaten gespeichert werden: CSV, TSV und ArFF.

    • Konto: Wählen Sie diese Option aus, wenn sich Ihre Daten in einem privaten Konto befinden. Außerdem müssen Sie Anmelde Informationen einschließlich des Konto namens und des Schlüssels angeben.

  4. Wenn Sie Ihre Daten in einen gesicherten, privaten Speicher exportieren möchten, geben Sie die für den Zugriff auf das Konto erforderlichen Anmelde Informationen an:

    • Tabellenkonto Name: Geben Sie den Namen des Kontos ein, das das BLOB enthält, auf das Sie zugreifen möchten, oder fügen Sie es ein. Wenn die vollständige URL des Speicherkontos z.B. https://myshared.table.core.windows.net lautet, geben Sie myshared ein.

    • Tabellenkonto Schlüssel: Fügen Sie den Zugriffsschlüssel ein, der dem Speicherkonto zugeordnet ist.

    • Tabellenname: Geben Sie den Namen der bestimmten Tabelle ein, die Sie lesen möchten.

  5. Geben Sie mithilfe der Spalten Eigenschaften an, welche Spalten im Tabellen Speicher gespeichert und welche Spalten zum Definieren des Tabellen Schemas verwendet werden sollen.

    • Partitions Schlüssel: Wählen Sie die Spalte aus, die für die Partitionierung des gespeicherten Datasets für die Tabelle in Azure Storage verwendet werden soll. Tabellen in Azure werden partitioniert, um den Lastenausgleich zwischen verschiedenen Speicherknoten zu unterstützen. Alle Tabellen Entitäten sind nach Partition organisiert. Daher ist die PartitionKey -Eigenschaft für alle Tabellen Vorgänge erforderlich.

    • Azure-Tabellenzeilen Schlüssel: Wählen Sie die Spalte aus, die für die RowKey -Eigenschaft verwendet werden soll. Die RowKey-Eigenschaft ist eine System Eigenschaft, die für jede Entität in einer Tabelle erforderlich ist. Zusammen mit der PartitionKey -Eigenschaft bildet Sie einen eindeutigen Index für jede Zeile in der Tabelle.

    Hinweis

    Für RowKey und PartitionKey müssen verschiedene Spalten verwendet werden. Stellen Sie sicher, dass jede Spalte, die Sie für RowKey oder PartitionKey auswählen, ebenfalls in der Liste der Ziel Spalten enthalten ist, oder es wird ein Fehler ausgelöst.

    • Azure-Tabellen Ursprungs Spalten: Wählen Sie alle zusätzlichen Spalten aus dem DataSet aus, die in der Azure-Tabelle gespeichert werden sollen. Sie müssen auch die für PartitionKey und RowKey ausgewählten Spalten einschließen.

    Weitere Informationen zu Tabellen in Azure Storage finden Sie Untergrund Legendes zum Tabellen Dienst-Datenmodell.

  6. Geben Sie die Namen der Spalten an, die in die Tabelle geschrieben werden sollen.

    Wichtig

    Sie müssen für jede Spalte, die Sie an die Tabelle ausgeben, einen Spaltennamen angeben, einschließlich der Spalten RowKey, PartitionKey und alle Ursprungs Spalten.

    Wenn die Anzahl der von Ihnen angegebenen Spaltennamen nicht mit der Anzahl der Ausgabespalten identisch ist, wird ein Fehler ausgelöst.

    Wenn Sie neue Spaltennamen eingeben, müssen diese in der Reihenfolge der Spalten Indizes der Quell Spalten angegeben werden.

  7. Azure-Tabellen Schreibmodus: Geben Sie an, wie sich die Export Daten Verhalten sollen, wenn bereits Daten in der Azure-Tabelle vorhanden sind.

    • Insert: der Insert Entity Vorgang fügt eine neue Entität mit einem eindeutigen Primärschlüssel ein, der aus einer Kombination der Eigenschaften PartitionKey und RowKey gebildet wird.

    • Merge: Merge Entity mit dem-Vorgang wird eine vorhandene Entität aktualisiert, indem die Eigenschaften der Entität aktualisiert werden. Die vorhandene Entität wird bei diesem Vorgang nicht ersetzt.

    • Replace: der Update Entity Vorgang ersetzt den Inhalt der angegebenen Entität in einer Tabelle.

    • Insertor Replace: der InsertOrReplace Entity Vorgang fügt die Entität ein, wenn die Entität nicht vorhanden ist. Wenn die Entität vorhanden ist, wird die vorhandene ersetzt.

    • Insertor Merge: der InsertOrMerge Entity Vorgang fügt die Entität ein, wenn die Entität nicht vorhanden ist. Wenn die Entität vorhanden ist, werden die Eigenschaften der angegebenen Entität mit den bereits vorhandenen zusammengeführt.

  8. Zwischengespeicherte Ergebnisse verwenden: Geben Sie an, ob die Daten jedes Mal aktualisiert werden sollen, wenn das Experiment ausgeführt wird.

    Wenn Sie diese Option auswählen, speichert das Modul zum Exportieren von Daten bei der erstmaligen Ausführung des Experiments Daten in der angegebenen Tabelle und führt anschließend keine Schreibvorgänge durch, es sei denn, es sind Upstreamänderungen vorhanden.

    Wenn Sie diese Option deaktivieren, werden die Daten jedes Mal, wenn das Experiment ausgeführt wird, in das Ziel geschrieben, unabhängig davon, ob die Daten identisch sind oder nicht.

  9. Führen Sie das Experiment aus.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Häufig gestellte Fragen

Warum habe ich beim Schreiben in eine vorhandene Tabelle eine Fehlermeldung erhalten?

Überprüfen Sie das Schema der Tabelle, um sicherzustellen, dass die Spaltennamen und Datentypen identisch sind. Beispielsweise wird in Azure Table Storage die ID-Spalte als Zeichenfolge erwartet.

Wenn Sie den Fehler erhalten, Fehler 0027: die Größe der übergebenen Objekte ist inkonsistent, vergewissern Sie sich, dass die Tabelle im angegebenen Container vorhanden ist. Derzeit kann Azure ml nur in vorhandene Tabellen schreiben.

Warum erhalte ich die Fehlermeldung, dass eine vorhandene Spalte nicht gefunden werden kann.

Wenn Sie das Experiment nicht ausgeführt haben, werden von den Export Datenmanchmal keine Upstreamspalten erkannt. Wenn Sie im Experiment vorgelagerte Änderungen vornehmen, müssen Sie möglicherweise das Modul zum Exportieren von Daten entfernen und es dann hinzufügen und neu konfigurieren.

Wie kann ich vermeiden, dass die gleichen Daten unnötig neu geschrieben werden?

Wenn sich die Daten im Experiment aus irgendeinem Grund ändern, werden die neuen Daten vom Modul Export Data immer geschrieben.

Wenn Sie jedoch das Experiment mit anderen Änderungen ausführen, die sich nicht auf die Ergebnisse auswirken, legen Sie die Option zwischengespeicherte Ergebnisse verwenden auf true fest. Das Modul prüft, ob das Experiment zuvor mit denselben Optionen ausgeführt wurde. Wenn ein vorheriges Ergebnis gefunden wird, werden die Daten nicht in die Azure-Tabelle geschrieben.

Kann ich Daten in eine andere geografische Region exportieren

Ja. Wenn sich das Speicherkonto jedoch in einer anderen Region als der für das Machine Learning-Experiment verwendete Computeknoten befindet, ist der Datenzugriff möglicherweise langsamer. Außerdem wird Ihnen der Eingang und Ausgang von Daten für das Abonnement in Rechnung gestellt.

Beispiele

Beispiele für die Verwendung dieser Machine Learning-Module finden Sie in der Azure AI Gallery.

Modulparameter

Öffentliche oder SAS-öffentliche Optionen

Name Range type Standard BESCHREIBUNG
Tabellen-SAS-URI any String

Konto: Private Konto Optionen

Name Range type Standard BESCHREIBUNG
Table account name
Table account key any SecureString

Speicheroptionen

Name Range type Standard BESCHREIBUNG
Tabellenname String Keine
Partitionsschlüssel any SecureString Keine Wählen Sie die Spalte aus, die beim Partitionieren der Tabelle als Schlüssel verwendet werden soll. Wenn keine Spalte ausgewählt ist, wird der Spaltenname als Partitions Schlüssel für alle Einträge ausgewählt.
Azure table row key any Columnpicker Keine Wählen Sie die Spalte aus, die den eindeutigen Bezeichner für Tabellenzeilen enthält. Entspricht standardmäßig einem GUID-basierten Zeilen Schlüssel.
Azure table origin columns any Columnpicker Keine Angeben der Spalten, die in die Tabelle eingeschlossen werden sollen, entweder anhand des Namens oder anhand des Spalten Indexes
Azure table destination columns any String Keine Geben Sie die Namen der Spalten ein, die in der Ziel Tabelle verwendet werden sollen.
Azure table write mode List: INSERT, Merge, Replace, insertor Replace, insertor Merge Enumeration Keine
Verwenden von zwischengespeicherten Ergebnissen TRUE/FALSE Boolean FALSE Das Modul wird nur ausgeführt, wenn kein gültiger Cache vorhanden ist. Verwenden Sie andernfalls zwischengespeicherte Daten aus vorheriger Ausführung.

Ausnahmen

Ausnahme Beschreibung
Fehler 0027 Eine Ausnahme tritt auf, wenn zwei Objekte gleich groß sein müssen, dies aber nicht der Fall ist.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0029 Eine Ausnahme tritt auf, wenn ein ungültiger URI übergeben wird.
Fehler 0030 Eine Ausnahme tritt auf, wenn es nicht möglich ist, eine Datei herunterzuladen.
Fehler 0002 Eine Ausnahme tritt auf, wenn mindestens ein Parameter nicht analysiert oder nicht aus einem angegebenen Typ in den für die Zielmethode erforderlichen Typ konvertiert werden konnte.
Fehler 0009 Eine Ausnahme tritt auf, wenn der Azure-Speicherkontoname oder der Containername falsch angegeben ist.
Fehler 0048 Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu öffnen.
Fehler 0046 Eine Ausnahme tritt auf, wenn es nicht möglich ist, ein Verzeichnis im angegebenen Pfad zu erstellen.
Fehler 0049 Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu analysieren.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning Rest-API-Fehler Codes.

Weitere Informationen

Importieren von Daten
Daten exportieren
Exportieren in Azure SQL-Datenbank
Exportieren nach Azure BLOB Storage
Exportieren nach Hive-Abfrage