Datenerfassungstools für die Data Science-VM

In einer frühen Phase eines Data Science- oder KI-Projekts müssen Sie die erforderlichen Datasets identifizieren und diese in Ihre Analyseumgebung importieren. Die Data Science Virtual Machine (DSVM) stellt Tools und Bibliotheken bereit, um Daten aus verschiedenen Quellen in lokale analytische Datenspeicherressourcen auf der DSVM zu importieren. Die DSVM kann auch Daten in eine Datenplattform importieren, die sich entweder in der Cloud befindet oder lokal ist.

Die DSVM bietet diese Datenbewegungstools:

Azure CLI

Category Wert
Was ist das? Ein Verwaltungstool für Azure. Es bietet Befehlsverben zum Verschieben von Daten von Azure-Datenplattformen – z. B. Azure Blob-Speicher und Azure Data Lake Store
Unterstützte DSVM-Versionen Windows, Linux
Typische Verwendung Importieren und Exportieren von Daten zwischen Azure Storage und Azure Data Lake Store
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie az ein, um Hilfe zu erhalten.
Links zu Beispielen Verwenden der Azure-Befehlszeilenschnittstelle

AzCopy

Category Wert
Was ist das? Ein Tool zum Kopieren von Daten zwischen lokalen Dateien, Azure-Blobspeichern, -dateien und -tabellen
Unterstützte DSVM-Versionen Windows
Typische Verwendung Kopieren von Dateien in den Azure Blob-Speicher
Kopieren von Blobs zwischen Konten
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie azcopy ein, um Hilfe zu erhalten.
Links zu Beispielen AzCopy unter Windows

Azure Cosmos DB-Datenmigrationstool

-- --
Was ist das? Tool, mit dem Daten aus verschiedenen Quellen in Azure Cosmos DB importiert werden können, eine NoSQL-Datenbank in der Cloud. Diese Quellen umfassen JSON-Dateien
CSV-Dateien
SQL
MongoDB
Azure Table Storage
Amazon DynamoDB
Azure Cosmos DB for NoSQL-Sammlungen
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren von Dateien von einem virtuellen Computer in Azure Cosmos DB
Importieren von Daten aus einem Azure-Tabellenspeicher in Azure Cosmos DB
Importieren von Daten aus einer Microsoft SQL Server-Datenbank in Azure Cosmos DB
Verwendung/Ausführung Öffnen Sie zum Verwenden der Befehlszeilenversion eine Eingabeaufforderung, und geben Sie dt ein. Öffnen Sie zum Verwenden des GUI-Tools eine Eingabeaufforderung, und geben Sie dtui ein
Links zu Beispielen Import data into Azure Cosmos DB (Importieren von Daten in Azure Cosmos DB)

Azure Storage-Explorer

Category Wert
Was ist das? Grafische Benutzeroberfläche für die Interaktion mit Dateien, die in der Azure-Cloud gespeichert sind
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren von Daten in die und Exportieren von Daten aus der DSVM
Verwendung/Ausführung Suchen nach „Azure Storage-Explorer“ im Startmenü
Links zu Beispielen Azure Storage-Explorer

bcp

Category Wert
Was ist das? SQL Server-Tool zum Kopieren von Daten zwischen SQL Server und einer Datendatei
Unterstützte DSVM-Versionen Windows
Typische Verwendung Importieren einer CSV-Datei in eine SQL Server-Tabelle
Exportieren einer SQL Server-Tabelle in eine Datei
Verwendung/Ausführung Öffnen Sie eine Eingabeaufforderung, und geben Sie bcp ein, um Hilfe zu erhalten
Links zu Beispielen bcp-Hilfsprogramm

blobfuse

Category Wert
Was ist das? Ein Tool zum Einbinden eines Azure Blob-Speichercontainers in das Linux-Dateisystem
Unterstützte DSVM-Versionen Linux
Typische Verwendung Lesen aus einem und Schreiben in Blobs in einen Container
Verwenden und Ausführen Ausführen von blobfuse auf einem Terminal
Links zu Beispielen blobfuse auf GitHub