Alat pembelajaran mesin dan data science di Azure Data Science Virtual Machines
Artikel
Azure Ilmu Data Virtual Machines (DSVM) memiliki serangkaian alat dan pustaka yang kaya untuk pembelajaran mesin. Sumber daya ini tersedia dalam bahasa populer, seperti Python, R, dan Julia.
DSVM mendukung alat dan pustaka pembelajaran mesin ini:
Anda dapat menggunakan layanan cloud Azure Pembelajaran Mesin untuk mengembangkan dan menyebarkan model pembelajaran mesin. Anda dapat menggunakan Python SDK untuk melacak model saat Anda membangun, melatih, menskalakan, dan mengelolanya. Sebarkan model sebagai kontainer, dan jalankan di cloud, lokal, atau di Azure IoT Edge.
Edisi yang didukung
Windows (lingkungan conda: AzureML), Linux (lingkungan conda: py36)
Penggunaan umum
Platform pembelajaran mesin umum
Bagaimana platform dikonfigurasi atau diinstal?
Diinstal dengan dukungan GPU
Cara menggunakan atau menjalankannya
Sebagai Python SDK dan di Azure CLI. Aktifkan ke lingkungan AzureML conda pada edisi Windows atau aktifkan ke py36 pada edisi Linux.
Tautan ke sampel
Temukan contoh buku catatan Jupyter di direktori, di AzureML bawah buku catatan.
H2O
Kategori
Nilai
Apakah maksudnya?
Platform AI sumber terbuka yang mendukung pembelajaran mesin terdistribusi, cepat, dalam memori, dan dapat diskalakan.
Versi yang didukung
Linux
Penggunaan umum
Pembelajaran mesin yang didistribusikan secara umum dan dapat diskalakan
Bagaimana platform dikonfigurasi atau diinstal?
H2O diinstal di /dsvm/tools/h2o.
Cara menggunakan atau menjalankannya
Koneksi ke VM dengan X2Go. Mulai terminal baru, dan jalankan java -jar /dsvm/tools/h2o/current/h2o.jar. Kemudian, mulai browser web dan sambungkan ke http://localhost:54321.
Tautan ke sampel
Temukan sampel pada VM di Jupyter, di h2o bawah direktori.
Ada beberapa pustaka pembelajaran mesin lainnya di DSVM - misalnya, paket populer scikit-learn yang merupakan bagian dari distribusi Anaconda Python untuk DSVM. Untuk daftar paket yang tersedia di Python, R, dan Julia, jalankan manajer paket masing-masing.
LightGBM
Kategori
Nilai
Apakah maksudnya?
Kerangka kerja yang cepat, terdistribusi, dan berperforma tinggi (GBDT, GBRT, GBM, atau MART) berdasarkan algoritma pohon keputusan. Tugas pembelajaran mesin - peringkat, klasifikasi, dll. - gunakan.
Versi yang didukung
Windows, Linux
Penggunaan umum
Kerangka kerja peningkatan gradien tujuan umum
Bagaimana platform dikonfigurasi atau diinstal?
LightGBM diinstal sebagai paket Python di Windows. Di Linux, executable baris perintah terletak di /opt/LightGBM/lightgbm. Paket R diinstal, dan paket Python diinstal.
Antarmuka pengguna grafis untuk penambangan data yang menggunakan R.
Edisi yang didukung
Windows, Linux
Penggunaan umum
Alat penambangan data UI umum untuk R
Cara menggunakan atau menjalankannya
Sebagai alat UI. Di Windows, mulai perintah, jalankan R, lalu di dalam R, jalankan rattle(). Di Linux, sambungkan dengan X2Go, mulai terminal, jalankan R, lalu di dalam R, jalankan rattle().
Kumpulan algoritma pembelajaran mesin untuk tugas penambangan data. Anda dapat menerapkan algoritma secara langsung, atau memanggilnya dari kode Java Anda sendiri. Weka berisi alat untuk pra-pemrosesan data, klasifikasi, regresi, pengklusteran, aturan asosiasi, dan visualisasi.
Edisi yang didukung
Windows, Linux
Penggunaan umum
Alat umum pembelajaran mesin
Cara menggunakan atau menjalankannya
Di Windows, cari Weka pada menu Mulai. Di Linux, masuk dengan X2Go, lalu buka Aplikasi>Pengembangan>Weka.
Pustaka peningkatan gradien (GBDT, GBRT, atau GBM) yang cepat, portabel, dan terdistribusi untuk Python, R, Java, Scala, C++, dan lainnya. Pustaka ini berjalan pada satu komputer, dan pada Apache Hadoop dan Spark.
Edisi yang didukung
Windows, Linux
Penggunaan umum
Pustaka umum pembelajaran mesin
Bagaimana platform dikonfigurasi atau diinstal?
Diinstal dengan dukungan GPU
Cara menggunakan atau menjalankannya
Sebagai pustaka Python (2.7 dan 3.6+), paket R, dan alat baris perintah pada jalur (C:\dsvm\tools\xgboost\bin\xgboost.exe untuk Windows dan /dsvm/tools/xgboost/xgboost untuk Linux)
Tautan ke sampel
Sampel disertakan pada VM, di /dsvm/tools/xgboost/demo Linux, dan C:\dsvm\tools\xgboost\demo di Windows.