Apa itu Azure Data Science Virtual Machine untuk Linux dan Windows?

Ilmu Data Virtual Machine (DSVM) adalah gambar VM yang disesuaikan yang tersedia di platform cloud Azure, dan dapat menangani ilmu data. Ini memiliki banyak alat ilmu data populer yang telah diinstal dan telah dikonfigurasi sebelumnya untuk memulai membangun aplikasi cerdas untuk analitik tingkat lanjut.

DSVM tersedia di:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

Selain itu, kami menawarkan Azure DSVM untuk PyTorch - gambar Ubuntu 20.04 dari Marketplace Azure dioptimalkan untuk beban kerja pembelajaran mendalam besar dan terdistribusi. DSVM yang telah diinstal sebelumnya ini divalidasi dengan versi PyTorch terbaru, untuk mengurangi biaya penyiapan dan mempercepat waktu ke nilai. Muncul paket dengan berbagai fitur pengoptimalan:

  • ONNX Runtime​
  • DeepSpeed
  • MSCCL
  • ORTMoE
  • Fairscale
  • Nvidia Apex​
  • Tumpukan terbaru dengan versi terbaru yang kompatibel dari Ubuntu, Python, PyTorch, dan CUDA

Perbandingan dengan Azure Machine Learning

DSVM adalah gambar VM yang disesuaikan untuk Ilmu Data, tetapi Azure Pembelajaran Mesin adalah platform end-to-end yang mencakup:

  • Komputasi yang Dikelola Penuh
    • Instans Komputasi
    • Kluster Komputasi untuk tugas ML yang didistribusikan
    • Kluster Interferensi untuk penilaian real time
  • Datastore (misalnya Blob, ADLS Gen2, SQL DB)
  • Pelacakan eksperimen
  • Manajemen model
  • Notebook
  • Lingkungan (mengelola ketergantungan R dan conda)
  • Pemberian label
  • Alur (mengotomatiskan alur kerja Data science End-to-End)

Perbandingan dengan Azure Pembelajaran Mesin Compute Instances

Azure Pembelajaran Mesin Compute Instances adalah gambar VM yang dikonfigurasi dan dikelola sepenuhnya, sementara DSVM adalah VM yang tidak dikelola.

Perbedaan utama antara DSVM dan instans komputasi Azure Pembelajaran Mesin:

Fitur Ilmu data
VM
Pembelajaran Mesin Azure
Instans Komputasi
Dikelola Sepenuhnya Tidak Ya
Dukungan Bahasa Python, R, Julia, SQL, C#,
Java, Node.js, F#
Python, dan R
Sistem Operasi Ubuntu
Windows
Ubuntu
Opsi GPU Prakonfigurasi Ya Ya
Opsi meningkatkan skala Ya Ya
Akses SSH Ya Ya
Akses RDP Ya Tidak
Bawaan
Notebook yang Dihosting
No
(memerlukan konfigurasi tambahan)
Ya
SSO Bawaan Tanpa
(memerlukan konfigurasi tambahan)
Ya
Kolaborasi Bawaan Tidak Ya
Alat yang Telah Diinstal Sebelumnya Jupyter(lab), Visual Studio Code,
Studio Visual, PyCharm, Juno,
Power BI Desktop, SSMS,
Microsoft Office 365, Apache Drill
Jupyter(lab)

Contoh kasus penggunaan pelanggan DSVM

Eksperimen dan evaluasi jangka pendek

DSVM dapat mengevaluasi atau mempelajari alat ilmu data baru. Coba beberapa sampel dan panduan kami yang diterbitkan.

Pembelajaran mendalam dengan GPU

Dalam DSVM, model pelatihan Anda dapat menggunakan algoritma pembelajaran mendalam pada perangkat keras berbasis unit pemrosesan grafis (GPU). Jika Anda memanfaatkan kemampuan penskalaan VM platform Azure, DSVM membantu Anda memanfaatkan perangkat keras berbasis GPU di cloud, sesuai dengan kebutuhan Anda. Anda dapat beralih ke VM berbasis GPU saat melatih model besar, atau saat Anda membutuhkan komputasi berkecepatan tinggi saat Anda menyimpan disk OS yang sama. Anda dapat memilih salah satu SKU komputer virtual dengan dukungan GPU seri N dengan DSVM. Akun gratis Azure tidak mendukung SKU komputer virtual dengan dukungan GPU.

DSVM edisi Windows telah diinstal sebelumnya dengan driver GPU, kerangka kerja, dan versi GPU dari kerangka kerja pembelajaran mendalam. Pada edisi Linux, pembelajaran mendalam pada GPU diaktifkan di DSVM Ubuntu.

Anda juga dapat menyebarkan edisi DSVM Ubuntu atau Windows ke komputer virtual Azure yang tidak didasarkan pada GPU. Dalam hal ini, semua kerangka kerja pembelajaran mendalam kembali ke mode CPU.

Pelajari selengkapnya tentang kerangka kerja AI dan pembelajaran mendalam yang tersedia.

Pelatihan dan edukasi ilmu data

Pelatih dan pendidik perusahaan yang mengajar kelas ilmu data biasanya menyediakan citra komputer virtual. Gambar memastikan bahwa siswa memiliki penyiapan yang konsisten dan bahwa sampel berfungsi secara terprediksi.

DSVM menciptakan lingkungan sesuai permintaan dengan pengaturan yang konsisten, untuk memudahkan dukungan dan tantangan ketidaksesuaian. Kasus-kasus di mana lingkungan ini harus sering dibangun, terutama untuk kelas pelatihan yang lebih pendek, untuk mendapatkan manfaat secara substansial.

Apa yang disertakan DSVM?

Untuk informasi selengkapnya, lihat daftar lengkap alat ini di DSVM Windows dan Linux.

Langkah berikutnya

Untuk informasi selengkapnya, kunjungi sumber daya ini: