Mulai Cepat: Menyiapkan Komputer Virtual Ilmu Data untuk Linux (Ubuntu)

Mulai dan jalankan dengan Ubuntu 20.04 Ilmu Data Virtual Machine (DSVM) dan Azure DSVM for PyTorch.

Prasyarat

Anda memerlukan langganan Azure untuk membuat Ubuntu 20.04 Ilmu Data Virtual Machine atau Azure DSVM untuk PyTorch. Coba Azure secara gratis.

Catatan

Akun gratis Azure tidak mendukung SKU komputer virtual yang diaktifkan GPU.

Membuat Komputer Virtual Ilmu Data Anda untuk Linux

Langkah-langkah ini menjelaskan cara membuat instans Ubuntu 20.04 Ilmu Data Virtual Machine (DSVM) atau Azure DSVM for PyTorch:

  1. Buka portal Microsoft Azure. Anda mungkin mendapatkan perintah untuk masuk ke akun Azure Jika Anda belum masuk

  2. Temukan daftar komputer virtual. Jenis pertama dalam "komputer virtual ilmu data," lalu pilih "Ilmu Data Virtual Machine- Ubuntu 20.04" atau "Azure DSVM for PyTorch"

  3. Di jendela berikutnya, pilih Buat

  4. Anda harus diarahkan ke bilah "Buat komputer virtual"

  5. Masukkan informasi berikut, untuk mengonfigurasi setiap langkah wizard:

    1. Dasar-dasar:

      • Langganan: Jika Anda memiliki lebih dari satu langganan, pilih langganan di mana komputer virtual akan dibuat dan ditagih. Anda harus memiliki hak cipta pembuatan sumber daya untuk langganan ini.

      • Grup sumber daya: Buat grup baru, atau gunakan grup yang sudah ada.

      • Nama komputer virtual: Masukkan nama komputer virtual. Nama ini digunakan dalam portal Azure Anda.

      • Wilayah: Pilih pusat data yang paling tepat. Untuk akses jaringan tercepat, ini adalah pusat data yang memiliki sebagian besar data Anda, atau paling dekat dengan lokasi fisik Anda. Untuk informasi selengkapnya, kunjungi Wilayah Azure.

      • Gambar: Jangan ubah nilai default.

      • Ukuran: Opsi ini harus diisi otomatis dengan ukuran yang sesuai untuk beban kerja umum. Untuk informasi selengkapnya, kunjungi Ukuran VM Linux di Azure.

      • Jenis autentikasi: Untuk pengaturan yang lebih cepat, pilih "Kata Sandi".

        Catatan

        Jika Anda berencana menggunakan JupyterHub, pastikan untuk memilih "Kata Sandi", karena JupyterHub tidak dikonfigurasi untuk menggunakan kunci publik SSH.

      • Nama pengguna: Masukkan nama pengguna admin. Anda menggunakan nama pengguna ini untuk masuk ke komputer virtual Anda. Nama pengguna ini tidak perlu cocok dengan nama pengguna Azure Anda. Jangan gunakan huruf kapital.

        Penting

        Jika Anda menggunakan huruf kapital dalam nama pengguna Anda, JupyterHub tidak akan berfungsi, dan Anda akan mengalami kesalahan server internal 500.

      • Kata sandi: Masukkan kata sandi yang akan Anda gunakan untuk masuk ke komputer virtual Anda.

    2. Pilih Tinjau + buat.

    3. Tinjau+Buat

      • Verifikasi bahwa semua informasi yang Anda masukkan sudah benar.
      • Pilih Buat.

    Proses provisi harus memakan waktu sekitar 5 menit. portal Azure menampilkan status.

Cara mengakses Komputer Virtual Ilmu Data Ubuntu

Anda dapat mengakses Ubuntu DSVM dengan salah satu dari empat cara:

  • SSH untuk sesi terminal
  • xrdp untuk sesi grafis
  • X2Go untuk sesi grafis
  • JupyterHub dan JupyterLab untuk notebook Jupyter

SSH

Jika mengonfigurasi VM dengan autentikasi SSH, Anda dapat masuk dengan kredensial akun yang Anda buat di bagian Dasar-Dasar langkah 3 untuk antarmuka shell teks. Untuk informasi selengkapnya, kunjungi Pelajari selengkapnya tentang menyambungkan ke VM Linux.

xrdp

xrdp adalah alat standar untuk mengakses sesi grafis Linux. Meskipun distro tidak menyertakan alat ini secara default, instruksi ini menjelaskan cara menginstalnya.

X2Go

Catatan

Dalam pengujian, klien X2Go berkinerja lebih baik daripada penerusan X11. Sebaiknya gunakan klien X2Go untuk antarmuka desktop grafis.

VM Linux sudah disediakan dengan X2Go Server dan siap untuk menerima koneksi klien. Untuk menyambungkan ke desktop grafis Linux VM, selesaikan prosedur berikut pada klien Anda:

  1. Unduh dan instal klien X2Go untuk platform klien Anda dari X2Go.

  2. Perhatikan alamat IP publik komputer virtual. Di portal Azure, buka komputer virtual yang Anda buat untuk menemukan informasi ini.

    Cuplikan layar memperlihatkan alamat IP publik komputer virtual.

  3. Jalankan klien X2Go. Jika jendela "Sesi Baru" tidak muncul secara otomatis, buka Sesi -> Sesi Baru.

  4. Pada jendela konfigurasi yang dihasilkan, masukkan parameter konfigurasi ini:

    • Tab Sesi:
      • Host: Masukkan alamat IP VM Anda, yang Anda sebutkan sebelumnya.
      • Masuk: Masukkan nama pengguna di VM Linux.
      • Port SSH: Biarkan di 22. Ini adalah nilai default.
      • Jenis Sesi: Ubah nilai menjadi XFCE. Saat ini, VM Linux hanya mendukung desktop XFCE.
    • Tab Media: Anda dapat menonaktifkan dukungan suara dan pencetakan klien jika Anda tidak perlu menggunakannya.
    • Folder bersama: Gunakan tab ini untuk menambahkan direktori komputer klien yang ingin Anda pasang pada Komputer Virtual.

    Cuplikan layar memperlihatkan preferensi untuk sesi X2Go baru.

  5. Pilih OK.

  6. Pilih pada kotak di panel kanan jendela X2Go untuk memunculkan layar masuk untuk VM Anda.

  7. Masukkan nama server login untuk VM Anda.

  8. Pilih OK.

  9. Anda mungkin perlu memberikan izin X2Go untuk melewati firewall Anda untuk menyelesaikan proses koneksi.

  10. Anda sekarang akan melihat antarmuka grafis untuk DSVM Ubuntu Anda.

JupyterHub dan JupyterLab

Ubuntu DSVM menjalankan JupyterHub, server Jupyter multiuser. Untuk menyambungkan, ambil langkah-langkah berikut:

  1. Perhatikan alamat IP publik VM Anda. Untuk menemukan nilai ini, cari dan pilih VM Anda di portal Azure, seperti yang ditunjukkan pada cuplikan layar ini:

    Cuplikan layar menyoroti alamat IP publik VM Anda.

  2. Dari komputer lokal Anda, buka browser web, dan navigasikan ke https:// your-vm-ip:8000, mengganti "your-vm-ip" dengan alamat IP yang Anda catat sebelumnya.

  3. Browser Anda mungkin akan mencegah Anda membuka halaman secara langsung. Ini mungkin memberi tahu Anda bahwa ada kesalahan sertifikat. DSVM menyediakan keamanan dengan sertifikat yang ditandatangani sendiri. Sebagian besar browser akan memungkinkan Anda untuk memilih melalui setelah peringatan ini. Banyak browser akan terus memberikan semacam peringatan visual tentang sertifikat di seluruh sesi Web Anda.

    Catatan

    Jika Anda melihat ERR_EMPTY_RESPONSE pesan kesalahan di browser, pastikan Anda mengakses komputer dengan menggunakan protokol HTTPS secara eksplisit. HTTP atau hanya alamat web tidak berfungsi untuk langkah ini. Jika Anda mengetik alamat web tanpa https:// di baris alamat, sebagian besar browser akan default ke http, dan kesalahan akan muncul.

  4. Masukkan nama pengguna dan kata sandi yang Anda gunakan untuk membuat VM, dan masuk, seperti yang ditunjukkan pada cuplikan layar ini

    Cuplikan layar masuk JupyterHub.

    Catatan

    Jika Anda menerima Kesalahan 500 pada tahap ini, Anda mungkin menggunakan huruf kapital dalam nama pengguna Anda. Ini adalah interaksi yang diketahui antara Jupyter Hub dan PAMAuthenticator yang digunakannya. Jika Anda menerima kesalahan "Tidak dapat mencapai halaman ini", kemungkinan izin Kelompok Keamanan Jaringan Anda memerlukan penyesuaian. Di portal Microsoft Azure, temukan sumber daya Kelompok Keamanan Jaringan dalam Grup Sumber Daya Anda. Untuk mengakses JupyterHub dari Internet publik, Anda harus membuka port 8000. (Gambar menunjukkan bahwa VM ini dikonfigurasi untuk akses just-in-time, yang sangat disarankan. Untuk informasi selengkapnya, kunjungi Mengamankan port manajemen Anda dengan akses just-in-time.)

    Cuplikan layar nilai konfigurasi Kelompok Keamanan Jaringan.

  5. Telusuri contoh buku catatan yang tersedia.

JupyterLab, notebook Jupyter generasi berikutnya dan JupyterHub, juga tersedia. Untuk mengaksesnya, masuk ke JupyterHub, lalu telusuri ke URL https://your-vm-ip:8000/user/nama pengguna/lab Anda, mengganti "nama pengguna Anda" dengan nama pengguna yang Anda pilih saat mengonfigurasi VM. Sekali lagi, potensi kesalahan sertifikat awalnya mungkin memblokir Anda mengakses situs.

Untuk mengatur JupyterLab sebagai server notebook default, tambahkan baris ini ke /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

Langkah berikutnya

  • Ilmu data pada panduan Ilmu Data Virtual Machine for Linux menunjukkan cara melakukan beberapa tugas ilmu data umum dengan Linux DSVM yang disediakan di sini.
  • Cobalah alat yang dijelaskan artikel ini untuk menjelajahi berbagai alat ilmu data pada DSVM. Anda juga dapat dsvm-more-info berjalan pada shell dalam komputer virtual untuk pengenalan dasar dan penunjuk untuk informasi lebih lanjut tentang alat yang diinstal pada Komputer Virtual.
  • Pelajari cara membangun solusi analitik secara sistematis dengan Team Ilmu Data Process.
  • Kunjungi Galeri Azure AI untuk sampel pembelajaran mesin dan analitik data yang menggunakan layanan Azure AI.
  • Kunjungi dokumentasi referensi yang sesuai untuk komputer virtual ini.