Mengonfigurasi Set Skala Komputer Virtual

Selesai

Saat Anda menskalakan, Anda menambahkan instans ke Virtual Machine Scale Set Anda. Dalam skenario perusahaan pengiriman, penskalaan adalah cara yang baik untuk menangani perubahan jumlah permintaan dari waktu ke waktu. Penskalaan menyesuaikan jumlah komputer virtual yang menjalankan aplikasi web saat jumlah pengguna berubah. Dengan cara ini, sistem mempertahankan waktu respons yang merata, terlepas dari beban saat ini.

Di unit ini, Anda akan mempelajari cara menskalakan Virtual Machine Scale Set. Anda dapat menskalakan secara manual dengan secara eksplisit mengatur jumlah instans komputer virtual dalam set skala, atau Anda dapat mengonfigurasi penskalaan otomatis dengan menentukan aturan skala yang memicu alokasi dan dealokasi komputer virtual. Aturan skala ini menentukan kapan harus menskalakan sistem dengan memantau berbagai metrik performa.

Menskalakan Virtual Machine Scale Sets secara manual

Anda menskalakan Set Skala Komputer Virtual secara manual dengan meningkatkan atau mengurangi jumlah instans. Anda dapat melakukan tugas ini secara terprogram atau di portal Azure.

Kode berikut menggunakan Azure CLI untuk mengubah jumlah instans dalam Set Skala Komputer Virtual:

az vmss scale \
    --name MyVMScaleSet \
    --resource-group MyResourceGroup \
    --new-capacity 6

Virtual Machine Scale Sets skala otomatis

Penskalaan manual berguna dalam beberapa keadaan. Tetapi dalam banyak situasi, penskalaan otomatis lebih baik. Cara ini memungkinkan sistem mengontrol jumlah instans dalam set skala.

Anda dapat mendasarkan skala otomatis pada:

  • Jadwal: Gunakan pendekatan ini jika Anda tahu Anda akan memiliki peningkatan beban kerja pada tanggal atau periode waktu tertentu.
  • Metrik: Sesuaikan penskalaan dengan memantau metrik performa yang terkait dengan set skala. Ketika metrik ini melebihi ambang batas tertentu, set skala dapat memulai instan komputer virtual baru secara otomatis. Ketika metrik menunjukkan bahwa sumber daya tambahan tidak lagi diperlukan, set skala dapat menghentikan kelebihan instans.

Menentukan kondisi, aturan, dan batas skala otomatis

Penskalaan otomatis didasarkan pada set kondisi, aturan, dan batasan skala. Kondisi skala menggabungkan waktu dan set aturan skala. Jika waktu saat ini berada dalam periode yang ditentukan dalam kondisi skala, aturan skala kondisi akan dievaluasi. Hasil evaluasi ini menentukan apakah akan menambahkan atau menghapus instans dalam set skala. Kondisi skala juga menentukan batas penskalaan untuk jumlah instans maksimum dan minimum.

Dalam skenario perusahaan pengiriman, Anda dapat menambahkan aturan skala yang memantau penggunaan CPU di seluruh set skala. Jika penggunaan CPU melebihi ambang batas 75 persen, aturan skala dapat meningkatkan jumlah instans komputer virtual. Aturan skala kedua juga dapat memantau penggunaan CPU, tetapi mengurangi jumlah instans komputer virtual saat penggunaan berada di bawah 50 persen. Karena aplikasi ini global, aturan ini harus aktif sepanjang waktu daripada hanya pada jam-jam tertentu.

Set Skala Komputer Virtual dapat berisi banyak kondisi skala. Setiap kondisi skala yang cocok ditindaklanjuti. Set skala juga dapat berisi kondisi skala default yang digunakan jika tidak ada kondisi skala lain yang cocok dengan metrik waktu dan performa saat ini. Kondisi skala default selalu aktif. Ini tidak berisi aturan skala, secara efektif bertindak seperti kondisi skala null yang tidak menskalakan masuk atau keluar. Namun, Anda dapat memodifikasi kondisi skala default untuk mengatur jumlah instans default, atau Anda dapat menambahkan sepasang aturan skala yang menskalakan keluar dan kembali masuk lagi.

Menggunakan penskalaan otomatis berbasis jadwal

Penskalaan berbasis jadwal menentukan waktu mulai dan berakhir serta jumlah instans yang akan ditambahkan ke set skala. Cuplikan layar berikut ini memperlihatkan contoh di portal Azure. Jumlah instans diperluas skalanya hingga 20 antara pukul 06:00 dan 18:00 setiap Hari Senin dan Rabu. Di luar waktu ini, jika tidak ada kondisi skala lain, kondisi skala default diterapkan.

Dalam hal ini, aturan default menuurunkan kembali skala sistem ke dua instans. Nilai ini adalah Maksimum dalam kondisi skala default ini.

Cuplikan layar memperlihatkan contoh kondisi skala berbasis jadwal.

Menggunakan penskalaan otomatis berbasis metrik

Aturan skala berbasis metrik menentukan sumber daya untuk dipantau, seperti penggunaan CPU atau waktu respons. Aturan skala ini menambahkan atau menghapus instans dari skala yang ditetapkan sesuai dengan nilai metrik ini. Anda dapat menentukan batasan jumlah instans untuk mencegah set skala masuk atau keluar secara berlebihan.

Dalam contoh skenario, Anda ingin meningkatkan jumlah instans satu per satu ketika penggunaan CPU rata-rata melebihi 75 persen. Selain itu, Anda ingin membatasi operasi peluasan skala hingga 50 instans. Batas ini dapat membantu mencegah penskalaan runaway yang mahal yang disebabkan oleh serangan. Demikian pula, Anda ingin menurunkan skala ketika penggunaan CPU rata-rata turun di bawah 50 persen.

Metrik ini umumnya digunakan untuk memantau Set Skala Komputer Virtual:

  • Persentase CPU: Metrik ini menunjukkan penggunaan CPU di semua instans. Nilai tinggi menunjukkan bahwa instans menjadi terikat pada CPU, yang dapat menunda pemrosesan permintaan klien.
  • Alur masuk dan alur keluar: Metrik ini menunjukkan seberapa cepat lalu lintas jaringan mengalir masuk dan keluar dari komputer virtual dalam set skala.
  • Operasi pembacaan disk/detik dan operasi penulisan disk/detik: Metrik ini menunjukkan volume I/O disk di seluruh set skala.
  • Kedalaman antrean disk data: Metrik ini menunjukkan jumlah permintaan I/O hanya untuk disk data pada komputer virtual yang menunggu diservis.

Aturan skala menggabungkan nilai yang diambil untuk metrik semua instans. Ini menggabungkan nilai-nilai di seluruh periode yang disebut sebagai butir waktu. Setiap metrik memiliki butir waktu intrinsik, tetapi biasanya periode ini berlangsung satu menit. Nilai agregat dikenal sebagai agregasi waktu. Opsi agregasi waktu adalah rata-rata, minimum, maksimum, total, terakhir, dan hitungan.

Interval satu menit terlalu singkat untuk menentukan apakah ada perubahan dalam metrik yang cukup lama untuk membuat penskalaan otomatis bermanfaat. Aturan skala mengambil langkah kedua, yang selanjutnya menggabungkan nilai agregasi waktu selama periode yang lebih lama dan ditentukan pengguna. Periode ini disebut durasi. Durasi minimum adalah lima menit. Misalnya, jika durasi diatur ke 10 menit, aturan skala menggabungkan 10 nilai yang dihitung untuk butir waktu.

Penghitungan agregasi durasi dapat berbeda dari penghitungan agregasi butir waktu. Misalnya, agregasi waktu rata-rata dan statistik yang dikumpulkan adalah persentase CPU di seluruh butir waktu satu menit. Untuk setiap menit, rata-rata penggunaan persentase CPU di semua instans selama menit tersebut akan dihitung. Jika statistik butir waktu diatur ke maksimum dan aturan diatur ke 10 menit, maksimum dari 10 nilai rata-rata untuk persentase pengggunaan CPU akan menentukan apakah ambang batas aturan terlampaui.

Ketika aturan skala mendeteksi bahwa metrik telah melewati ambang batas, aturan tersebut dapat melakukan tindakan skala. Tindakan skala dapat menjadi peluasan skala atau penurunan skala. Tindakan peluasan skala meningkatkan jumlah instans. Tindakan penurunan skala mengurangi jumlah instans.

Tindakan skala menggunakan operator seperti kurang dari, lebih besar dari, sama dengan untuk menentukan cara bereaksi terhadap ambang batas. Tindakan peluasan skala biasanya menggunakan operator lebih besar dari untuk membandingkan nilai metrik dengan ambang batas. Tindakan penurunan skala cenderung membandingkan nilai metrik dengan ambang batas menggunakan operator kurang dari. Tindakan skala juga menetapkan jumlah instans ke tingkat tertentu daripada menambah atau mengurangi jumlah yang tersedia.

Tindakan skala memiliki periode pendinginan, yang ditentukan dalam menit. Selama periode ini, aturan skala tidak terpicu lagi. Periode pendinginan memungkinkan sistem menstabilkan antarperistiwa skala. Memulai atau mematikan instans membutuhkan waktu, sehingga metrik apa pun yang dikumpulkan mungkin tidak menampilkan perubahan signifikan selama beberapa menit. Periode pendinginan minimum adalah lima menit.

Terakhir, Anda harus merencanakan penyempurnaan skala ketika beban kerja berkurang. Pertimbangkan untuk menentukan aturan skala berpasangan dalam kondisi skala yang sama. Satu aturan skala harus menunjukkan cara memperluas skala sistem saat metrik melebihi ambang batas atas. Aturan lain harus menentukan cara menurunkan kembali skala sistem ketika metrik yang sama turun di bawah ambang batas yang lebih rendah. Jangan membuat kedua nilai ambang batas sama. Jika tidak, Anda dapat memicu serangkaian peristiwa berosilasi yang menskalakan keluar dan kembali masuk lagi.

Gambar berikut memperlihatkan aturan skala yang ditentukan di portal Azure.

Cuplikan layar aturan skala berbasis metrik di portal Azure.