Mengelola kluster Apache Hadoop di HDInsight dengan menggunakan portal Microsoft Azure
Dengan menggunakan portal Microsoft Azure, Anda dapat mengelola kluster Apache Hadoop di Microsoft Azure HDInsight. Gunakan pemilih tab untuk informasi tentang mengelola kluster Hadoop di HDInsight menggunakan alat lain.
Prasyarat
Klaster Apache Hadoop yang sudah ada di Microsoft Azure HDInsight. Untuk informasi selengkapnya, lihat Buat klaster berbasis Linux di Microsoft Azure HDInsight menggunakan portal Microsoft Azure.
Memulai
Masuklah ke https://portal.azure.com.
Mencantumkan dan menampilkan kluster
Halaman kluster HDInsight mencantumkan kluster yang ada. Dari portal:
- Pilih Semua layanan dari menu sebelah kiri.
- Pilih kluster Microsoft Azure HDInsight di bawah ANALITIK.
Halaman beranda kluster
Pilih nama kluster Anda dari halaman kluster Microsoft Azure HDInsight. Ini membuka tampilan Gambaran Umum , yang terlihat mirip dengan gambar berikut:
Menu atas:
Item | Deskripsi |
---|---|
Memindahkan | Pindahkan kluster ke grup sumber daya lain atau ke langganan lain. |
Hapus | Hapus klaster. |
Refresh | Refresh tampilan. |
Menu kiri:
Menu kiri atas
Item Deskripsi Gambaran Umum Berikan informasi umum untuk kluster Anda. Log aktivitas Tampilkan dan kueri log aktivitas. Kontrol akses (IAM) Gunakan penetapan peran. Lihat Tetapkan peran Azure untuk mengelola akses ke sumber daya langganan Azure Anda. Tag Izinkan Anda mengatur pasangan kunci/nilai untuk menentukan taksonomi kustom layanan awan Anda. Contohnya, Anda dapat membuat kunci bernama proyek, lalu menggunakan nilai umum untuk semua layanan yang terkait dengan proyek tertentu. Mendiagnosis dan memecahkan masalah Tampilkan informasi pemecahan masalah. Mulai Cepat Tampilkan informasi yang membantu Anda memulai penggunaan Microsoft Azure HDInsight. Alat Informasi bantuan untuk alat terkait Microsoft Azure HDInsight. Menu pengaturan
Item Deskripsi Ukuran kluster Periksa, tingkatkan, dan kurangi jumlah simpul pekerja kluster. Lihat Skalakan kluster. Batas kuota Tampilkan inti yang digunakan dan tersedia untuk langganan Anda. Login Kluster + SSH Tampilkan instruksi untuk terhubung ke kluster menggunakan koneksi Secure Shell (SSH). Untuk informasi selengkapnya, lihat Menggunakan SSH dengan HDInsight. Data Lake Storage Gen1 Konfigurasikan akses Data Lake Storage Gen1. Lihat Mulai cepat: Siapkan kluster di Mulai Microsoft Azure HDInsight. Akun penyimpanan Tampilkan akun penyimpanan dan kunci. Akun penyimpanan dikonfigurasi selama proses pembuatan kluster. Aplikasi Tambahkan/hapus aplikasi Microsoft Azure HDInsight. Lihat Instal aplikasi Microsoft Azure HDInsight kustom. Tindakan skrip Jalankan skrip Bash pada kluster. Lihat Kustomisasi kluster Microsoft Azure HDInsight berbasis Linux menggunakan Tindakan Skrip. Metastore eksternal Tampilkan metastore Apache Hive dan Apache Oozie. Metastore hanya dapat dikonfigurasi selama proses pembuatan kluster. Mitra HDInsight Tambahkan/hapus Microsoft Azure HDInsight Partner saat ini. Properti Tampilkanproperti klaster. Penguncian Tambahkan kunci untuk mencegah kluster dimodifikasi atau dihapus. Ekspor template Tampilkan dan ekspor templat Azure Resource Manager untuk kluster. Saat ini, Anda hanya dapat mengekspor akun penyimpanan Azure dependen. Lihat Buat kluster Apache Hadoop berbasis Linux di Microsoft Azure HDInsight menggunakan templat Azure Resource Manager. Menu pemantauan
Item Deskripsi Peringatan Kelola peringatan dan tindakan. Metrik Pantau metrik kluster di log Azure Monitor. Pengaturan diagnosis Pengaturan di tempat menyimpan metrik diagnosis. Azure Monitor Pantau kluster Anda di Azure Monitor. Dukungan + menu pemecahan masalah
Item Deskripsi Kondisi sumber daya Lihat Ikhtisar Azure resource health. Permintaan dukungan baru Izinkan Anda membuat tiket dukungan dengan dukungan Microsoft.
Properti Kluster
Dari halaman beranda kluster, di bawah Pengaturan pilih Properti.
Item | Deskripsi |
---|---|
HOSTNAME | Nama kluster. |
URL KLUSTER | URL untuk antarmuka web Ambari. |
Titik Akhir Pribadi | Titik akhir pribadi untuk kluster. |
Secure Shell (SSH) | Nama pengguna dan nama host untuk digunakan dalam mengakses kluster melalui SSH. |
STATUS | Salah satu dari: Dibatalkan, Diterima, ClusterStorageProvisioned, AzureVMConfiguration, HDInsightConfiguration, Operational, Running, Error, Deleting, Deleted, Timeout, DeleteQueued, DeleteTimeout, DeleteError, PatchQueued, CertRolloverQueued, ResizeQueued, atau ClusterCustomization. |
WILAYAH | Lokasi Azure. Untuk daftar lokasi Azure yang didukung, lihat kotak daftar tarik-turun Region pada harga Microsoft Azure HDInsight. |
TANGGAL DIBUAT | Tanggal kluster disebarkan. |
SISTEM OPERASI | Baik Windows atau Linux. |
TYPE | Hadoop, HBase, Spark. |
Versi | Lihat versi Microsoft Azure HDInsight. |
Versi TLS Minimum | Versi TLS. |
LANGGANAN | Nama langganan. |
SUMBER DATA DEFAULT | Sistem berkas klaster default. |
Ukuran node pekerja | Ukuran VM node pekerja yang dipilih. |
Ukuran node head | Ukuran VM node head yang dipilih. |
Jaringan virtual | Nama Virtual Network, yang disebarkan kluster, jika salah satu dipilih pada waktu penyebaran. |
Pindahkan kluster
Anda dapat memindahkan kluster Microsoft Azure HDInsight ke grup sumber daya Azure lain atau langganan lainnya.
Dari halaman beranda kluster:
- Pilih Pindahkan dari menu atas.
- Pilih Pindahkan ke grup sumber daya lain atau Pindah ke langganan lain.
- Ikuti instruksi dari halaman baru.
Hapus kluster
Penghapusan kluster tidak menghapus akun penyimpanan default atau akun penyimpanan apa pun yang ditautkan. Anda dapat membuat ulang kluster dengan menggunakan akun penyimpanan yang sama dan metastore yang sama. Kami menyarankan penggunaan kontainer Blob default baru saat Anda membuat ulang kluster.
Dari halaman beranda kluster:
- Pilih Hapus dari menu atas.
- Ikuti instruksi dari halaman baru.
Lihat juga Jeda/matikan kluster.
Menambahkan akun penyimpanan tambahan
Anda dapat menambahkan akun Azure Storage tambahan dan akun Azure Data Lake Storage setelah kluster dibuat. Untuk informasi selengkapnya, lihat Menambahkan akun penyimpanan tambahan ke HDInsight.
Menskalakan klaster
Fitur penskalaan kluster memungkinkan Anda mengubah jumlah simpul pekerja yang digunakan oleh kluster Microsoft Azure HDInsight, tanpa harus membuat ulang kluster.
Lihat Menskalakan klaster HDInsight untuk informasi selengkapnya.
Jeda/matikan kluster
Sebagian besar pekerjaan Hadoop adalah pekerjaan batch yang hanya dijalankan sesekali. Untuk sebagian besar kluster Hadoop, ada periode waktu yang lama di mana kluster tidak digunakan untuk pemrosesan. Dengan HDInsight, data Anda disimpan di Azure Storage, sehingga Anda dapat menghapus kluster dengan aman saat tidak digunakan. Anda juga dikenakan biaya untuk klaster HDInsight, bahkan saat tidak digunakan. Karena biaya untuk kluster berkali-kali lebih banyak daripada biaya untuk penyimpanan, masuk akal secara ekonomis untuk menghapus kluster saat tidak digunakan.
Ada banyak cara untuk memprogram proses ini:
- Azure Data Factory Pengguna. Lihat Buat kluster Apache Hadoop berbasis Linux sesuai permintaan di Microsoft Azure HDInsight menggunakan Azure Data Factory untuk membuat layanan Microsoft Azure HDInsight sesuai permintaan yang ditautkan.
- Menggunakan Azure PowerShell. Lihat Analisis data keterlambatan penerbangan.
- Gunakan Azure CLI. Lihat Kelola kluster Microsoft Azure HDInsight menggunakan Azure CLI.
- Gunakan Microsoft Azure HDInsight .NET SDK. Lihat Kirimkan pekerjaan Apache Hadoop.
Untuk informasi harga, lihat harga Microsoft Azure HDInsight. Untuk menghapus kluster dari Portal, lihat Hapus kluster
Meningkatkan kluster
Lihat Tingkatkan kluster Microsoft Azure HDInsight ke versi yang lebih baru.
Buka Apache Ambari web UI
Ambari menyediakan UI web manajemen Hadoop yang intuitif dan mudah digunakan yang didukung oleh API RESTful. Ambari mengaktifkan administrator sistem untuk mengelola dan memantau kluster Hadoop.
Dari halaman beranda kluster:
Pilih Dasbor kluster.
Pilih beranda Ambari dari halaman baru.
Masukkan nama pengguna dan kata sandi kluster. Nama pengguna kluster default adalah admin.
Untuk informasi selengkapnya, lihat Kelola kluster Microsoft Azure HDInsight dengan menggunakan Apache Ambari Web UI.
Mengubah kata sandi
Kluster Microsoft Azure HDInsight dapat memiliki dua akun pengguna. Akun pengguna kluster Microsoft Azure HDInsight (akun pengguna HTTP) dan akun pengguna SSH dibuat selama proses pembuatan. Anda bisa menggunakan portal untuk mengubah kata sandi akun pengguna kluster, dan tindakan skrip untuk mengubah akun pengguna SSH.
Ubah kata sandi pengguna kluster
Catatan
Mengubah kata sandi pengguna kluster (admin) dapat menyebabkan jalankan tindakan skrip terhadap kluster ini gagal. Jika Anda memiliki tindakan skrip yang dipertahankan yang menargetkan simpul pekerja, skrip ini mungkin gagal ketika Anda menambahkan simpul ke kluster melalui operasi pengukuran ulang. Untuk informasi selengkapnya tentang tindakan skrip, lihat Kustomisasi Microsoft Azure HDInsight menggunakan tindakan skrip.
Dari halaman beranda kluster:
- Pilih Login SSH + Kluster di bawah Pengaturan.
- Pilih Atur ulang info masuk.
- Masukkan dan konfirmasi kata sandi baru dalam kotak teks.
- Pilih OK.
Kata sandi diubah pada semua simpul di kluster.
Ubah kata sandi pengguna atau kunci publik SSH
Dengan menggunakan editor teks, simpan teks berikut sebagai file bernama changecredentials.sh.
Penting
Anda harus menggunakan editor yang menggunakan LF sebagai akhir baris. Jika editor menggunakan CRLF, maka skrip tidak berfungsi.
#! /bin/bash USER=$1 PASS=$2 usermod --password $(echo $PASS | openssl passwd -1 -stdin) $USER
Unggah file ke lokasi penyimpanan yang dapat diakses dari Microsoft Azure HDInsight menggunakan alamat HTTP atau HTTPS. Misalnya, penyimpanan file publik seperti OneDrive atau penyimpanan Azure Blob. Simpan alamat URI (HTTP atau HTTPS) ke file, karena URI ini diperlukan di langkah berikutnya.
Dari halaman beranda kluster,pilih Tindakan skrip di bawah Pengaturan.
Dari halaman Tindakan skrip, pilih Kirim baru.
Dari halaman Kirim tindakan skrip, masukkan informasi berikut:
Catatan
Kata sandi SSH tidak boleh berisi karakter berikut:
" ' ` / \ < % ~ | $ & ! #
Bidang | Nilai |
---|---|
Jenis skrip | Pilih - Kustom dari daftar tarik-turun. |
Nama | "Ubah info masuk ssh" |
URI skrip bash | URI ke file changecredentials.sh |
Jenis simpul: (Kepala, Pekerja, Nimbus, Supervisor, atau Zookeeper.) | ✓ untuk semua jenis node yang tercantum |
Parameter | Masukkan nama pengguna SSH lalu kata sandi baru. Harus ada satu ruang antara nama pengguna dan kata sandi. |
Pertahankan tindakan skrip ini ... | Biarkan bidang ini tidak dicentang. |
- Pilih Buat untuk menerapkan skrip. Setelah skrip selesai, Anda dapat terhubung ke kluster menggunakan SSH dengan info masuk baru.
Temukan ID langganan
Setiap kluster terikat dengan langganan Azure. ID langganan Azure terlihat dari halaman beranda kluster.
Temukan grup sumber daya
Dalam mode Azure Resource Manager, setiap kluster Microsoft Azure HDInsight dibuat dengan grup Azure Resource Manager. Grup Resource Manager terlihat dari halaman beranda kluster.
Temukan akun penyimpanan
Kluster Microsoft Azure HDInsight menggunakan akun Azure Storage atau Azure Data Lake Storage untuk menyimpan data. Setiap kluster Microsoft Azure HDInsight dapat memiliki satu akun penyimpanan default dan sejumlah akun penyimpanan yang ditautkan. Untuk mencantumkan akun penyimpanan, dari halaman beranda kluster di bawah Pengaturan, pilih Akun penyimpanan.
Pantau pekerjaan
Lihat Kelola kluster Microsoft Azure HDInsight dengan menggunakan Apache Ambari Web UI.
Ukuran kluster
Petak ukuran kluster dari halaman beranda klaster menampilkan jumlah inti yang dialokasikan untuk kluster ini dan cara mereka dialokasikan untuk node dalam kluster ini.
Penting
Untuk memantau layanan yang disediakan oleh kluster Microsoft Azure HDInsight, Anda harus menggunakan Ambari Web atau Ambari REST API. Untuk informasi selengkapnya tentang penggunaan Ambari, lihat Kelola kluster Microsoft Azure HDInsight menggunakan Apache Ambari
Terhubung ke klaster
Langkah berikutnya
Dalam artikel ini, Anda mempelajari beberapa fungsi administratif dasar. Untuk mempelajari selengkapnya, lihat artikel berikut ini:
- Kelola Microsoft Azure HDInsight Menggunakan Azure PowerShell
- Kelola Microsoft Azure HDInsight Menggunakan Azure CLI
- Buat kluster Microsoft Azure HDInsight
- Rincian tentang penggunaan Apache Ambari REST API
- Gunakan Apache Hive di Microsoft Azure HDInsight
- Menggunakan Apache Sqoop di HDInsight
- Gunakan Python User Defined Functions (UDF) dengan Apache Hive dan Apache Pig di HDInsight
- Apa saja versi Apache Hadoop di Azure Microsoft Azure HDInsight?