Mulai Cepat: Membuat kumpulan Apache Spark tanpa server menggunakan portal Microsoft Azure

Azure Synapse Analytics menawarkan berbagai mesin analitik untuk membantu Anda menyerap, mengubah, membuat model, menganalisis, dan mendistribusikan data. Kumpulan Apache Spark menawarkan kemampuan komputasi big data sumber terbuka. Setelah Anda membuat kumpulan Apache Spark di ruang kerja Synapse, data dapat dimuat, dimodelkan, diproses, dan didistribusikan untuk wawasan analitik yang lebih cepat.

Dalam panduan mulai cepat ini, Anda belajar cara menggunakan portal Microsoft Azure untuk membuat kumpulan Apache Spark di ruang kerja Synapse.

Penting

Instans tagihan untuk Spark diprorata per menit, baik digunakan atau tidak. Pastikan Anda mematikan instans Spark setelah selesai menggunakannya, atau atur waktu jangka pendek. Untuk informasi selengkapnya, lihat bagian Membersihkan sumber daya di artikel ini.

Jika Anda tidak memiliki langganan Azure, buat akun gratis sebelum memulai.

Prasyarat

Masuk ke portal Microsoft Azure

Masuk ke portal Azure

  1. Buka ruang kerja Synapse tempat kumpulan Apache Spark akan dibuat dengan mengetikkan nama layanan (atau nama sumber daya secara langsung) ke dalam bilah pencarian.

    Bilah pencarian portal Microsoft Azure dengan ruang kerja Synapse yang telah diketik.

  2. Dari daftar ruang kerja, ketik nama (atau bagian dari nama) ruang kerja untuk membukanya. Untuk contoh ini, kita akan menggunakan ruang kerja bernama contosoanalytics. Daftar ruang kerja Synapse yang difilter untuk memperlihatkan ruang kerja yang berisi nama Contoso.

Membuat kumpulan Apache Spark baru

  1. Di ruang kerja Synapse, tempat Anda ingin membuat kumpulan Apache Spark, pilih Kumpulan Apache Spark baru. Gambaran umum ruang kerja Synapse dengan kotak merah di sekitar perintah untuk membuat kumpulan Apache Spark baru

  2. Pada tab Dasar, masukkan nilai berikut ini:

    Pengaturan Nilai yang disarankan Deskripsi 
    Nama kumpulan Apache Spark Nama kumpulan yang valid Ini adalah nama yang akan dimiliki kumpulan Apache Spark.
    Ukuran simpul Kecil (4 vCPU / 32 GB) Atur ke ukuran terkecil untuk mengurangi biaya untuk mulai cepat ini
    Skala otomatis Nonaktif Kita tidak perlu penskalaan otomatis untuk panduan mulai cepat ini
    Jumlah node 5 Gunakan ukuran kecil untuk membatasi biaya dalam panduan mulai cepat ini

    Alur pembuatan kumpulan Apache Spark - tab dasar.

    Penting

    Perhatikan ada batasan khusus untuk nama yang dapat digunakan kumpulan Apache Spark. Nama harus berisi huruf atau angka saja, harus 15 karakter atau kurang, harus dimulai dengan huruf, tidak berisi kata khusus, dan unik di ruang kerja.

  3. Pilih Berikutnya: pengaturan tambahan dan tinjau pengaturan default. Jangan ubah setelan default. Cuplikan layar yang memperlihatkan halaman "Buat kumpulan Apache Spark" dengan tab "Pengaturan tambahan" dipilih.

  4. Pilih Berikutnya: Tag. Jangan tambahkan tag. Alur pembuatan kumpulan Apache Spark - tab pengaturan tambahan.

  5. Pilih Tinjau + buat.

  6. Pastikan bahwa detailnya sudah terlihat benar sesuai dengan yang dimasukkan sebelumnya, lalu pilih Buat. Alur pembuatan Apache Spark - tinjau tab pengaturan.

  7. Pada titik ini, aliran provisi sumber daya akan dimulai, akan muncul tanda setelah selesai. Cuplikan layar yang memperlihatkan halaman "Gambaran Umum" dengan pesan "Penyebaran selesai" ditampilkan.

  8. Setelah provisi selesai, buka kembali ruang kerja dan Anda akan melihat entri baru untuk kumpulan Apache Spark yang baru dibuat. Alur pembuatan kumpulan Apache Spark - provisi sumber daya.

  9. Pada titik ini, tidak ada sumber daya yang berjalan, tidak ada biaya untuk Spark, Anda telah membuat metadata tentang instance Spark yang ingin dibuat.

Membersihkan sumber daya

Ikuti langkah-langkah di bawah ini untuk menghapus kumpulan Apache Spark dari ruang kerja.

Peringatan

Menghapus kumpulan Apache Spark akan menghapus mesin analitik dari ruang kerja. Tidak akan mungkin lagi terhubung ke kumpulan, dan semua kueri, alur, serta buku catatan yang menggunakan kumpulan Apache Spark ini tidak akan berfungsi lagi.

Jika Anda ingin menghapus kumpulan Apache Spark, lakukan hal berikut:

  1. Buka blade kumpulan Apache Spark di ruang kerja.
  2. Pilih kumpulan Apache Spark yang akan dihapus (dalam hal ini, contosospark).
  3. Tekan hapus. Daftar kumpulan Apache Spark, dengan kumpulan yang baru dibuat terpilih.
  4. Konfirmasi penghapusan, lalu tekan tombol Hapus. Dialog konfirmasi untuk menghapus kumpulan Apache Spark yang dipilih.
  5. Ketika proses tersebut selesai dengan sukses, kumpulan Apache Spark tidak akan lagi tercantum dalam sumber daya ruang kerja.

Langkah berikutnya