Hızlı Başlangıç: Azure portalını kullanarak yeni bir sunucusuz Apache Spark havuzu oluşturma

Azure Synapse Analytics, verilerinizi alma, dönüştürme, modelleme, analiz etme ve dağıtmanıza yardımcı olan çeşitli analiz altyapıları sunar. Apache Spark havuzu açık kaynak büyük veri işlem özellikleri sağlar. Synapse çalışma alanınızda bir Apache Spark havuzu oluşturduktan sonra daha hızlı analiz içgörüleri için veriler yüklenebilir, modellenebilir, işlenebilir ve dağıtılabilir.

Bu hızlı başlangıçta Azure portalını kullanarak Synapse çalışma alanında Apache Spark havuzu oluşturmayı öğreneceksiniz.

Önemli

Spark örnekleri için faturalama, kullansanız da kullanmasanız da dakikada bir eşit olarak dağıtılır. Spark örneğinizi kullanmayı tamamladıktan sonra kapatdığınızdan veya kısa bir zaman aşımı ayarladığınızdan emin olun. Daha fazla bilgi için bu makalenin Kaynakları temizleme bölümüne bakın.

Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

Önkoşullar

Azure portalda oturum açma

Azure portalda oturum açma

  1. Arama çubuğuna hizmet adını (veya kaynak adını doğrudan) yazarak Apache Spark havuzunun oluşturulacağı Synapse çalışma alanına gidin. Screenshot of the Azure portal search bar with Synapse workspaces typed in.

  2. Çalışma alanları listesinden, açılacak çalışma alanının adını (veya adının bir bölümünü) yazın. Bu örnekte contosoanalytics adlı bir çalışma alanı kullanıyoruz. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

Yeni Apache Spark havuzu oluşturma

Önemli

Apache Spark 2.4 için Azure Synapse Runtime kullanım dışı bırakıldı ve Eylül 2023'ten bu yana resmi olarak desteklenmiyor. Spark 3.1 ve Spark 3.2 de Destek Sonu duyurulduğunda müşterilerin Spark 3.3'e geçmelerini öneririz.

  1. Apache Spark havuzunu oluşturmak istediğiniz Synapse çalışma alanında Yeni Apache Spark havuzu'na tıklayın. Screenshot from the Azure portal of a Synapse workspace with a red box around the command to create a new Apache Spark pool.

  2. Temel Bilgiler sekmesine aşağıdaki ayrıntıları girin:

    Ayar Önerilen değer Açıklama
    Apache Spark havuzu adı Geçerli bir havuz adı, örneğin contosospark Bu, Apache Spark havuzunun sahip olacağı addır.
    Düğüm boyutu Küçük (4 vCPU / 32 GB) Bu hızlı başlangıcın maliyetlerini azaltmak için bunu en küçük boyuta ayarlayın
    Otomatik Ölçeklendirme Devre dışı Bu hızlı başlangıç için otomatik ölçeklendirmeye ihtiyacımız yok
    Düğüm sayısı 5 Bu hızlı başlangıçta maliyetleri sınırlamak için küçük bir boyut kullanın

    Screenshot from the Azure portal of the Apache Spark pool create flow - basics tab.

    Önemli

    Apache Spark havuzlarının kullanabileceği adlar için belirli sınırlamalar vardır. Adlar yalnızca harf veya sayı içermelidir, 15 veya daha az karakter uzunluğunda olmalı, bir harfle başlamalıdır, ayrılmış sözcükler içermemelidir ve çalışma alanında benzersiz olmalıdır.

  3. İleri: ek ayarlar'ı seçin ve varsayılan ayarları gözden geçirin. Varsayılan ayarları değiştirmeyin. Screenshot from the Azure portal that shows the 'Create Apache Spark pool' page with the 'Additional settings' tab selected.

  4. İleri: etiketler'i seçin. Azure etiketlerini kullanmayı göz önünde bulundurun. Örneğin, kaynağı kimin oluşturduğunu belirlemek için "Sahip" veya "CreatedBy" etiketi ve bu kaynağın Üretim, Geliştirme vb. içinde olup olmadığını belirlemek için "Ortam" etiketi. Daha fazla bilgi için bkz . Azure kaynakları için adlandırma ve etiketleme stratejinizi geliştirme. Screenshot from the Azure portal of Apache Spark pool create flow - additional settings tab.

  5. Gözden geçir ve oluştur’u seçin.

  6. Daha önce girilen bilgilere göre ayrıntıların doğru göründüğünden emin olun ve Oluştur'u seçin. Screenshot from the Azure portal of Apache Spark pool create flow - review settings tab.

  7. Bu noktada, kaynak sağlama akışı başlatılır ve tamamlandıktan sonra gösterilir. Screenshot from the Azure portal of that shows the 'Overview' page with a 'Your deployment is complete' message displayed.

  8. Sağlama tamamlandıktan sonra çalışma alanına geri döndüğünüzde yeni oluşturulan Apache Spark havuzu için yeni bir giriş gösterilir. Screenshot from the Azure portal of Apache Spark pool create flow - resource provisioning.

  9. Bu noktada çalışan kaynak yok, Spark için ücret yok, oluşturmak istediğiniz Spark örnekleriyle ilgili meta veriler oluşturdunuz.

Kaynakları temizleme

Aşağıdaki adımlar Apache Spark havuzunu çalışma alanından siler.

Uyarı

Apache Spark havuzunun silinmesi, analiz altyapısını çalışma alanından kaldırır. Artık havuza bağlanmak mümkün olmayacak ve bu Apache Spark havuzunu kullanan tüm sorgular, işlem hatları ve not defterleri artık çalışmayacaktır.

Apache Spark havuzunu silmek istiyorsanız aşağıdaki adımları uygulayın:

  1. Çalışma alanında Apache Spark havuzları bölmesine gidin.
  2. Silinecek Apache Spark havuzunu seçin (bu örnekte contosospark).
  3. Sil'i seçin. Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.
  4. Silme işlemini onaylayın ve Sil düğmesini seçin. Screenshot from the Azure portal of the Confirmation dialog to delete the selected Apache Spark pool.
  5. İşlem başarıyla tamamlandığında Apache Spark havuzu artık çalışma alanı kaynaklarında listelenmez.