HortonWorks Veri Platformu'nun Docker dağıtımını kullanarak Azure Lab Services'da büyük veri analizi için bir laboratuvar ayarlama
Not
Bu makalede laboratuvar hesaplarının yerini alan laboratuvar planlarındaki özelliklere başvuruda bulunulmaktadır.
Bu makalede, büyük veri analizi sınıfını öğretmek için bir laboratuvarın nasıl ayarlanacağı gösterilmektedir. Büyük veri analizi sınıfı, kullanıcılara büyük hacimli verilerin nasıl işleneceğini öğretir. Ayrıca veri içgörüleri türetmek için makine ve istatistiksel öğrenme algoritmaları uygulamayı da öğretir. Temel bir amaç, Apache Hadoop'un açık kaynak yazılım paketi gibi veri analizi araçlarını kullanmayı öğrenmektir. Yazılım paketi büyük verileri depolamak, yönetmek ve işlemek için araçlar sağlar.
Bu laboratuvarda laboratuvar kullanıcıları, Cloudera tarafından sağlanan Hortonworks Veri Platformu (HDP) adlı popüler bir hadoop ticari sürümüyle çalışır. Özellikle, laboratuvar kullanıcıları platformun basitleştirilmiş, kullanımı kolay bir sürümü olan HDP Korumalı Alanı 3.0.1'i kullanır. HDP Sandbox 3.0.1 de ücretsizdir ve öğrenme ve deneme amaçlıdır. Bu sınıf, HDP Korumalı Alanı dağıtılan Windows veya Linux sanal makinelerini (VM) kullanabilir. Bu makalede Windows'un nasıl kullanılacağı gösterilmektedir.
Bir diğer ilginç yönü de, Docker kapsayıcılarını kullanarak HDP Korumalı Alanı'nı laboratuvar VM'lerine dağıtmanızdır. Her Docker kapsayıcısı, yazılım uygulamalarının içinde çalışması için kendi yalıtılmış ortamını sağlar. Kavramsal olarak Docker kapsayıcıları iç içe VM'ler gibidir ve Docker Hub'da sağlanan kapsayıcı görüntülerine göre çok çeşitli yazılım uygulamalarını kolayca dağıtmak ve çalıştırmak için kullanılabilir. Cloudera'nın HDP Korumalı Alanı dağıtım betiği, HDP Sandbox 3.0.1 Docker görüntüsünü Docker Hub'dan otomatik olarak çeker ve iki Docker kapsayıcısı çalıştırır:
- sandbox-hdp
- sandbox-proxy
Önkoşullar
Bu laboratuvarı ayarlamak için bir Azure aboneliğine erişmeniz gerekir. Mevcut bir Azure aboneliğine erişim elde etmek için kuruluşunuzun yöneticisiyle görüşün. Azure aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.
Laboratuvar yapılandırması
Laboratuvar planı ayarları
Azure aboneliğiniz olduktan sonra Azure Lab Services'de laboratuvar planı oluşturabilirsiniz. Yeni laboratuvar planı oluşturma hakkında daha fazla bilgi için bkz . Hızlı Başlangıç: Laboratuvar oluşturmak için kaynakları ayarlama. Ayrıca mevcut bir laboratuvar planını da kullanabilirsiniz.
Bu laboratuvarda temel VM görüntüsü olarak windows 10 Pro Azure Market görüntüleri kullanılır. Önce laboratuvar planınızda bu görüntüyü etkinleştirmeniz gerekir. Bu, laboratuvar oluşturucularının daha sonra laboratuvarları için temel görüntü olarak görüntüyü seçmesine olanak tanır.
Laboratuvar oluşturucularının kullanabileceği bu Azure Market görüntüleri etkinleştirmek için bu adımları izleyin. Windows 10 Azure Market görüntülerinden birini seçin.
Laboratuvar ayarları
Laboratuvar planınız için bir laboratuvar oluşturun. Laboratuvar oluşturma yönergeleri için bkz . Öğretici: Laboratuvar ayarlama. Laboratuvarı oluştururken aşağıdaki ayarları kullanın.
Laboratuvar ayarları | Değer/yönergeler |
---|---|
Sanal Makine Boyutu | Orta (İç İçe Sanallaştırma). Bu VM boyutu ilişkisel veritabanları, bellek içi önbelleğe alma ve analiz için en uygun seçenektir. Boyut, iç içe sanallaştırmayı da destekler. |
Sanal Makine Görüntüsü | Windows 10 Pro |
Not
Docker kullanan HDP Korumalı Alanı iç içe sanallaştırma ve en az 10 GB RAM ile Windows Hyper-V gerektirdiğinden Orta (İç İçe Sanallaştırma) VM boyutunu kullanın.
Şablon makine yapılandırması
Şablon makinesini ayarlamak için:
- Docker'ı yükleme
- HDP Korumalı Alanı dağıtma
- Docker kapsayıcılarını otomatik olarak başlatmak için PowerShell ve Windows Görev Zamanlayıcı'yı kullanma
Docker'ı yükleme
Bu bölümdeki adımlar, Cloudera'nın Docker kapsayıcılarıyla dağıtma yönergelerini temel alır.
Docker kapsayıcılarını kullanmak için önce şablon VM'sine Docker Desktop'ı yüklemeniz gerekir:
Windows için Docker'ı yüklemek için Önkoşullar bölümündeki adımları izleyin.
Önemli
Linux kapsayıcıları yerine Windows kapsayıcılarını kullan yapılandırma seçeneğinin işaretsiz bırakıldığından emin olun.
Windows Kapsayıcıları ve Hyper-V özelliklerinin açık olduğundan emin olun.
Docker'ın bellek yapılandırmasını yapılandırmak için Windows için Bellek bölümündeki adımları izleyin.
Uyarı
Docker'ı yüklerken yanlışlıkla Linux kapsayıcıları yerine Windows kapsayıcılarını kullan seçeneğini denetlerseniz bellek yapılandırma ayarlarını görmezsiniz. Bunu düzeltmek için Windows Sistem tepsisindeki Docker simgesine tıklayarak Linux kapsayıcılarını kullanmaya geçebilirsiniz; Docker Desktop menüsü açıldığında Linux kapsayıcılarına geç'i seçin.
HDP Korumalı Alanı dağıtma
Ardından HDP Korumalı Alanı'nı dağıtın ve ardından tarayıcıyı kullanarak HDP Korumalı Alanı'na erişin.
Git Bash'i kılavuzun Önkoşullar bölümünde listelenen şekilde yüklediğinizden emin olun. Sonraki adımları tamamlamak için önerilir.
Cloudera'nın Docker için Dağıtım ve Yükleme Kılavuzu'nu kullanarak aşağıdaki bölümlerdeki adımları tamamlayın:
- HDP Korumalı Alanı dağıtma
- HDP Korumalı Alanını Doğrulama
Uyarı
HDP için en son .zip dosyasını indirdiğinizde, .zip dosyasını boşluk içeren bir dizin yoluna kaydetmediğinizden emin olun.
Not
Dağıtım sırasında Drive'ın paylaşılmadığını belirten bir özel durum alırsanız, HDP'nin Linux kapsayıcılarının yerel Windows dosyalarına erişebilmesi için C sürücünüzü Docker ile paylaşmanız gerekir. Bunu düzeltmek için Windows Sistem tepsisindeki Docker simgesine tıklayarak Docker Desktop menüsünü açın ve Ayarlar seçin. Docker'ın Ayarlar iletişim kutusu açıldığında Kaynaklar > Dosya Paylaşımı'nı seçin ve C sürücüsünü denetleyin. Ardından HDP Korumalı Alanı dağıtma adımlarını yineleyebilirsiniz.
HDP Korumalı Alanı için Docker kapsayıcıları dağıtıldığında ve çalıştığında, tarayıcınızı başlatarak ortama erişebilirsiniz. Korumalı Alan Karşılama Sayfası'nı açmak ve HDP Panosunu başlatmak için Cloudera'nın yönergelerini izleyin.
Not
Bu yönergelerde, önce korumalı alan ortamının yerel IP adresini şablon VM'nizdeki konak dosyasındaki sandbox-hdp.hortonworks.com eşlediğiniz varsayılır. Bu eşlemeyi yapmazsanız, adresine giderek
http://localhost:8080
Korumalı Alan Karşılama sayfasına erişebilirsiniz.
Laboratuvar kullanıcıları oturum açtığında Docker kapsayıcılarını otomatik olarak başlatma
Laboratuvar kullanıcılarına kullanımı kolay bir deneyim sağlamak için, otomatik olarak şu komutu kullanan bir PowerShell betiği oluşturun:
- Bir laboratuvar kullanıcısı başlatıldığında ve laboratuvar VM'sine bağlandığında HDP Korumalı Alan Docker kapsayıcılarını başlatır.
- Tarayıcıyı başlatır ve Korumalı Alan Karşılama sayfasına gider.
Laboratuvar kullanıcısı vm'sinde oturum açtığında bu betiği otomatik olarak çalıştırmak için Windows Görev Zamanlayıcı'yı kullanın. Bir Görev Zamanlayıcı ayarlamak için şu adımları izleyin: Büyük Veri Analizi betiği oluşturma.
Maliyet tahmini
Bu bölüm, 25 laboratuvar kullanıcısı için bu sınıfı çalıştırmaya yönelik bir maliyet tahmini sağlar. 20 saatlik zamanlanmış sınıf süresi vardır. Ayrıca, her kullanıcı zamanlanmış ders saati dışında ev ödevi veya ödevler için 10 saat kota alır. Seçtiğimiz sanal makine boyutu, 55 laboratuvar birimi olan Orta (İç İçe Sanallaştırma) idi.
- 25 laboratuvar kullanıcısı × (20 zamanlanmış saat + 10 kota saati) × 55 laboratuvar birimi
Önemli
Maliyet tahmini yalnızca örnek amaçlıdır. Geçerli fiyatlandırma bilgileri için bkz . Azure Lab Services fiyatlandırması.
Sonuç
Bu makalede, büyük bir veri analizi sınıfı için laboratuvar oluşturmak için gereken adımlarda size yol gösterilir. Büyük veri analizi sınıfı, Docker ile dağıtılan Hortonworks Veri Platformunu kullanır. Bu sınıf türü için kurulum, benzer veri analizi sınıfları için kullanılabilir. Bu kurulum, dağıtım için Docker kullanan diğer sınıf türleri için de geçerli olabilir.
Sonraki adımlar
Şablon görüntüsü artık laboratuvarda yayımlanabilir. Daha fazla bilgi için bkz . Şablon VM'sini yayımlama.
Laboratuvarınızı ayarlarken aşağıdaki makalelere bakın:
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin