Azure Machine Learning bileşeni nedir?

ŞUNLAR IÇIN GEÇERLIDIR: Azure CLI ml uzantısı v2 (geçerli)Python SDK azure-ai-ml v2 (geçerli)

Azure Machine Learning bileşeni, makine öğrenmesi işlem hattında tek adımlık bir işlem hattı oluşturan, bağımsız bir kod parçasıdır. Bileşen bir işleve benzer; adı, girişleri, çıkışları ve gövdesi vardır. Bileşenler, Azure Machine Learning işlem hatlarının yapı taşlarıdır.

Bir bileşen üç bölümden oluşur:

  • Meta veriler: ad, display_name, sürüm, tür vb.
  • Arabirim: giriş/çıkış belirtimleri (ad, tür, açıklama, varsayılan değer vb.).
  • Command, Code & Environment: komutu, kod ve bileşeni çalıştırmak için gereken ortam.

Diagram of what a component looks like and how it looks in a pipeline. In addition to screenshots of a component in the CLI, SDK, and portal UI.

Neden bir bileşen kullanmalıyım?

Eksiksiz bir makine öğrenmesi görevini çok adımlı bir iş akışına bölmek için makine öğrenmesi işlem hattı oluşturmak iyi bir mühendislik uygulamasıdır. Böylece, herkes belirli bir adım üzerinde bağımsız olarak çalışabilir. Azure Machine Learning'de bir bileşen, işlem hattında yeniden kullanılabilir bir adımı temsil eder. Bileşenler, işlem hattı binasının üretkenliğini artırmaya yardımcı olmak için tasarlanmıştır. Özellikle, bileşenler şunları sunar:

  • İyi tanımlanmış arabirim: Bileşenler iyi tanımlanmış bir arabirim (giriş ve çıkış) gerektirir. Arabirim, kullanıcının adımları kolayca oluşturmasına ve bağlamasına olanak tanır. Arabirim ayrıca bir adımın karmaşık mantığını gizler ve adımın nasıl uygulandığını anlama yükünü ortadan kaldırır.

  • Paylaşma ve yeniden kullanma: İşlem hattının yapı taşları olarak bileşenler kolayca paylaşılabilir ve işlem hatları, çalışma alanları ve abonelikler arasında yeniden kullanılabilir. Bir ekip tarafından oluşturulan bileşenler başka bir ekip tarafından bulunabilir ve kullanılabilir.

  • Sürüm denetimi: Bileşenler sürümlenir. Bileşen üreticileri bileşenleri geliştirmeye ve yeni sürümler yayımlamaya devam edebilir. Tüketiciler işlem hatlarında belirli bileşen sürümlerini kullanabilir. Bu, uyumluluk ve yeniden üretilebilirlik sağlar.

Birim test edilebilir: Bileşen, kendi içinde bulunan bir kod parçasıdır. Bir bileşen için birim testi yazmak kolaydır.

Bileşen ve İşlem Hattı

Makine öğrenmesi işlem hattı, tam makine öğrenmesi görevinin iş akışıdır. Bileşenler, makine öğrenmesi işlem hattının yapı taşlarıdır. Bir bileşeni düşünürken, bunun işlem hattı bağlamında olması gerekir.

Bileşenler oluşturmak için ilk şey makine öğrenmesi işlem hattını tanımlamaktır. Bunun için makine öğrenmesi görevinin tamamını çok adımlı bir iş akışına ayırmak gerekir. Her adım bir bileşendir. Örneğin, geçmiş verileri kullanarak satış tahmini modelini eğitmeye yönelik basit bir makine öğrenmesi görevini göz önünde bulundurarak, veri işleme, model eğitimi ve model değerlendirme adımlarıyla sıralı bir iş akışı oluşturmak isteyebilirsiniz. Karmaşık görevler için daha fazla bölmek isteyebilirsiniz. Örneğin, tek bir veri işleme adımlarını veri alımı, veri temizleme, veri ön işleme ve özellik mühendisliği adımlarına bölün.

İş akışındaki adımlar tanımlandıktan sonra, bir sonraki şey her adımın işlem hattına nasıl bağlanacağını belirtmektir. Örneğin, veri işleme adımınızı ve model eğitim adımınızı bağlamak için, işlenen verileri içeren bir klasörün çıktısını almak için bir veri işleme bileşeni tanımlamak isteyebilirsiniz. Eğitim bileşeni giriş olarak bir klasör alır ve eğitilen modeli içeren bir klasör çıkarır. Bu girişler ve çıkışlar tanımı, bileşen arabirimi tanımınızın bir parçası olur.

Şimdi bir adımı yürütme kodunu geliştirmenin zamanı geldi. Tercih ettiğiniz dilleri (python, R vb.) kullanabilirsiniz. Kodun bir kabuk komutu tarafından yürütülebilmesi gerekir. Geliştirme sırasında, bu adımın nasıl yürütüleceğini denetlemek için birkaç giriş eklemek isteyebilirsiniz. Örneğin, bir eğitim adımında, eğitimi denetlemek için girişler olarak öğrenme oranını, dönem sayısını eklemek isteyebilirsiniz. Bu ek girişlerin yanı sıra diğer adımlara bağlanmak için gereken girişler ve çıkışlar bileşenin arabirimidir. Bir kabuk komutunun bağımsız değişkeni, koda girişleri ve çıkışları geçirmek için kullanılır. Komutu yürütmek için ortamın ve kodun belirtilmesi gerekir. Ortam, seçilmiş bir Azure Machine Learning ortamı, docker görüntüsü veya conda ortamı olabilir.

Son olarak kod, cmd, ortam, giriş, çıkışlar, meta veriler gibi her şeyi bir bileşende paketleyebilirsiniz. Ardından bu bileşenleri birbirine bağlayarak makine öğrenmesi iş akışınıza yönelik işlem hatları oluşturur. Bir bileşen birden çok işlem hattında kullanılabilir.

Bileşen oluşturma hakkında daha fazla bilgi edinmek için bkz:

Sonraki adımlar