Machine Learning Studio (klasik) işlevleriyle Stream Analytics işlerinizi ölçeklendirme

İpucu

Gelişmiş performans ve güvenilirlik için Machine Learning Studio (klasik) UDF yerine Azure Machine Learning UDF'ler kullanılması kesinlikle önerilir.

Önemli

Machine Learning Studio (klasik) desteği 31 Ağustos 2024'te sona erecek. Bu tarihe kadar Azure Machine Learning öneririz.

1 Aralık 2021'den itibaren yeni Machine Learning Studio (klasik) kaynakları oluşturamayacak. 31 Ağustos 2024'e kadar mevcut Machine Learning Studio (klasik) kaynaklarını kullanmaya devam edersiniz.

ML Studio (klasik) belgeleri kaldır ediliyor ve gelecekte güncelleştirilenene kadar güncelleştirilemiyor.

Bu makalede, Machine Learning Studio (klasik) işlevlerini kullanan Azure Stream Analytics işleri verimli bir şekilde ölçeklendirme hakkında bilgi vemektedir. Genel olarak iş ölçeğini Stream Analytics için İşleri ölçeklendirme makalesine bakın.

Stream Analytics'da Studio (klasik) işlevi nedir?

Machine Learning Studio (klasik) işlevi Stream Analytics sorgu dilindeki normal bir işlev çağrısı Stream Analytics kullanılabilir. Ancak bu işlev çağrıları aslında Studio (klasik) Web Hizmeti istekleridir.

Aynı web hizmeti API çağrısında birden çok satırı birlikte "toplu olarak" kullanarak Studio (klasik) web hizmeti isteklerinin aktarım hızını artırabilirsiniz. Bu gruplama, mini toplu iş olarak adlandırılan bir gruplamadır. Daha fazla bilgi için bkz. Machine Learning Studio (klasik) Web Hizmetleri. Stream Analytics'da Studio (klasik) desteği.

Studio (klasik) Stream Analytics bir iş yapılandırma

İş niz tarafından kullanılan Studio (klasik) işlevini yapılandırmak için iki Stream Analytics vardır:

  • Studio (klasik) işlev çağrılarının toplu iş boyutu.
  • İş için sağlanan Akış Birimlerinin (SU) Stream Analytics.

SU'lar için uygun değerleri belirlemek üzere, iş için gecikme süresini veya Stream Analytics SU'nun aktarım hızını iyileştirmek isteyip istemey karar verin. İyi bölümlenmiş bir sorgunun aktarım hızını artırmak için SUS'lar her zaman Stream Analytics eklenebilir. Ek SUS'lar işi çalıştırma maliyetini artıracaktır.

İş için gecikme toleransını Stream Analytics belirleme. Toplu iş boyutunu artırmak, Studio (klasik) isteklerinizin gecikme süresini ve iş için Stream Analytics artıracaktır.

Toplu iş boyutunu artırmak, Stream Analytics studio (klasik) web hizmeti istekleri sayısıyla daha fazla olay işlemesini sağlar. Studio (klasik) web hizmeti gecikme süresinin artması genellikle toplu iş boyutunun artışına göre alt çizgidir.

Herhangi bir durumda Studio (klasik) web hizmeti için en uygun maliyetli toplu iş boyutunu göz önünde bulundurabilirsiniz. Web hizmeti istekleri için varsayılan toplu iş boyutu 1000'tir. bu varsayılan boyutu, Stream Analytics REST API için PowerShell istemcisini kullanarak Stream Analytics.

Toplu iş boyutuna karar verdiktan sonra, işlevin saniye başına işlemesi gereken olay sayısına göre akış birimi (SU) sayısını seçebilirsiniz. Akış birimleri hakkında daha fazla bilgi için bkz. Stream Analytics ölçeklendirme.

Her 6 SU, Studio (klasik) web hizmetine 20 eş zamanlı bağlantı sağlar. Ancak 1 SU işi ve 3 SU işi 20 eş zamanlı bağlantı elde eder.

Uygulamanız saniye başına 200.000 olay üretirse ve toplu iş boyutu 1000 ise, sonuçta elde edilen web hizmeti gecikme süresi 200 ms'tir. Bu hız, her bağlantının her saniye Studio (klasik) web hizmetine beş istekte olduğu anlamına gelir. 20 bağlantı ile Stream Analytics işi, 200 ms'de 20.000 olay ve saniye içinde 100.000 olay işleyene kadar devam eder.

Saniye başına 200.000 olay işlemesi için Stream Analytics 40 eş zamanlı bağlantı gerekir ve bu da 12 SUS'a çıkar. Aşağıdaki diyagramda Stream Analytics iş yerine Studio (klasik) web hizmeti uç noktasına yapılan istekler yer almaktadır. Her 6 SU'nun Studio (klasik) web hizmetine en fazla 20 eşzamanlı bağlantısı vardır.

Studio Stream Analytics İşlevleri ile ölçek ölçek iki iş örneği

Genel olarak, toplu iş boyutu için B _ , B toplu iş boyutu B toplu iş gecikmesi için _L_ milisaniye cinsinden, _ N SU'ları ile bir Stream Analytics işinin aktarım hızı şöyledir:

Studio Stream Analytics İşlevleri Formülü ile ölçek ölçekle

Studio (klasik) web hizmetlerinde 'maksimum eşzamanlı çağrı sayısı' da yapılandırabilirsiniz. Bu parametreyi en yüksek değere (şu anda 200) ayarlamak önerilir.

Bu ayar hakkında daha fazla bilgi için Machine Learning Studio (klasik) Web Hizmetleri için ölçeklendirme makalesini gözden geçirebilirsiniz.

Örnek – Yaklaşım Analizi

Aşağıdaki örnek, Stream Analytics Studio (klasik)tümleştirme öğreticisinde açıklandığı gibi yaklaşım analysis Studio (klasik) işlevine sahip bir Stream Analytics Machine Learning işi içerir.

Sorgu, aşağıdaki örnekte gösterildiği gibi yaklaşım işlevinin ardından gelen, tam olarak bölümlenmiş basit bir sorgudur:

    WITH subquery AS (
        SELECT text, sentiment(text) as result from input
    )

    Select text, result.[Score]
    Into output
    From subquery

Şimdi bir Stream Analytics işi oluşturmak için gereken yapılandırmayı incelenin. Bu iş, tweetlerin yaklaşım analizini saniye başına 10.000 tweet hızıyla yapar.

1 SU kullanarak bu iş Stream Analytics iş olarak işebilir mi? İş, varsayılan 1000 toplu iş boyutunu kullanarak girişe uygun olabilir. Yaklaşım analizi Studio (klasik) web hizmetinin (varsayılan toplu iş boyutu 1000 olan) varsayılan gecikme süresi, en fazla bir saniyelik gecikme süresi oluşturur.

İş Stream Analytics genel veya uz adım gecikme süresi genellikle birkaç saniye olur. Özellikle Studio (klasik) işlev çağrıları Stream Analytics bu iş için daha ayrıntılı bir göz at. Toplu iş boyutu 1000 olan 10.000 olay aktarım hızı, web hizmetine yaklaşık 10 istek alır. Bir SU ile bile, bu giriş trafiğini karşılamak için yeterli eş zamanlı bağlantı vardır.

Giriş olay hızı 100 kat artarsa, Stream Analytics işinin saniye başına 1.000.000 tweet işlemesi gerekir. Artan ölçeği gerçekleştirmek için iki seçenek vardır:

  1. Toplu iş boyutunu artırma.
  2. Olayları paralel olarak işlemesi için giriş akışını bölümleme.

İlk seçenek ile iş gecikme süresi artar.

İkinci seçenekle, daha fazla eşzamanlı Studio (klasik) web hizmeti isteğine sahip olmak için daha fazla SU sağlamanız gerekir. Bu daha fazla SAYıDA SUS, iş maliyetini artırır.

Şimdi her toplu iş boyutu için aşağıdaki gecikme süresi ölçümlerini kullanarak ölçeklendirmeye bakalım:

Gecikme süresi Toplu iş boyutu
200 ms 1000 olay toplu işleri veya altı
250 ms 5.000 olay toplu işi
300 ms 10.000 olay toplu işi
500 ms 25.000 olay toplu işi
  1. İlk seçeneği kullanma (daha fazla SU sağlanmaz). Toplu iş boyutu 25.000'e artırılabilir. Toplu iş boyutunu bu şekilde artırmak, işin Studio (klasik) web hizmetine 20 eşzamanlı bağlantıyla (çağrı başına 500 ms gecikme süresiyle) 1.000.000 olay işlemesine olanak sağlar. Bu nedenle Studio (klasik) web hizmeti isteklerine yönelik yaklaşım işlevi istekleri nedeniyle Stream Analytics işinin ek gecikme süresi 200 ms'den 500 ms'ye artırılabilir. Ancak, Studio (klasik) web hizmetleri bir isteğin yük boyutunun 4 MB veya daha küçük olması ve web hizmeti isteklerinin 100 saniye işlemden sonra zaman aşımına neden olmasıyla toplu iş boyutu sonsuz olarak artırılabilir.
  2. İkinci seçenek kullanılarak, toplu iş boyutu 1000 ms'de, 200 ms web hizmeti gecikme süresiyle bırakarak web hizmetiyle yapılan her 20 eş zamanlı bağlantı, 1000 * 20 * 5 olay = saniye başına 100.000 olay işleyene kadar devam eder. Bu nedenle, saniye başına 1.000.000 olay işlemesi için işin 60 SUS'a ihtiyacı vardır. İlk seçenekle karşılaştırıldığında, Stream Analytics iş daha fazla web hizmeti toplu iş isteğinde bulundurarak maliyetin artmasına neden olur.

Aşağıda, farklı SU'lar ve toplu Stream Analytics (saniye başına olay sayısı) için iş hacmine bir tablo verilmiştir.

toplu iş boyutu (ML gecikme süresi) 500 (200 ms) 1.000 (200 ms) 5.000 (250 ms) 10.000 (300 ms) 25.000 (500 ms)
1 SU 2,500 5.000 20.000 30,000 50,000
3 SUS 2,500 5.000 20.000 30,000 50,000
6 SUS 2,500 5.000 20.000 30,000 50,000
12 SUS 5.000 10,000 40,000 60.000 100.000
18 SUS 7.500 15.000 60.000 90,000 150.000
24 SUS 10,000 20.000 80,000 120,000 200,000
60 SUS 25,000 50,000 200,000 300,000 500.000

Şu anda Studio'daki (klasik) işlevlerin çalışma ve çalışma Stream Analytics sahipsiniz. Büyük olasılıkla işlerde veri Stream Analytics "çekme" işleminin ve her bir "çekme" işleminin, iş için bir olay Stream Analytics toplu iş döndür olduğunu anlarsınız. Bu çekme modeli Studio (klasik) web hizmeti isteklerini nasıl etkiler?

Normalde, Studio (klasik) işlevleri için ayar sunduğumuz toplu iş boyutu, her bir iş "çekme" işlemi tarafından döndürülen olay Stream Analytics bölünemez. Bu durumda, Studio (klasik) web hizmeti "kısmi" toplu işlerle çağrılır. Kısmi toplu iş kullanımı, çekmeden çekmeye olayları biriktirmek için ek iş gecikmesi ek yüküne neden olur.

Bir iş için Stream Analytics alanına işlevle ilgili üç ölçüm daha eklenmiştir. Bunlar, aşağıdaki grafikte gösterildiği gibi İşlev İstekLERI, İşlev OLAYLARI ve BAŞARILI İşlev İstekLERI'dir.

Studio Stream Analytics İşlevleri Ölçümleri ile ölçek ölçekle

aşağıdaki gibi tanımlanır:

İşlev İstekLERI: İşlev isteklerinin sayısı.

İşlev OLAYLARI: İşlev isteklerinde olayların sayısı.

BAŞARıSıZ İşlev İstekLERI: Başarısız işlev isteklerinin sayısı.

Ana Takeaways

Studio (klasik) Stream Analytics bir işi ölçeklendirmek için aşağıdaki faktörleri göz önünde kullanın:

  1. Giriş olay hızı.
  2. Çalışan iş için toleranslı gecikme süresi Stream Analytics (ve bu nedenle Studio (klasik) web hizmeti isteklerinin toplu iş boyutu).
  3. Sağlanan hizmet Stream Analytics SU'ları ve Studio (klasik) web hizmeti isteklerinin sayısı (işlevle ilgili ek maliyetler).

Örnek olarak Stream Analytics bölümlenmiş bir sorgu kullanılmıştır. Daha karmaşık bir sorgu gerekirse, Azure Stream Analytics için Microsoft Q&A soru sayfası, Stream Analytics ekibinden yardım almak için harika bir kaynaktır.

Sonraki adımlar

Daha fazla bilgi edinmek Stream Analytics bkz: