Mi az Azure Machine Learning?

Azure Machine Learning egy felhőszolgáltatás, amely felgyorsítja és kezeli a gépi tanulási projekt életciklusát. A gépi tanulási szakemberek, az adattudósok és a mérnökök a mindennapos munkafolyamataikban használják: Modellek betanítása és üzembe helyezése, valamint az MLOps kezelése.

Létrehozhat egy modellt a Azure Machine Learning vagy használhat nyílt forráskódú platformról, például a Pytorchből, a TensorFlow-ból vagy a scikit-learnből létrehozott modellt. Az MLOps-eszközök a modellek figyelését, újraképzését és ismételt üzembeését segítik.

Tipp

Ingyenes próbaverzió! Ha nem rendelkezik ’ Azure-előfizetéssel, kezdés előtt hozzon létre egy ingyenes fiókot. Próbálja ki aAzure Machine Learning. Azure-szolgáltatásokra elkölthető krediteket kap. A kreditek felhasználása után megtarthatja a fiókját, és tovább használhatja azt az ingyenes Azure-szolgáltatásokkal. A bankkártyáját semmilyen költség nem terheli, hacsak Ön kifejezetten nem módosítja beállításait ennek engedélyezéséhez.

Who a Azure Machine Learning?

Azure Machine Learning gépi tanulási modellek biztonságos és naplózható éles környezetben való megvalósítása egyéni és csapatok számára szükséges.

Az adattudósok és ML mérnökök olyan eszközöket fognak találni, amelyek felgyorsítják és automatizálják a napi munkafolyamatokat. Az alkalmazásfejlesztők eszközöket találhatnak a modellek alkalmazásokba vagy szolgáltatásokba való integrálásához. A platformfejlesztők robusztus, tartós Azure Resource Manager API-k által ML eszközöket találhatnak.

A felhőben Microsoft Azure vállalatok ismerős biztonsági és szerepköralapú hozzáférés-vezérlést (RBAC) fognak találni az infrastruktúrához. Beállíthatja úgy a projektet, hogy megtagadja a védett adatokhoz való hozzáférést, és kiválasztja a műveleteket.

Együttműködés a gépi tanulási csapatok számára

A gépi tanulási projektekhez gyakran szükség van egy sokrétű készségekkel felépíteni és karbantartani képes csapatra. Azure Machine Learning olyan eszközökkel rendelkezik, amelyek lehetővé teszik az együttműködést, például:

  • Megosztott jegyzetfüzetek, számítási erőforrások, adatok és környezetek
  • Nyomon követés és naplózhatóság, amely megmutatja, hogy ki és mikor végzett módosításokat
  • Eszköz verziószámozása

Fejlesztői eszközök

A fejlesztők a következő ismerős felületeket Azure Machine Learning:

A Studio felhasználói felülete

A Azure Machine Learning Studio egy projekt-munkaterület grafikus felhasználói felülete. A studióban a következőt használhatja:

  • Futtatás, metrikák, naplók, kimenetek és így tovább.
  • Jegyzetfüzetek és fájlok létrehozása és szerkesztése.
  • Gyakori eszközök, például
    • Adat-hitelesítő adatok
    • Compute
    • Környezetek
  • Futtatás metrika, eredmények és jelentések vizualizációja.
  • Fejlesztői felületeken keresztül írt folyamatok vizualizációja.
  • AutoML-feladatok írása.

Emellett a tervező rendelkezik egy húzással használható felülettel, ahol modelleket lehet betanítni és üzembe helyezni.

Ha Ön a ML Studio (klasszikus) felhasználója, ismerje meg a Studio (klasszikus)elalasztását, valamint a studio és a Azure Machine Learning közötti különbséget.

Vállalati készenlét és biztonság

Azure Machine Learning Azure-felhőplatformmal integrálható, hogy biztonsági funkciókkal egész ML projektekhez.

A biztonsági integrációk a következők:

  • Azure-beli virtuális hálózatok (VNetek) hálózati biztonsági csoportokkal
  • Azure Key Vault, hogy hová mentheti a biztonsági titkos adatokat, például a tárfiókok hozzáférési adatait
  • Azure Container Registry virtuális hálózat mögötti beállítás

Lásd: Oktatóanyag: Biztonságos munkaterület beállítása.

Azure-integrációk a teljes megoldásokhoz

Az Azure-szolgáltatásokkal való egyéb integrációk támogatják a gépi tanulási projekteket a teljes folyamat során. Ezek közé tartoznak például az alábbiak:

  • Azure Synapse Analytics és streamelése a Sparkkal
  • Azure Arc, ahol Azure-szolgáltatásokat futtathat Kubernetes-környezetben
  • Storage és adatbázis-beállítások, például a Azure SQL Database, az Azure Storage Blobs és hasonlók
  • Azure App Service alkalmazások üzembe helyezését és kezelését ML teszi lehetővé

Fontos

Azure Machine Learning nem tárolja és nem feldolgozja az adatokat azon a régión kívül, ahol az üzembe helyezést telepíti.

Machine Learning-projekt munkafolyamata

A modelleket általában egy célkitűzéssel és céllal kialakított projekt részeként fejlesztették ki. A projektekhez gyakran több személy is tartozik. Az adatokkal, algoritmusokkal és modellekkel való kísérletezés során a fejlesztés iteratív.

Project életciklus

Bár a projekt életciklusa projektenként változhat, gyakran így fog kinézni:

Machine learning project lifecycle diagram

A munkaterület rendszerez egy projektet, és lehetővé teszi az együttműködést számos felhasználó számára, akik egy közös célkitűzésen dolgoznak. A munkaterület felhasználói könnyedén megoszthatják a futtatás eredményeit a Studio felhasználói felületén végzett kísérletezésből, vagy használhatnak verzióval készült adateszközöket olyan feladatokhoz, mint a környezetek és a tárolóhivatkozások.

További információ: Munkaterületek Azure Machine Learning kezelése.

Ha egy projekt készen áll a működőképesítésre, a felhasználók munkája automatizálható egy gépi tanulási folyamatban, és ütemezés szerint vagy HTTPS-kérés alapján indítható el.

A modellek üzembe helyezhetők a felügyelt következtetési megoldásban valós idejű és kötegelt üzembe helyezés esetén is, így a modellek üzembe helyezéséhez általában szükséges infrastruktúra-felügyelet absztrakciója nélkül.

Modellek betanítása

A Azure Machine Learning futtathatja a betanító szkriptet a felhőben, vagy új modellt is építhet. Az ügyfelek gyakran hoznak olyan modelleket, amelyek nyílt forráskódú keretrendszerekkel vannak felépítve és betanítva, így a felhőben is működőképesek.

Megnyitás és együttműködésre használható

Az adattudósok az Azure Machine Learning Python-keretrendszerben létrehozott modelleket használhatnak, például:

  • PyTorch
  • TensorFlow
  • scikit-learn
  • XGBoost
  • LightGBM

Más nyelvek és keretrendszerek is támogatottak, például:

  • R
  • .NET

Lásd: Nyílt forráskódú integráció a Azure Machine Learning.

Automatizált featurizálás és algoritmusválasztás (AutoML)

Egy ismétlődő, időigényes folyamat során a klasszikus gépi tanulási adattudósok a korábbi tapasztalatok és intuíciók alapján választják ki a betanításhoz megfelelő adatreaturizálást és algoritmust. Az ML (AutoML) felgyorsítja ezt a folyamatot, és a Studio felhasználói felületén vagy a Python SDK-val használható.

Lásd: Mi az automatizált gépi tanulás?

Hiperparaméter optimalizálása

A hiperparaméter optimalizálása vagy a hiperparaméterek finomhangolása fárasztó feladat lehet. Azure Machine Learning automatizálhatja ezt a feladatot tetszőleges paraméteres parancsokhoz a feladatdefiníció kis módosításával. Az eredmények a studióban vannak vizualizálva.

Lásd: Hiperparaméterek hangolása.

Többcsomópontos elosztott betanítás

A mély tanulás betanítása és néha a klasszikus gépi tanulási betanítás hatékonysága jelentősen javítható a többcsomópontos elosztott betanítás révén. Azure Machine Learning számítási fürtök a legújabb GPU-lehetőségeket kínálják.

A támogatott Azure Arc Kubernetes (előzetes verzió) és az Azure ML számítási fürtökön keresztül:

  • PyTorch
  • TensorFlow
  • MPI

Az MPI-elosztás a Horovodhoz vagy egyéni többcsomópontos logikához használható. Emellett a Apache Spark spark Azure Synapse Analytics fürtökön (előzetes verzió) keresztül támogatott.

Lásd: Elosztott betanítás a Azure Machine Learning.

Zavaróan párhuzamos betanítás

A gépi tanulási projektek méretezéséhez zavaróan párhuzamos modellbeképezésre lehet szükség. Ez a minta gyakori olyan forgatókönyvek esetében, mint az előrejelzési igények, ahol egy modellt számos áruházhoz be lehet tanítani.

Modellek üzembe helyezése

A modellt üzembe kell helyezni, hogy éles környezetben is üzembe hozzuk. Azure Machine Learning felügyelt végpontjai kivonatolják a kötegelt és a valós idejű (online) modellpontozáshoz (következtetéshez) szükséges infrastruktúrát.

Valós idejű és kötegelt pontozás (következtetés)

A kötegelt pontozás, vagy kötegelt dedekvenciamagában foglalja egy végpont adatokra való hivatkozását. A kötegelt végpont aszinkron módon futtatja a feladatokat az adatok számítási fürtökön való párhuzamos feldolgozásához és az adatok további elemzés céljából való tárolására.

A valós idejűpontozás ( vagy online következtetés) magában foglalja egy végpont egy vagy több modell-üzembehelyezéssel történő lekért fogadását, és közel valós időben, HTTPs-en keresztüli válasz fogadását. A forgalom több üzemelő példány között osztható fel, így az új modellverziók teszteléséhez először bizonyos mennyiségű forgalmat kell átirányítani, és az új modell megbízhatóságának létrejötte után növekedni kell.

Lásd:

MLOps: DevOps gépi tanuláshoz

A gépi tanulási modellekhez (mlOps) használható DevOps az éles modellek fejlesztési folyamata. A modell életciklusának a betanítástól az üzembe helyezésig naplózhatónak kell lennie, ha nem reprodukálható.

ML életciklusa

Machine learning model lifecycle - MLOps

További információ az MLOpsról a Azure Machine Learning.

Az MLOPs-t engedélyező integrációk

Azure Machine Learning a modell életciklusának szem előtt tartva készült. A modell életciklusát egy adott véglegesítésbe és környezetbe is naplólhatja.

Az MLOps néhány fő jellemzője:

  • git Integráció
  • MLflow-integráció
  • Gépi tanulási folyamatok ütemezése
  • Azure Event Grid eseményindítók integrációja
  • Könnyen használható OLYAN CI/CD-eszközökkel, mint a GitHub Actions vagy az Azure DevOps

Emellett a Azure Machine Learning figyelési és naplózási funkciókat is tartalmaz:

  • Feladat-összetevők, például kód-pillanatképek, naplók és egyéb kimenetek
  • A feladatok és az eszközök, például a tárolók, az adatok és a számítási erőforrások közötti leszúkódás

Következő lépések

A következő Azure Machine Learning: