Költségvetések, költségek és kvóták kezelése a szervezeti szintű Azure Machine Learning esetében

Cikk
05/23/2024

Az Azure Machine-Tanulás felmerülő számítási költségek kezelésekor egy szervezeti szinten, sok számítási feladattal, számos csapattal és felhasználóval, számos felügyeleti és optimalizálási kihívással kell dolgoznia.

Ebben a cikkben a költségek optimalizálására, a költségvetések kezelésére és a kvóták Azure Machine-Tanulás való megosztására vonatkozó ajánlott eljárásokat mutatjuk be. A cikk tükrözi a Microsofton belüli, valamint az ügyfelekkel való partneri viszony során felügyelt Machine Learning-csapatok tapasztalatait és következtetéseit. A következőket fogja megtanulni:

Számítási erőforrások optimalizálása a számítási feladatokra vonatkozó követelményeknek megfelelően.
A csapat költségvetésének legjobb kihasználása.
Költségvetések, költségek és kvóták nagyvállalati szintű tervezése, kezelése és megosztása.

Számítási feladatokra vonatkozó követelményeknek megfelelő számítás optimalizálása

Új gépi tanulási projekt indításakor feltáró munkára lehet szükség a számítási követelmények megfelelő képének eléréséhez. Ez a szakasz javaslatokat tartalmaz arra vonatkozóan, hogyan határozhatja meg a megfelelő virtuálisgép-termékváltozatot a betanításhoz, a következtetéshez vagy a munkaállomásként való munkavégzéshez.

A betanítás számítási méretének meghatározása

A betanítási számítási feladat hardverkövetelményei projektenként eltérőek lehetnek. Ezeknek a követelményeknek való megfelelés érdekében az Azure Machine Tanulás compute különböző típusú virtuális gépeket kínál:

Általános cél: Kiegyensúlyozott processzor-memória arány.
Memóriaoptimalizált: Magas memória és PROCESSZOR arány.
Számításoptimalizált: Magas processzor-memória arány.
Nagy teljesítményű számítás: Vezető szintű teljesítményt, méretezhetőséget és költséghatékonyságot biztosít a különböző valós HPC számítási feladatokhoz.
Gpu-kkal rendelkező példányok: Speciális virtuális gépek, amelyekre a nehéz grafikus megjelenítés és a videószerkesztés, valamint a mély tanulással végzett modellbetanítás és következtetés (ND) szolgál.

Lehet, hogy még nem tudja, mik a számítási követelmények. Ebben a forgatókönyvben javasoljuk, hogy kezdje az alábbi költséghatékony alapértelmezett beállítások egyikével. Ezek a lehetőségek az egyszerűsített tesztelésre és a számítási feladatok betanítására használhatók.

Típus	Virtuális gép mérete	Szemüveg
CPU	Standard_DS3_v2	4 mag, 14 gigabájt (GB) RAM, 28 GB tárterület
GPU	Standard_NC6	6 mag, 56 gigabájt (GB) RAM, 380 GB tárterület, NVIDIA Tesla K80 GPU

Ha a lehető legjobb virtuálisgép-méretet szeretné elérni a forgatókönyvhöz, az próbaverzióból és hibából állhat. Az alábbiakban több szempontot is figyelembe kell venni.

Ha processzorra van szüksége:
- Használjon memóriaoptimalizált virtuális gépet, ha nagy adathalmazokra van betanítás.
- Használjon számításra optimalizált virtuális gépet, ha valós idejű következtetést vagy más késésre érzékeny feladatokat végez.
- A betanítási idő felgyorsítása érdekében használjon több maggal és RAM-mal rendelkező virtuális gépet.
Ha GPU-ra van szüksége, tekintse meg a GPU-ra optimalizált virtuálisgép-méreteket a virtuális gép kiválasztásával kapcsolatos információkért.
- Ha elosztott betanítást végez, használjon több GPU-val rendelkező virtuálisgép-méretet.
- Ha több csomóponton végez elosztott betanítást, NVLink-kapcsolatokkal rendelkező GPU-kat használjon.

Miközben a számítási feladatnak leginkább megfelelő virtuálisgép-típust és termékváltozatot választja ki, értékelje ki a összehasonlítható virtuálisgép-termékváltozatokat a CPU és a GPU teljesítménye és díjszabása közötti kompromisszumként. Költségkezelési szempontból a feladatok számos termékváltozaton megfelelően futhatnak.

Bizonyos GPU-k, mint például az NC-család, különösen NC_Promo termékváltozatok, hasonló képességekkel rendelkeznek, mint például az alacsony késés és a több számítási feladat egyidejű kezelése. A többi GPU-hoz képest kedvezményes áron érhetők el. A virtuálisgép-termékváltozatok számítási feladathoz való kiválasztása jelentős költségmegtakarítást eredményezhet a végén.

A kihasználtság szempontjából fontos, hogy nagyobb számú GPU-ra regisztráljon, nem feltétlenül gyorsabb eredményekkel. Ehelyett győződjön meg arról, hogy a GPU-k teljes mértékben kihasználva vannak. Ellenőrizze például, hogy szükség van-e az NVIDIA CUDA-ra. Bár a nagy teljesítményű GPU-végrehajtáshoz szükséges lehet, előfordulhat, hogy a feladat nem függ attól.

A következtetés számítási méretének meghatározása

A következtetési forgatókönyvek számítási követelményei eltérnek a betanítási forgatókönyvektől. Az elérhető lehetőségek attól függően különböznek, hogy a forgatókönyv offline következtetést igényel-e a kötegben, vagy online következtetést igényel valós időben.

Valós idejű következtetési forgatókönyvek esetén vegye figyelembe a következő javaslatokat:

Profilkészítési képességek használata a modellen az Azure Machine Tanulás segítségével annak meghatározásához, hogy mennyi processzort és memóriát kell lefoglalnia a modellhez webszolgáltatásként való üzembe helyezéskor.
Ha valós idejű következtetést végez, de nincs szüksége magas rendelkezésre állásra, telepítse az Azure Container Instancesben (nincs termékváltozat kiválasztása).
Ha valós idejű következtetést végez, de magas rendelkezésre állásra van szüksége, telepítse az Azure Kubernetes Service-ben.
- Ha hagyományos gépi tanulási modelleket használ, és 10 lekérdezést/másodpercet kap < , kezdje egy CPU-termékváltozattal. Az F sorozatú termékváltozatok gyakran jól működnek.
- Ha mélytanulási modelleket használ, és 10 lekérdezést/másodpercet kap > , próbáljon ki egy NVIDIA GPU-termékváltozatot (NCasT4_v3 gyakran jól működik) a Tritonnal.

Kötegkövetkeztetési forgatókönyvek esetén vegye figyelembe a következő javaslatokat:

Amikor Azure Machine Tanulás-folyamatokat használ kötegelt következtetéshez, a kezdeti virtuálisgép-méret kiválasztásához kövesse a betanítás számítási méretének meghatározása című szakasz útmutatását.
Költség és teljesítmény optimalizálása horizontális skálázással. A költségek és a teljesítmény optimalizálásának egyik fő módszere a számítási feladat párhuzamos futtatásának az Azure Machine Tanulás-ban való párhuzamos futtatása. Ezzel a folyamatlépéssel számos kisebb csomópontot használhat a feladat párhuzamos végrehajtásához, ami lehetővé teszi a horizontális skálázást. A párhuzamosításnak azonban van egy többlettere. A számítási feladattól és az elérhető párhuzamosság mértékétől függően előfordulhat, hogy a párhuzamos futtatási lépések nem feltétlenül választhatók.

Számítási példány méretének meghatározása

Interaktív fejlesztéshez ajánlott az Azure Machine Tanulás számítási példánya. A számítási példány (CI) ajánlat egyetlen felhasználóhoz kötött, felhőalapú munkaállomásként használható egyetlen csomópontos számítást hoz létre.

Egyes szervezetek nem engedélyezik az éles adatok használatát a helyi munkaállomásokon, korlátozásokat léptetnek életbe a munkaállomás-környezetre, vagy korlátozzák a csomagok és függőségek telepítését a vállalati informatikai környezetben. A számítási példányok munkaállomásként is használhatók a korlátozás leküzdéséhez. Biztonságos környezetet kínál éles adatokhoz való hozzáféréssel, és olyan képeken fut, amelyek népszerű csomagokkal és eszközökkel érkeznek az előre telepített adatelemzéshez.

Amikor a számítási példány fut, a rendszer kiszámlázzák a felhasználót a virtuálisgép-számításért, a Standard Load Balancerért (beleértve a lb/kimenő szabályokat és a feldolgozott adatokat), az operációsrendszer-lemezért (Prémium SSD által felügyelt P10-lemez), az ideiglenes lemezért (az ideiglenes lemez típusa a kiválasztott virtuális gép méretétől függ) és a nyilvános IP-címért. A költségek csökkentése érdekében javasoljuk, hogy a felhasználók fontolja meg a következőket:

Indítsa el és állítsa le a számítási példányt, ha nincs használatban.
Számítási példányon lévő adatok mintájának használata és a számítási fürtökre való felskálázás a teljes adatkészlettel való együttműködéshez
Kísérletezési feladatok elküldése helyi számítási cél módban a számítási példányon a fejlesztés vagy tesztelés során, illetve amikor a feladatok teljes körű elküldésekor megosztott számítási kapacitásra vált. Például számos korszak, teljes adatkészlet és hiperparaméteres keresés.

Ha leállítja a számítási példányt, az leállítja a virtuális gép számítási óráinak, ideiglenes lemezeinek és standard Load Balancer-adatok feldolgozott költségeinek számlázását. Vegye figyelembe, hogy a felhasználó továbbra is fizet az operációsrendszer-lemezért, a Standard Load Balancer pedig akkor is tartalmaz lb/kimenő szabályokat, ha a számítási példány le van állítva. Az operációsrendszer-lemezen mentett adatok leállítással és újraindítással maradnak meg.

A kiválasztott virtuális gép méretének finomhangolása a számítási kihasználtság monitorozásával

Az Azure Monitoron keresztül megtekintheti az Azure Machine Tanulás számítási használatát és kihasználtságát. Megtekintheti a modell üzembe helyezésének és regisztrációjának részleteit, a kvóta részleteit, például az aktív és tétlen csomópontokat, a futtatási adatokat, például a megszakított és befejezett futtatásokat, valamint a GPU és a CPU-kihasználtság számítási kihasználtságát.

A figyelési adatok alapján jobban megtervezheti vagy módosíthatja az erőforrás-használatot a csapaton belül. Ha például az elmúlt héten sok tétlen csomópontot észlelt, a megfelelő munkaterület-tulajdonosokkal együttműködve frissítheti a számítási fürt konfigurációját, hogy megelőzze ezt a többletköltséget. A kihasználtsági minták elemzésének előnyei segíthetnek a költségek előrejelzésében és a költségvetési fejlesztésekben.

Ezeket a metrikákat közvetlenül az Azure Portalon érheti el. Nyissa meg az Azure Machine Tanulás munkaterületét, és válassza a metrikákat a bal oldali panel monitorozási szakaszában. Ezután kiválaszthatja a megtekinteni kívánt adatok részleteit, például a metrikákat, az összesítést és az időtartamot. További információt az Azure Machine monitorozása Tanulás dokumentációs oldalán talál.

Az Azure Monitor metrikáinak diagramja az Azure Machine Tanulás

Váltás helyi, egycsomópontos és többcsomópontos felhőbeli számítás között a fejlesztés során

A gépi tanulási életciklus során különböző számítási és eszközhasználati követelmények vonatkoznak. Az Azure Machine Tanulás szinte bármilyen előnyben részesített munkaállomás-konfigurációból egy SDK- és CLI-felületen keresztül lehet illeszteni, hogy megfeleljenek ezeknek a követelményeknek.

A költségek csökkentése és a hatékony munkavégzés érdekében a következőket javasoljuk:

Klónozza helyileg a kísérletezési kódbázist a Git használatával, és küldje el a feladatokat a felhőbeli számításba az Azure Machine Tanulás SDK vagy parancssori felület használatával.
Ha az adathalmaz nagy, fontolja meg az adatok mintájának kezelését a helyi munkaállomáson, miközben a teljes adatkészletet a felhőbeli tárolóban tartja.
Paraméterezheti a kísérletezési kódbázist, hogy konfigurálhassa a feladatokat úgy, hogy különböző számú korszakban vagy különböző méretű adathalmazokon fussanak.
Ne kódozza be az adathalmaz mappaútvonalát. Ezután egyszerűen újra felhasználhatja ugyanazt a kódbázist különböző adathalmazokkal, valamint helyi és felhőbeli végrehajtási környezetben.
A kísérletezési feladatokat helyi számítási cél módban indíthatja el fejlesztés vagy tesztelés közben, vagy amikor a feladatok teljes körű elküldésekor megosztott számítási fürtkapacitásra vált.
Ha az adathalmaz nagy, használjon mintaadatokat a helyi vagy számítási példány munkaállomásán, miközben az Azure Machine Tanulás felhőbeli számításra skálázva használja a teljes adatkészletet.
Ha a feladatok végrehajtása hosszú időt vesz igénybe, érdemes lehet optimalizálni a kódbázist az elosztott betanításhoz, hogy lehetővé tegye a horizontális felskálázást.
Tervezheti meg az elosztott betanítási számítási feladatokat a csomópontok rugalmassága érdekében, hogy rugalmasan lehessen használni az egycsomópontos és a többcsomópontos számítást, és megkönnyítse az előre felosztható számítási feladatok használatát.

Számítási típusok egyesítése Azure Machine-Tanulás-folyamatokkal

A gépi tanulási munkafolyamatok vezénylésekor több lépésből is meghatározhat egy folyamatot. A folyamat minden lépése a saját számítási típusán futtatható. Ez lehetővé teszi a teljesítmény és a költségek optimalizálását, hogy megfeleljen a gépi tanulási életciklus különböző számítási követelményeinek.

A csapat költségvetésének legjobb kihasználása

Bár a költségvetés-elosztási döntések nem feltétlenül befolyásolják az egyes csapatokat, a csapatok általában a legjobb igényeiknek megfelelően használhatják fel a lefoglalt költségvetést. A feladatok prioritásának és a teljesítménynek és a költségeknek a figyelembe adásával a csapatok magasabb fürtkihasználtságot, alacsonyabb összköltséget érhetnek el, és ugyanabból a költségvetésből több számítási órát használhatnak. Ez a csapat termelékenységének növelését eredményezheti.

Megosztott számítási erőforrások költségeinek optimalizálása

A megosztott számítási erőforrások költségeinek optimalizálásának kulcsa annak biztosítása, hogy azok a teljes kapacitásukhoz legyenek felhasználva. Íme néhány tipp a megosztott erőforrás költségeinek optimalizálásához:

Számítási példányok használatakor csak akkor kapcsolja be őket, ha kóddal rendelkezik a végrehajtáshoz. Állítsa le őket, ha nem használják őket.
Számítási fürtök használatakor állítsa a csomópontok minimális számát 0-ra, a csomópontok maximális számát pedig a költségvetés korlátai alapján kiértékelt számra. Az Azure díjkalkulátorával kiszámíthatja a kiválasztott virtuálisgép-termékváltozat egy virtuálisgép-csomópontjának teljes kihasználtságát. Az automatikus skálázás leskálázza az összes számítási csomópontot, ha senki sem használja. Csak a tervezett csomópontok számához lesz skálázva. Az automatikus skálázást úgy konfigurálhatja, hogy leskálázza az összes számítási csomópontot.
A betanítási modellekben figyelheti az erőforrás-kihasználtságokat, például a CPU-kihasználtságot és a GPU-kihasználtságot. Ha az erőforrások nincsenek teljes mértékben használatban, módosítsa a kódot az erőforrások jobb kihasználása vagy a kisebb vagy olcsóbb virtuálisgép-méretekre való skálázás érdekében.
Értékelje ki, hogy létrehozhat-e megosztott számítási erőforrásokat a csapat számára, hogy elkerülje a fürtméretezési műveletek által okozott számítástechnikai hatékonysági problémákat.
Optimalizálhatja a számítási fürt automatikus skálázási időtúllépési szabályzatait a használati metrikák alapján.
A munkaterületi kvóták használatával szabályozhatja az egyes munkaterületek számára elérhető számítási erőforrások mennyiségét.

Ütemezési prioritás bevezetése több virtuálisgép-termékváltozat fürtjeinek létrehozásával

A kvóta- és költségvetési korlátozások mellett eljárva a csapatnak el kell végeznie a feladatok időalapú végrehajtását a költségek helyett, hogy a fontos feladatok időben fussanak, és a költségvetés a lehető legjobb módon legyen felhasználva.

A legjobb számítási kihasználtság támogatása érdekében a csapatoknak ajánlott különböző méretű, alacsony prioritású és dedikált virtuálisgép-prioritású fürtöket létrehozniuk. Az alacsony prioritású számítások kihasználják a többletkapacitást az Azure-ban, ezért kedvezményes díjszabással járnak. A hátránya az, hogy ezek a gépek előre kivehetők, amikor egy magasabb prioritású kérdés érkezik.

A különböző méretű és prioritású fürtök használatával bevezethető az ütemezési prioritás fogalma. Ha például a kísérleti és éles feladatok ugyanazon NC GPU-kvótáért versenyeznek, előfordulhat, hogy egy éles feladat inkább a kísérleti feladat futtatását részesíti előnyben. Ebben az esetben futtassa az éles feladatot a dedikált számítási fürtön, és a kísérleti feladatot az alacsony prioritású számítási fürtön. Ha a kvóta rövid lesz, a kísérleti feladat előtagot kap az éles feladat javára.

A virtuálisgép-prioritás mellett érdemes lehet feladatokat futtatni különböző virtuálisgép-termékváltozatokon. Előfordulhat, hogy egy feladat végrehajtása hosszabb időt vesz igénybe egy P40 GPU-val rendelkező virtuálisgép-példányon, mint egy V100 GPU-n. Mivel azonban előfordulhat, hogy a V100 virtuálisgép-példányok foglaltak, vagy a kvóta teljes mértékben kihasználva van, a P40-en a befejezési idő továbbra is gyorsabb lehet a feladat átviteli sebessége szempontjából. Költségkezelési szempontból érdemes lehet alacsonyabb prioritású feladatokat futtatni a kevésbé teljesítő és olcsóbb virtuálisgép-példányokon.

Futtatás korai leállítása, ha a betanítás nem konvergens

Ha folyamatosan kísérletezik a modell alapkonfigurációja alapján történő továbbfejlesztésével, előfordulhat, hogy különböző kísérletfuttatásokat hajt végre, melyek mindegyike kissé eltérő konfigurációval rendelkezik. Egy futtatás esetén módosíthatja a bemeneti adatkészleteket. Egy másik futtatás esetén előfordulhat, hogy módosítja a hiperparamétert. Nem minden módosítás lehet olyan hatékony, mint a másik. Korán észleli, hogy egy módosítás nem volt a modell betanításának minőségére gyakorolt tervezett hatással. Annak észleléséhez, hogy a betanítás nem konvergens-e, figyelje a betanítás előrehaladását egy futtatás során. Például a teljesítménymetrikák naplózásával az egyes betanítási korszakok után. Fontolja meg a feladat korai megszüntetését, hogy erőforrásokat és költségvetést szabadítson fel egy másik próbaverzióhoz.

Mivel a szervezet egyre több gépi tanulási használati esetet és csapatot használ, az informatikai és pénzügyi fejlettség növelését, valamint az egyes gépi tanulási csapatok közötti koordinációt igényli a hatékony működés biztosítása érdekében. A vállalati szintű kapacitás- és kvótakezelés fontossá válik a számítási erőforrások szűkösségének kezelése és a felügyeleti többletterhelés leküzdése érdekében.

Ez a szakasz a költségvetések, költségek és kvóták nagyvállalati szintű tervezésének, kezelésének és megosztásának ajánlott eljárásait ismerteti. Ez a microsoftos gépi tanuláshoz szükséges számos GPU-betanítási erőforrás kezeléséből származó tanuláson alapul.

Az erőforrás-kiadások ismertetése az Azure Machine Tanulás

A számítási igények tervezésének egyik legnagyobb kihívása, hogy a rendszergazda ne kezdjen újat, és ne legyen előzményadatok alapbecslésként. Gyakorlati szempontból a legtöbb projekt első lépésként egy kis költségvetésből indul ki.

A költségvetés helyének megértéséhez fontos tudni, hogy honnan származnak az Azure Machine Tanulás költségei:

Az Azure Machine csak a használt számítási infrastruktúra díjait Tanulás, és nem számít fel díjat a számítási költségekért.
Az Azure Machine Tanulás-munkaterület létrehozásakor további erőforrások is létrejönnek az Azure Machine Tanulás engedélyezéséhez: Key Vault, Application Elemzések, Azure Storage és Azure Container Registry. Ezeket az erőforrásokat az Azure Machine Tanulás használja, és ezekért az erőforrásokért fizetnie kell.
A felügyelt számításokkal kapcsolatos költségek, például a betanítási fürtök, a számítási példányok és a felügyelt következtetési végpontok. Ezekkel a felügyelt számítási erőforrásokkal a következő infrastruktúraköltségeket kell figyelembe venni: virtuális gépek, virtuális hálózat, terheléselosztó, sávszélesség és tárolás.

Költségminták nyomon követése és jobb jelentéskészítés a címkézéssel

Rendszergazda istratorok gyakran szeretnék nyomon követni az Azure Machine Tanulás különböző erőforrásainak költségeit. A címkézés természetes megoldás erre a problémára, és összhangban van az Azure és sok más felhőszolgáltató által használt általános megközelítéssel. A címkék támogatásával mostantól a számítási szinten is láthatja a költséglebontást, így részletesebb nézetet biztosíthat a jobb költségfigyelés, a jobb jelentéskészítés és a nagyobb átláthatóság érdekében.

A címkézés lehetővé teszi, hogy testre szabott címkéket helyezzen el a munkaterületeken és a számításokban (az Azure Resource Manager-sablonokból és az Azure Machine Tanulás Studióból), hogy tovább szűrje ezeket az erőforrásokat a Microsoft Cost Managementben ezen címkék alapján a költési minták megfigyeléséhez. Ez a funkció a legjobban a belső költségvisszafizetési forgatókönyvekhez használható. Emellett a címkék hasznosak lehetnek a számításhoz kapcsolódó metaadatok vagy részletek rögzítéséhez, például projekthez, csapathoz, bizonyos számlázási kódhoz stb. Ez nagyon hasznossá teszi a címkézést annak méréséhez, hogy mennyi pénzt költ a különböző erőforrásokra, és így mélyebb betekintést nyerhet a költségekbe, és mintákat költhet csapatokra vagy projektekre.

Vannak olyan rendszerinjektált címkék is a számításokra, amelyek lehetővé teszik, hogy a Költségelemzés oldalon a "Számítás típusa" címke alapján szűrjön, így megtekintheti a teljes költség számítási szempontból bölcs lebontását, és meghatározhatja, hogy a számítási erőforrások mely kategóriái lehetnek a költségek többségének tulajdoníthatók. Ez különösen akkor hasznos, ha jobban áttekinti a betanítást és a következtetési költségmintákat.

Képernyőkép a számítási típus szerint szűrt költségelemzési nézetről.

Számítási használat szabályozása és korlátozása szabályzat szerint

Ha sok számítási feladattal rendelkező Azure-környezetet kezel, kihívást jelenthet az erőforrás-kiadások áttekintésének megtartása. Az Azure Policy az Azure-környezet adott használati mintáinak korlátozásával segíthet az erőforrás-kiadások szabályozásában és szabályozásában.

Az Azure Machine Tanulás esetében azt javasoljuk, hogy olyan szabályzatokat állítson be, amelyek csak adott virtuálisgép-termékváltozatok használatát teszik lehetővé. A szabályzatok segíthetnek megelőzni és szabályozni a drága virtuális gépek kiválasztását. A szabályzatok az alacsony prioritású virtuálisgép-termékváltozatok használatának kikényszerítésére is használhatók.

Kvóta lefoglalása és kezelése üzleti prioritás alapján

Az Azure lehetővé teszi, hogy az előfizetések és az Azure Machine Tanulás munkaterület szintjén korlátokat állítson be a kvótakiosztáshoz. Az erőforrások kihasználtságának és a költségek kiszámíthatóságának biztosításához segíthet, ha az Azure szerepköralapú hozzáférés-vezérléssel (RBAC) korlátozza, hogy kik kezelhetik a kvótát.

A GPU-kvóta rendelkezésre állása kevés lehet az előfizetésekben. A számítási feladatok közötti magas kvótakihasználtság biztosítása érdekében javasoljuk, hogy ellenőrizze, hogy a kvóta a legjobban használható-e, és a számítási feladatokhoz van-e hozzárendelve.

A Microsoftnál rendszeres időközönként meg van határozva, hogy a GPU-kvótákat érdemes-e használni és lefoglalni a gépi tanulási csapatok között a kapacitásigények üzleti prioritás szerinti kiértékelésével.

Kapacitás véglegesítése előre

Ha jó becsléssel rendelkezik arról, hogy a következő évben vagy a következő néhány évben mennyi számítást fog használni, kedvezményes áron vásárolhat Azure Fenntartott virtuálisgép-példányokat. Egy vagy hároméves vásárlási feltételek vannak. Mivel a fenntartott Azure-beli virtuálisgép-példányok kedvezményesek, a használatalapú fizetéshez képest jelentős költségmegtakarítás érhető el.

Az Azure Machine Tanulás támogatja a fenntartott számítási példányokat. A rendszer automatikusan alkalmazza a kedvezményeket az Azure Machine Tanulás felügyelt számításra.

Adatmegőrzés kezelése

A gépi tanulási folyamat minden egyes végrehajtásakor köztes adathalmazok hozhatók létre minden egyes folyamatlépésnél az adatok gyorsítótárazása és újrafelhasználása érdekében. A gépi tanulási folyamatok kimeneteként az adatok növekedése fájdalomponttá válhat egy olyan szervezet számára, amely számos gépi tanulási kísérletet futtat.

Az adattudósok általában nem töltik az idejüket a létrehozott köztes adathalmazok megtisztítására. Idővel a létrehozott adatok mennyisége összeadódik. Az Azure Storage képes az adatéletciklus felügyeletének javítására. Az Azure Blob Storage életciklus-kezelésével általános szabályzatokat állíthat be a fel nem használt adatok hidegebb tárolási szintekre való áthelyezéséhez, és költségeket takaríthat meg.

Infrastruktúraköltség-optimalizálási szempontok

Hálózat

Az Azure hálózatkezelési költségei az Azure-adatközpontból kimenő sávszélességből származnak. Az Azure-adatközpontba irányuló összes bejövő adat ingyenes. A hálózati költségek csökkentésének kulcsa, hogy az összes erőforrást ugyanabban az adatközponti régióban helyezze üzembe, amikor csak lehetséges. Ha az Azure Machine-Tanulás munkaterületet és számítást ugyanabban a régióban helyezheti üzembe, amelyben az adatai vannak, alacsonyabb költséggel és nagyobb teljesítménnyel rendelkezhet.

Érdemes lehet privát kapcsolatot létesíteni a helyszíni hálózat és az Azure-hálózat között, hogy hibrid felhőkörnyezettel rendelkezzen. Az ExpressRoute lehetővé teszi ezt, de figyelembe véve az ExpressRoute magas költségeit, költséghatékonyabb lehet, ha távolodik egy hibrid felhőbeállítástól, és az összes erőforrást az Azure-felhőbe helyezi át.

Azure Container Registry

Az Azure Container Registry esetében a költségoptimalizálás meghatározó tényezői a következők:

A Docker-rendszerképek tárolóregisztrációs adatbázisból az Azure Machine-Tanulás
A vállalati biztonsági funkciókra, például az Azure Private Linkre vonatkozó követelmények

Olyan éles helyzetekben, ahol magas átviteli sebességre vagy nagyvállalati biztonságra van szükség, az Azure Container Registry prémium termékváltozata ajánlott.

Olyan fejlesztési/tesztelési forgatókönyvek esetében, ahol az átviteli sebesség és a biztonság kevésbé kritikus, a Standard termékváltozatot vagy a Prémium termékváltozatot javasoljuk.

Az Azure Container Registry alapszintű termékváltozata nem ajánlott az Azure Machine Tanulás. Ez nem ajánlott az alacsony átviteli sebesség és az alacsony beépített tárterület miatt, amelyet az Azure Machine Tanulás viszonylag nagy méretű (1+ GB) Docker-lemezképei gyorsan meghaladhatnak.

Fontolja meg a számítási típus rendelkezésre állását az Azure-régiók kiválasztásakor

Amikor kiválaszt egy régiót a számításhoz, tartsa szem előtt a számítási kvóta rendelkezésre állását. A népszerű és nagyobb régiók, például az USA keleti régiója, az USA nyugati régiója és Nyugat-Európa általában magasabb alapértelmezett kvótaértékekkel és a legtöbb PROCESSZOR és GPU nagyobb rendelkezésre állásával rendelkezik, mint néhány más régióban, ahol szigorúbb kapacitáskorlátozások vannak érvényben.

További információ

Az üzleti egységek, környezetek vagy projektek költségeinek nyomon követése a felhőadaptálási keretrendszer

Következő lépések

Az Azure Machine Tanulás környezetek rendszerezéséről és beállításáról további információt az Azure Machine Tanulás környezetek rendszerezése és beállítása című témakörben talál.

Azure Machine Learning-környezetek rendszerezése és üzembe helyezése

A Machine Tanulás DevOps és az Azure Machine Tanulás ajánlott eljárásainak megismeréséhez tekintse meg a Machine Learning DevOps útmutatóját.

A gépi tanulás DevOps-útmutatója

Share via

Költségvetések, költségek és kvóták kezelése a szervezeti szintű Azure Machine Learning esetében

Számítási feladatokra vonatkozó követelményeknek megfelelő számítás optimalizálása

A betanítás számítási méretének meghatározása

A következtetés számítási méretének meghatározása

Számítási példány méretének meghatározása

A kiválasztott virtuális gép méretének finomhangolása a számítási kihasználtság monitorozásával

Váltás helyi, egycsomópontos és többcsomópontos felhőbeli számítás között a fejlesztés során

Számítási típusok egyesítése Azure Machine-Tanulás-folyamatokkal

A csapat költségvetésének legjobb kihasználása

Megosztott számítási erőforrások költségeinek optimalizálása

Ütemezési prioritás bevezetése több virtuálisgép-termékváltozat fürtjeinek létrehozásával

Futtatás korai leállítása, ha a betanítás nem konvergens

Az erőforrás-kiadások ismertetése az Azure Machine Tanulás

Költségminták nyomon követése és jobb jelentéskészítés a címkézéssel

Számítási használat szabályozása és korlátozása szabályzat szerint

Kvóta lefoglalása és kezelése üzleti prioritás alapján

Kapacitás véglegesítése előre

Adatmegőrzés kezelése

Infrastruktúraköltség-optimalizálási szempontok

Hálózat

Azure Container Registry

Fontolja meg a számítási típus rendelkezésre állását az Azure-régiók kiválasztásakor

További információ

Következő lépések

Visszajelzés

Visszajelzés

További források

Share via

Költségvetések, költségek és kvóták kezelése a szervezeti szintű Azure Machine Learning esetében

Számítási feladatokra vonatkozó követelményeknek megfelelő számítás optimalizálása

A betanítás számítási méretének meghatározása

A következtetés számítási méretének meghatározása

Számítási példány méretének meghatározása

A kiválasztott virtuális gép méretének finomhangolása a számítási kihasználtság monitorozásával

Váltás helyi, egycsomópontos és többcsomópontos felhőbeli számítás között a fejlesztés során

Számítási típusok egyesítése Azure Machine-Tanulás-folyamatokkal

A csapat költségvetésének legjobb kihasználása

Megosztott számítási erőforrások költségeinek optimalizálása

Ütemezési prioritás bevezetése több virtuálisgép-termékváltozat fürtjeinek létrehozásával

Futtatás korai leállítása, ha a betanítás nem konvergens

Költségvetések, költségek és kvóták tervezése, kezelése és megosztása

Az erőforrás-kiadások ismertetése az Azure Machine Tanulás

Költségminták nyomon követése és jobb jelentéskészítés a címkézéssel

Számítási használat szabályozása és korlátozása szabályzat szerint

Kvóta lefoglalása és kezelése üzleti prioritás alapján

Kapacitás véglegesítése előre

Adatmegőrzés kezelése

Infrastruktúraköltség-optimalizálási szempontok

Hálózat

Azure Container Registry

Fontolja meg a számítási típus rendelkezésre állását az Azure-régiók kiválasztásakor

További információ

Következő lépések

Visszajelzés

Visszajelzés

További források