Så här närmar du Machine Learning-åtgärderHow to approach machine learning operations

Machine Learning-åtgärder består av principer och bästa praxis för att organisera och standardisera maskin modell utveckling, distribution och underhåll på ett skalbart sätt.Machine learning operations consist of principles and best practices about how to organize and standardize machine model development, deployment, and maintenance in a scalable way.

Ett diagram som visar en översikt över Machine Learning-åtgärder.

Huvud komponenterna i hur ett Machine Learning-system utvecklar beskrivs nedan:The main components of how a machine learning system develops are outlined below:

Ett diagram som visar komponenterna i ett Machine Learning-system i produktion.

_Sculley et al. 2015._Sculley et al. 2015. Dold teknisk skuld i Machine Learning-system.Hidden technical debt in machine learning systems. 28 International-konferensen om neurala information Processing Systems, volym 2 (NIPS 2015). *Proceedings of the 28th International Conference on Neural Information Processing Systems, Volume 2 (NIPS 2015).*

Machine Learning-åtgärder jämfört med utvecklings åtgärderMachine learning operations vs. development operations

Medan utvecklings åtgärder (DevOps) påverkar Machine Learning-åtgärder, finns det skillnader mellan deras processer.While development operations (DevOps) influence machine learning operations, there are differences between their processes. Utöver DevOps-metoder kan Machine Learning-åtgärder hantera följande begrepp som inte täcks av DevOps:In addition to DevOps practices, machine learning operations address the following concepts not covered in DevOps:

  • Data versions hantering: Det måste finnas kod versions-och data uppsättnings version, eftersom schemat och faktiska data kan ändras med tiden.Data versioning: There must be code versioning and dataset versioning, as the schema and actual data can change over time. Detta gör att data kan reproduceras, gör data synliga andra team medlemmar och hjälper till att granska användningen av ärenden.This allows data to be reproduced, makes the data visible other team members, and helps use cases to be audited.

  • Modell spårning: Modell artefakter lagras ofta i ett modell register som bör identifiera funktioner för lagring, versions hantering och taggning.Model tracking: Model artifacts are often stored in a model registry that should identify storage, versioning, and tagging capabilities. Dessa register måste identifiera käll koden, dess parametrar och motsvarande data som används för att träna modellen, vilket visar var en modell skapades.These registries need to identify the source code, its parameters, and the corresponding data used to train the model, all of which indicate where a model was created.

  • Digital Gransknings logg: När du arbetar med kod och data måste alla ändringar spåras.Digital audit trail: When working with code and data, all changes need to be tracked.

  • Generalisering: Modeller skiljer sig från kod för åter användning eftersom modeller måste vara justerade baserat på indata eller scenariot.Generalization: Models are different than code for reuse, as models must be tuned based on the input data or scenario. Du kan behöva finjustera modellen för nya data för att använda den för ett nytt scenario.You might need to fine-tune the model for the new data to use it for a new scenario.

  • Omskolning av modell: Modell prestandan kan försämras med tiden och det är viktigt att omträna modeller för att de ska vara användbara.Model retraining: Model performance can decrease over time, and it's important to retrain models for them to remain useful.

Metoder för Machine Learning-åtgärderApproaches to machine learning operations

Data experter i en organisation använder ett brett spektrum av erfarenhet, mognad, kunskaper och verktyg för att experimentera med Machine Learning-åtgärder.Data scientists within an organization apply a broad spectrum of experience, maturity, skills, and tools to experimenting with machine learning operations. Eftersom det är viktigt att uppmuntra så många deltagare som möjligt att använda AI, är det en samförstånd om hur alla organisationer bör närma sig maskin inlärnings åtgärder.Since it's important to encourage as many participants as possible to embrace AI, a consensus about how all organizations should approach machine learning operations isn't likely or desirable. Till följd av den här sorten är en tydlig utgångs punkt för din organisation att förstå hur dess storlek och resurser påverkar dess tillvägagångs sätt för maskin inlärnings åtgärder.In light of this variety, a clear starting point for your organization is to understand how its size and resources will influence its approach to machine learning operations.

Företagets storlek och förfallo dag anger om data vetenskaps team eller individer med unika roller ska äga Machine Learning-livscykeln och navigera i varje fas.A company's size and maturity indicate if data science teams or individuals with unique roles will own the machine learning lifecycle and navigate each phase. Följande metoder för livs cykeln är de vanligaste för varje scenario:The following approaches to the lifecycle are the most common to each scenario:

En centraliserad metodA centralized approach

Data vetenskaps team kommer förmodligen att övervaka Machine Learning-livscykeln i små företag med begränsade resurser och specialister.Data science teams will likely monitor the machine learning lifecycle in small companies with limited resources and specialists. Det här teamet använder sin tekniska expertis för att rensa och aggregera data, utveckla och distribuera modeller samt övervaka och underhålla distribuerade modeller.This team applies their technical expertise to cleaning and aggregating data, developing and deploying models, and monitoring and maintaining deployed models.

En fördel med den här metoden är att den fortskrider modellen snabbt till produktion, men den ökar kostnaderna på grund av de specialiserade kunskaps nivåer som måste upprätthållas i data vetenskaps teamet.One advantage of this method is that it progresses the model quickly to production, but it increases costs because of the specialized skill levels that need to be maintained on the data science team. Kvaliteten är lidande när de krav nivåer som krävs inte finns.Quality suffers when those required levels of expertise aren't present.

En decentraliserad metodA decentralized approach

Individer med specialiserade roller kommer troligen att övervaka och vara ansvarig för Machine Learning-livscykeln i företag med särskilda drift team.Individuals with specialized roles will likely monitor and be responsible for the machine learning lifecycle in companies with dedicated operations teams. När ett användnings fall har godkänts, tilldelas en maskin inlärnings tekniker att utvärdera dess aktuella tillstånd och den mängd arbete som behövs för att höja den till format som kan användas.Once a use case is approved, a machine learning engineer is assigned to assess its current state and the amount of work needed to elevate it to format that can be supported.

Data expert måste samla in information för följande frågor:The data scientist will need to gather information for the following questions:

  • Vem är företags ägaren?Who will be the business owner?
  • Hur används modellen?How will the model be consumed?
  • Vilken nivå av tjänst tillgänglighet kommer att krävas?What level of service availability will be needed?
  • Hur kommer modellen att omtränas?How will the model be retrained?
  • Hur ofta kommer modellen att omtränas?How often will the model be retrained?
  • Vem ska bestämma villkoren för modell befordran?Who will decide the conditions for model promotion?
  • Hur känsligt är användnings fallet och är koden som delas?How sensitive is the use case, and is the code shareable?
  • Hur ändras modellen och koden i framtiden?How will the model and code be modified in the future?
  • Hur mycket av det aktuella experimentet kan återanvändas?How much of the current experiment is reusable?
  • Finns det befintliga projekt arbets flöden som kan hjälpa dig?Are there existing project workflows that can assist?
  • Hur mycket arbete kommer att krävas för att modellera modellen till produktion?How much work will be required to advance the model to production?

Sedan utformar en Machine Learning-tekniker arbets flödet och uppskattar mängden arbete som krävs.Next, a machine learning engineer designs the workflow and estimates the amount of work required. Ett bra tillvägagångs sätt är att ta med data expert för att skapa arbets flödet. den här gången utgör en viktig möjlighet att korsa och bekanta sig med de slutliga lagrings platsen eftersom det är vanligt för data expert att arbeta med användnings fallet i framtiden.One best practice is to involve the data scientist(s) in building out the workflow; this time presents a key opportunity to cross-train and familiarize them with the final repo since it's common for the data scientist to work on the use case in the future.

Så här förmånen för Machine Learning-verksamhetHow machine learning operations benefit business

Machine Learning-åtgärder ansluter till traditionella utvecklings åtgärder, data åtgärder och data vetenskap/AI.Machine learning operations connect traditional development operations, data operations, and data science/AI. Att förstå hur Machine Learning-åtgärder kan hjälpa din verksamhet att hjälpa din AI-resa.Understanding how machine learning operations can benefit your business will help your AI journey.

Att integrera maskin inlärnings åtgärder med ditt företag kan skapa följande förmåner:Integrating machine learning operations with your business can create the following benefits:

  • Företags modell hantering effektiviserar och automatiserar livs cykeln för modell utveckling, utbildning, distribution och driftsättning.Enterprise model management streamlines and automates the lifecycle for model development, training, deployment, and operationalization. Detta gör det möjligt för företag att vara flexibla och reagera på omedelbara behov och affärs förändringar på ett repeterbart och hanterat sätt.This allows businesses to be agile and respond to immediate needs and business changes in a repeatable and managed way.

  • Modell versions hantering och data realisering gör det möjligt för företaget att generera upprepade och versions modeller för att anpassa till olika delarna av data eller ett visst användnings fall.Model versioning and data realization allow the enterprise to generate iterated and versioned models to adjust to the nuances of the data or the particular use case. Detta ger flexibilitet och flexibilitet i att svara på affärs utmaningar och ändringar.This provides flexibility and agility in responding to business challenges and changes.

  • När organisationer övervakar och hanterar sina modeller kan de snabbt svara på betydande förändringar i data eller scenariot.When organizations monitoring and manage their models, this helps them to quickly respond to significant changes in the data or the scenario. En implementerad modell kan till exempel uppleva extrem data på grund av en extern faktor eller en ändring i underliggande data.For example, an implemented model might experience extreme data drift because of an external factor or a change in the underlying data. Detta gör att de tidigare modellerna inte går att använda och att den aktuella modellen måste omtränas så snart som möjligt.This would make the previous models unusable and require the current model to be retrained as soon as possible. Maskin inlärnings modeller som ska spåras för precision och prestanda.Machine learning models to be tracked for accuracy and performance. Det meddelar intressenter när ändringar påverkar modellens tillförlitlighet och prestanda, vilket leder till snabb omskolning och distribution.It alerts stakeholders when changes impact model reliability and performance, which leads to quick retraining and deployment.

  • Tillämpade maskin inlärnings processer har stöd för affärs resultat genom att tillåta snabb granskning, efterlevnad, styrning och åtkomst kontroll under hela utvecklings livs cykeln.Applied machine learning operations processes support business outcomes by allowing rapid auditing, compliance, governance, and access control throughout the development lifecycle. Synligheten för modellgenerering, data användning och regelefterlevnad är tydlig när ändringar sker i företaget.The visibility of model generation, data usage, and regulatory compliance is clear as changes take place in the business.

Nästa stegNext steps