Exemplo de projeto de Coordenador de Atividades

Artigo
02/14/2024

Este exemplo simples para o Coordenador de Atividades demonstra como a API pode ser aproveitada para treinar novamente um modelo em segundo plano quando as condições do sistema são atendidas.

Visão geral do projeto de exemplo

Vamos considerar o caso de um aplicativo de edição de música. Este aplicativo tem tarefas em segundo plano de alta prioridade que atendem às solicitações do usuário, como publicar conteúdo no armazenamento em nuvem. Há também tarefas em segundo plano de baixa prioridade que dão suporte à interação do usuário, como fornecer recomendações automáticas para melhorar uma composição durante a edição. Por fim, há um conjunto de tarefas adiadas que não precisam acontecer em nenhum momento específico sem a solicitação do usuário, que é o nosso foco neste exemplo. Em particular, gostaríamos de treinar periodicamente o modelo de recomendação quando o impacto do usuário for mínimo. Podemos usar a API do Coordenador de Atividades para conseguir isso.

Para esse cenário, gostaríamos de treinar novamente o modelo quando o usuário não estiver presente. O fluxo de trabalho de reciclagem neste cenário também é um consumidor de GPU, então também queremos executar quando for um bom momento para usar a GPU. Podemos especificar esses requisitos usando as políticas do Coordenador de Atividades. A API do Coordenador de Atividades usará nossa política para determinar quando os requisitos serão atendidos e enviará notificações para quando iniciar ou parar a execução de nosso trabalho.

Nesse caso, o modelo de política GOOD atende à maioria das nossas necessidades, pois rastreia CPU, memória, disco do sistema, energia e ociosidade do usuário. Simplesmente precisamos definir explicitamente uma condição para a GPU. É importante lembrar que, embora nossa carga de trabalho utilize principalmente a GPU, a execução de nossa atividade ainda consome inerentemente CPU, memória, disco e energia. Nosso impacto nesses recursos também pode variar muito entre as configurações do sistema. Por exemplo, uma GPU mais rápida pode fazer com que a CPU gaste mais tempo alimentando a GPU com dados, o que pode resultar em mais dados sendo lidos ou salvos em disco. A velocidade deste disco também pode afetar o consumo de CPU de forma semelhante. Ao configurar todos os recursos que afetamos, podemos ter certeza de que não interferimos inadvertidamente na experiência do usuário ou prejudicamos o desempenho do sistema. Além disso, o trabalho em si foi dividido para acontecer em pequenos pedaços, para que possamos responder adequadamente às notificações de coordenação para evitar correr fora das condições desejadas.

Para demonstrar como os desenvolvedores podem alterar ou fazer downgrade das políticas, também adicionamos o requisito de que queremos que o treinamento seja concluído dentro de 48 horas. Nas primeiras 24 horas, nosso prazo flexível, tentamos executar com nossa política ideal, e nas últimas 24 horas rebaixamos para uma política menor.

Código de projeto de exemplo

O código a seguir é o aplicativo de exemplo de edição de música. Ele aproveita a API do Coordenador de Atividades para executar tarefas em segundo plano, conforme descrito na visão geral.

#include <chrono>
#include <mutex>
#include <condition_variable>
#include <Windows.h>
#include <ActivityCoordinator.h>
#include <wil/resource.h>

// To use ActivityCoordinator, we must link to the OneCoreUAP library.

#pragma comment(lib, "OneCoreUAP.lib")

using namespace std;
using namespace chrono;
using namespace wil;

// Declare RAII wrappers for the Activity Coordinator policy and subscription.
// These behave like traditional smart pointers and will call their associated
// API cleanup functions when they go out of scope.

typedef wil::unique_any<
        ACTIVITY_COORDINATOR_POLICY,
        decltype(&DestroyActivityCoordinatorPolicy),
        DestroyActivityCoordinatorPolicy>
    unique_policy;

typedef wil::unique_any<
        ACTIVITY_COORDINATOR_SUBSCRIPTION,
        decltype(&UnsubscribeActivityCoordinatorPolicy),
        UnsubscribeActivityCoordinatorPolicy>
    unique_subscription;

struct WORKER_CONTEXT {
    mutex ContextLock;
    unique_threadpool_work Worker;
    bool ShouldRun;
    bool IsRunning;
    bool IsComplete;
    std::condition_variable CompletionSignal;
};

_Requires_lock_held_(workerContext->ContextLock)
void
ResumeWorker(
    _In_ WORKER_CONTEXT* workerContext
    )
{
    workerContext->ShouldRun = true;
    if (!workerContext->IsRunning && !workerContext->IsComplete) {

        // No active workers, so start a new one.

        workerContext->IsRunning = true;
        SubmitThreadpoolWork(workerContext->Worker.get());
    }
}

void
DeferredWorkEventCallback(
    _In_ ACTIVITY_COORDINATOR_NOTIFICATION notificationType,
    _In_ void* callbackContext
    )
{
    WORKER_CONTEXT* workerContext = reinterpret_cast<WORKER_CONTEXT*>(callbackContext);

    // Use this callback thread to dispatch notifications to a worker thread
    // about whether or not it should process the next chunk of deferred work.

    // Note: Do not use this thread to perform your activity's workload.

    lock_guard<mutex> scopedLock(workerContext->ContextLock);
    switch (notificationType) {
    case ACTIVITY_COORDINATOR_NOTIFICATION_RUN:

        // Allow deferred work to be processed.

        ResumeWorker(workerContext);

        break;

    case ACTIVITY_COORDINATOR_NOTIFICATION_STOP:

        // Stop processing deferred work.

        workerContext->ShouldRun = false;

        break;

    default:
        FAIL_FAST();
        break;
    }
}

bool
TrainNextModelChunk(
    )
{
    //
    // Returns true if all work is completed, or false if there is more work.
    //

    return false;
}

void
DeferredModelTrainingWorker(
    _Inout_ PTP_CALLBACK_INSTANCE callbackInstance,
    _Inout_opt_ PVOID callbackContext,
    _Inout_ PTP_WORK work
    )
{
    // Threadpool callback instance and work are not needed for this sample.

    UNREFERENCED_PARAMETER(callbackInstance);
    UNREFERENCED_PARAMETER(work);

    WORKER_CONTEXT* workerContext = reinterpret_cast<WORKER_CONTEXT*>(callbackContext);
    bool workComplete = false;

    // Keep processing work until being told to stop or all work has been completed.

    while (true) {
        {
            lock_guard<mutex> scopedLock(workerContext->ContextLock);

            if (workComplete) {
                workerContext->IsComplete = true;
            }

            if (!workerContext->ShouldRun || workerContext->IsComplete) {
                workerContext->IsRunning = false;
                break;
            }
        }

        // TrainNextModelChunk returns true when there is no more work to do.

        workComplete = TrainNextModelChunk();
    }

    workerContext->CompletionSignal.notify_all();
}

int
__cdecl
wmain(
    )
{
    WORKER_CONTEXT workerContext;
    workerContext.ShouldRun = false;
    workerContext.IsRunning = false;
    workerContext.IsComplete = false;

    // Create the worker that will be started by our subscription callback.

    workerContext.Worker.reset(CreateThreadpoolWork(
        DeferredModelTrainingWorker,
        &workerContext,
        nullptr));
    RETURN_LAST_ERROR_IF_NULL(workerContext.Worker);

    // Allocate a policy suited for tasks that are best run when unlikely
    // to cause impact to the user or system performance.

    unique_policy policy;
    RETURN_IF_FAILED(CreateActivityCoordinatorPolicy(
        ACTIVITY_COORDINATOR_POLICY_TEMPLATE_GOOD,
        &policy));

    // The model training in this sample consumes GPU. As per the MSDN docs, the
    // GOOD policy template doesn't currently include the GPU resource. We
    // therefore customize the policy to include good GPU conditions to minimize
    // the impact of running our work.

    RETURN_IF_FAILED(SetActivityCoordinatorPolicyResourceCondition(
        policy.get(),
        ACTIVITY_COORDINATOR_RESOURCE_GPU,
        ACTIVITY_COORDINATOR_CONDITION_GOOD));

    // Subscribe to the policy for coordination notifications.

    unique_subscription subscription;
    RETURN_IF_FAILED(SubscribeActivityCoordinatorPolicy(
        policy.get(),
        DeferredWorkEventCallback,
        &workerContext,
        &subscription));;

    // Destroy the policy because we no longer need it.

    policy.reset();

    // We want our task to complete within 48h, so we allocate 24h under our
    // ideal policy and before falling back to a downgraded policy.

    bool workerCompleted;

    {
        unique_lock<mutex> scopedLock(workerContext.ContextLock);
        workerCompleted = workerContext.CompletionSignal.wait_for(
            scopedLock,
            hours(24),
            [&workerContext] { return workerContext.IsComplete; });
    }

    if (workerCompleted) {

        // Since our work is complete, we should clean up our subscription by
        // unsubscribing. This would normally be handled quietly by our RAII
        // types, but we release them explicitly to demonstrate API flow for
        // developers manually managing resources.

        subscription.reset();
        return S_OK;
    }

    // We passed our soft deadline, so downgrade the policy and wait the
    // remaining 24h until our hard deadline has been reached. Since
    // Subscriptions and policies are independent of each other, we need to
    // create a new subscription with our downgraded policy to receive
    // notifications based on its configuration.
    // 
    // The downgraded policy uses medium conditions for all needed resources.
    // This gives us the best chance to run while helping to prevent us from
    // critically degrading the user experience, which we are more likely to do
    // when falling back to manual execution.

    RETURN_IF_FAILED(CreateActivityCoordinatorPolicy(
        ACTIVITY_COORDINATOR_POLICY_TEMPLATE_MEDIUM,
        &policy));

    RETURN_IF_FAILED(SetActivityCoordinatorPolicyResourceCondition(
        policy.get(),
        ACTIVITY_COORDINATOR_RESOURCE_GPU,
        ACTIVITY_COORDINATOR_CONDITION_MEDIUM));

    subscription.reset();
    RETURN_IF_FAILED(SubscribeActivityCoordinatorPolicy(
        policy.get(),
        DeferredWorkEventCallback,
        &workerContext,
        &subscription));

    {
        unique_lock<mutex> scopedLock(workerContext.ContextLock);
        workerCompleted = workerContext.CompletionSignal.wait_for(
            scopedLock,
            hours(24),
            [&workerContext] { return workerContext.IsComplete; });
    }

    // We passed our deadline, so unsubscribe and manually resume our task.

    subscription.reset();
    ResumeWorker(&workerContext);

    // We destroyed our subscription, so we wait indefinitely for completion as
    // there's nothing to pause execution of our task.

    unique_lock<mutex> scopedLock(workerContext.ContextLock);
    workerContext.CompletionSignal.wait(
        scopedLock,
        [&workerContext] { return workerContext.IsComplete; });

    return S_OK;
}

Visão geral da API do Coordenador de Atividades

Coordenador de Atividades API e terminologia

Escolhendo a política correta do Coordenador de Atividades

Exemplo de projeto de Coordenador de Atividades

Visão geral do projeto de exemplo

Código de projeto de exemplo

Comentários

Comentários

Recursos adicionais

Exemplo de projeto de Coordenador de Atividades

Visão geral do projeto de exemplo

Código de projeto de exemplo

Tópicos relacionados

Comentários

Comentários

Recursos adicionais