Diseño de un trabajo de Azure Batch para ejecutar la tarea paralela

Completado

Azure Batch usa tareas paralelas para dividir un trabajo en nodos de ejecución.

Como el arquitecto de soluciones de la organización sin fines de lucro, quiere entender cómo diseñar un trabajo de Azure Batch y cómo habilitar el procesamiento paralelo, para que estas funcionalidades se puedan usar para el escenario de OCR.

Aquí aprenderá los elementos clave de una tarea paralela de Batch.

Uso de Azure Batch con la CLI de Azure

Puede decidir crear la solución para ayudar a la organización sin fines de lucro en su misión con Azure Batch y la CLI, para así implementar un marco rápido y mejorarlo de manera incremental, sin dedicar tiempo a aplicar scaffolding a todo el código fundamental que, de lo contrario, necesitaría para empezar. Es cierto que otros métodos de creación de soluciones de Azure Batch como .NET y Node.js ofrecen un control más completo y granular de Batch y otras API de Azure, pero ninguno de esos métodos puede igualar la agilidad y los comentarios inmediatos que se obtienen mediante la emisión de comandos en la CLI y la observación de sus resultados.

Una tarea paralela de ejemplo

Para enfrentarse a Azure Batch y la CLI, puede decidir sobre una prueba de concepto sencilla para demostrar los distintos nodos que trabajan juntos en paralelo. Ejecutará un bucle varias veces en la CLI, agregará una tarea numerada por iteración del bucle y, luego, descargará y observará los metadatos que genera cada tarea. Estos metadatos muestran que el servicio de Azure Batch programa tareas cuando estas se crean en distintos nodos de manera secuencial, para que todos ejecuten su trabajo en paralelo.

En realidad, este tipo de prueba de concepto subyace a muchas aplicaciones reales de Azure Batch. Por ejemplo, en el escenario de OCR, las tareas también instalarían software como Imagemagick para convertir a formato TIF las imágenes de potabilidad de agua cargadas y, luego, instalarían Tesseract para realizar el trabajo de conversión. Estas tareas se particionarían de manera tal que cada nodo de trabajo realizaría una parte del trabajo de OCR en paralelo con los otros para completarse más rápido.

Incluso esta prueba de concepto demostrará componentes importantes de Azure Batch trabajando en conjunto. Creará un grupo, creará nodos de trabajo, creará un trabajo y creará tareas, todo esto con la CLI de Azure para emitir comandos y recibir comentarios inmediatos.

Diagrama del flujo de trabajo de Azure Batch.

Ventajas del uso de Azure Batch

Azure Batch es especialmente adecuado para ejecutar trabajos por lotes paralelos a gran escala y de informática de alto rendimiento (HPC). El servicio controla todo el contenido de forma automática, y administra y programa todos los nodos y las aplicaciones que se necesitan para ejecutar sus escenarios. También es un servicio gratuito, por lo que solo se paga el proceso subyacente, el almacenamiento y los recursos de red que utiliza.