Idea de solución
Si le gustaría que expandamos este artículo con más información, como posibles casos de uso, servicios alternativos, consideraciones de implementación o una guía de precios, comuníquese a través de los Comentarios de GitHub.
En esta idea de solución se describe cómo crear e implementar un modelo de Machine Learning con Microsoft Machine Learning Server en clústeres de Azure HDInsight Spark para recomendar acciones para maximizar la tasa de compra de los clientes potenciales a los que se dirige una campaña. Esta solución permite un control eficaz de los macrodatos en Spark con Machine Learning Server.
Cuando una empresa lanza una campaña de marketing para interesar a los clientes en productos nuevos o ya existentes, a menudo usa un conjunto de reglas de negocio para seleccionar los clientes potenciales a los que dirigir su campaña. El aprendizaje automático se puede usar para ayudar a aumentar la tasa de respuesta de estos clientes potenciales. En esta solución se describe cómo usar un modelo para predecir acciones que se espera que maximicen la tasa de compra de los clientes potenciales a los que se dirige la campaña. Estas predicciones sirven como base para las recomendaciones que se van a usar en una campaña renovada sobre cómo ponerse en contacto con los clientes potenciales (por ejemplo, mediante correo electrónico, SMS o llamada telefónica) y cuándo (día de la semana y hora del día).
El repositorio de GitHub para la optimización de campañas es una implementación de esta idea de solución. El código del repositorio utiliza datos simulados del sector de los seguros para modelar las respuestas de los clientes potenciales ante la campaña. Los predicciones de modelo incluyen detalles demográficos de dichos clientes, el rendimiento histórico de las campañas y los detalles específicos del producto. El modelo predice la probabilidad de que cada cliente potencial de la base de datos realice una compra en un canal, en cada día de la semana, a varias horas del día. Las recomendaciones sobre el canal, el día de la semana y la hora del día que se van a usar al predecir los usuarios de destino se basan en la combinación de canal y tiempo que el modelo prediga con la mayor probabilidad de que efectúen una compra.
Architecture
Descargue un SVG de esta arquitectura.
Componentes
Microsoft Machine Learning Server: software empresarial para ciencia de datos con intérpretes de R y Python, distribuciones base de R y Python, otras bibliotecas de alto rendimiento de Microsoft y una funcionalidad de operacionalización para escenarios de implementación avanzados.
Azure HDInsight: servicio de análisis administrado, de espectro completo y de código abierto en la nube para empresas. Puede usar plataformas de código abierto como Hadoop, Apache Spark, Apache Hive, LLAP, Apache Kafka, Apache Storm, R, etc.
Perspectiva empresarial
Esta solución emplea el aprendizaje con los datos históricos de la campaña para predecir las respuestas de los clientes y recomendar cuándo y cómo conectarse con los clientes potenciales. Las recomendaciones incluyen el mejor canal (en nuestro ejemplo, el correo electrónico, SMS o una llamada de teléfono), el mejor día de la semana y la mejor hora del día en que establecer el contacto.
Microsoft Machine Learning Server en los clústeres de HDInsight Spark ofrece funcionalidades de aprendizaje automático distribuidas y escalables para macrodatos, gracias a la capacidad combinada de Machine Learning Server y Apache Spark. Esta solución muestra cómo desarrollar modelos de aprendizaje automático para la optimización de campañas de marketing (incluido el procesamiento de datos, la ingeniería de características, el entrenamiento y la evaluación de modelos), la implementación de los modelos como servicio web (en el nodo perimetral) y el consumo del servicio web de forma remota con Microsoft Machine Learning Server en los clústeres de Azure HDInsight Spark. La tabla de recomendaciones y predicciones finales se guarda en una tabla de Hive que contiene recomendaciones sobre cómo y cuándo ponerse en contacto con cada cliente potencial. Después, estos datos se visualizan en Power BI. Power BI presenta resúmenes visuales de la eficacia de las recomendaciones de la campaña.
En la pestaña Recommendations (Recomendaciones) de este panel se muestran las recomendaciones previstas. En la parte superior del panel se muestra una tabla de clientes potenciales individuales para nuestra nueva implementación. En la tabla se incluyen los campos para el identificador del cliente potencial, la campaña y el producto, rellenados con los clientes potenciales a los que se van a aplicar las reglas de negocio. A estos campos les siguen las predicciones de modelo para los clientes potenciales, con el canal y la hora óptimos en los que ponerse en contacto con cada uno de ellos, junto con las probabilidades estimadas de que los clientes potenciales compren nuestro producto con estas recomendaciones. Estas probabilidades se pueden usar para aumentar la eficacia de la campaña al limitar el número de clientes potenciales a los que se ha contactado con el subconjunto que es más probable que compre.
Además, en la pestaña de recomendaciones hay varios resúmenes de recomendaciones e información demográfica de los clientes potenciales. En la pestaña Campaign Summary (Resumen de la campaña) del panel se muestran resúmenes de los datos históricos que se usan para crear las recomendaciones previstas. Aunque esta pestaña también muestra los valores del día de la semana, la hora del día y el canal, se trata de observaciones pasadas reales; no deben confundirse con las recomendaciones del modelo que se muestran en la pestaña Recommendations (Recomendaciones).
Perspectiva del científico de datos
Esta solución muestra el proceso integral de cómo desarrollar e implementar modelos de aprendizaje automático para la optimización de campañas de marketing. Contiene datos de ejemplo, código de R para cada paso de la creación del modelo (incluido el procesamiento de datos, la ingeniería de características, el entrenamiento y la evaluación de modelos), la implementación de los modelos como servicio web (en el nodo perimetral) y el consumo del servicio web de forma remota con Microsoft Machine Learning Server en los clústeres de Azure HDInsight Spark.
Los científicos de datos que prueban esta solución pueden trabajar con el código de R proporcionado desde la edición de código abierto basado en explorador del servidor de RStudio que se ejecuta en el nodo perimetral del clúster de Azure HDInsight Spark. Al establecer el contexto de proceso, los usuarios pueden decidir dónde se realizará el cálculo: en el nodo perimetral de manera local o por los nodos del clúster de Spark. El código de R también se encuentra en el repositorio público de GitHub. ¡Que te diviertas!
Consideraciones sobre el costo
Con esta solución se creará un clúster de HDInsight Spark con Microsoft Machine Learning Server. Este clúster contendrá dos nodos principales, dos nodos de trabajo y un nodo perimetral con 32 núcleos en total. El costo aproximado de este clúster de HDInsight Spark se puede calcular con la calculadora de precios de Azure. La facturación se inicia una vez creado un clúster y solo se detiene cuando se elimina. Se facturan por minuto realizando una prorrata, por lo que siempre debe eliminar aquellos que ya no se estén utilizando. Cuando haya terminado, use la página Implementaciones para eliminar toda la solución.
Pasos siguientes
Consulte otros artículos del Centro de arquitectura de Azure:
- Optimización de campañas con SQL Server y aprendizaje automático
- Administración de campañas digitales
- Guía del desarrollador de R para Azure
Más información y código para probar:
- Módulo de Microsoft Learn Introducción a Azure HDInsight
- Documentación de Microsoft Machine Learning Server: tutoriales y datos de ejemplo
- Azure AI Gallery: Optimización de campañas con clústeres de Azure HDInsight Spark