Creación de soluciones analíticas de software de código abierto (OSS) con Azure HDInsight

Intermedio
Ingeniero de datos
Científico de datos
HDInsight de Azure

En esta ruta de aprendizaje, el aprendiz se introducirá en HDInsight y aprenderá a aplicar esta tecnología para solucionar varios retos reales.

Requisitos previos

Se debe completar el siguiente requisito previo.

  • Inicio de sesión correcto en Azure Portal
  • Descripción de las opciones de almacenamiento de Azure
  • Descripción de las opciones de procesamiento de Azure

Módulos en esta ruta de aprendizaje

Al final de este módulo, habrá aprendido que Azure HDInsight es un servicio en la nube totalmente administrado que le permite procesar eficazmente grandes cantidades de datos con los marcos de código abierto más populares.

En este módulo, descubrirá las diferentes configuraciones para garantizar el uso óptimo de HDInsight desde el punto de vista del rendimiento y del costo.

En este módulo, se aprende a crear y a supervisar un clúster de HDInsight, así como a tener en cuenta los problemas de aprovisionamiento comunes.

Obtenga información sobre cómo HBase proporciona acceso aleatorio y una coherencia fuerte para grandes cantidades de datos no estructurados y semiestructurados en un esquema menos base de datos organizada por familias de columnas.

En este módulo, descubrirás cómo crear canalizaciones y aplicaciones de análisis de datos de streaming en tiempo real en la nube mediante Azure HDInsight con Apache Kafka y Apache Spark.

Al final de este módulo, podrá realizar consultas ad hoc en un conjunto de macrodatos. El uso de HDInsight Interactive Query ayuda a lograr latencias de consulta inferiores a un segundo.

Azure HDInsight, junto con otros servicios de Azure, proporciona una solución de seguridad completa de varios niveles y es una responsabilidad que comparten Microsoft y el cliente.