Cuándo usar Azure Data Explorer

Completado

Aquí se explica cómo puede decidir si Azure Data Explorer es la elección correcta para las necesidades de análisis de macrodatos. Al evaluar los siguientes criterios, puede determinar si Azure Data Explorer cumple sus objetivos funcionales y de rendimiento.

  • Análisis interactivo
  • Variedad de datos
  • Velocidad de datos
  • Volumen de datos
  • Organización de datos
  • Simultaneidad de consultas
  • Diferencias entre compilación y compra

Criterios de decisión

Azure Data Explorer es una plataforma de análisis interactivo de macrodatos que permite a los usuarios tomar decisiones controladas por datos en un entorno muy ágil. Los factores que se enumeran aquí pueden ayudarle a evaluar si Azure Data Explorer es una buena opción para la carga de trabajo actual. Hágase las siguientes preguntas clave:

Análisis interactivo

¿Es necesario analizar los datos de forma interactiva?

El análisis de datos incluye técnicas como las de agregación, ámbito, evaluación, correlación, detección de anomalías, previsión y evaluación de modelos generales que ayudan a reducir grandes cantidades de datos en conclusiones útiles. La realización de estas actividades de forma interactiva es la base de Azure Data Explorer. Estas actividades se pueden producir en paneles interactivos, aplicaciones analíticas personalizadas o por medio de la interacción directa con los datos mediante consultas y visualizaciones fáciles de usar. Es posible que Azure Data Explorer no sea la tecnología adecuada para ejecutar trabajos por lotes de larga duración en los datos. Considere la posibilidad de usar tecnologías como Microsoft Spark que funcionan bien con Azure Data Explorer para ejecutar tareas de larga duración.

Variedad de datos

¿Cómo se estructuran los datos?

Azure Data Explorer proporciona un índice de texto completo de alto rendimiento escalable y compatibilidad con esquemas dinámicos. Si tiene que analizar y procesar datos estructurados, semiestructurados (JSON y XML), y de texto, es una buena señal de que Azure Data Explorer es relevante para la carga de trabajo.

Velocidad de datos

¿El análisis de datos en tiempo real es un factor crítico?

Azure Data Explorer puede ingerir una gran cantidad de datos rápidamente y con una latencia baja. Los conjuntos de datos típicos incluyen seguimientos, registros de transacciones, series temporales, métricas y, en general, flujos de registros de actividad. El análisis casi en tiempo real sobre datos nuevos es un caso de uso común. Azure Data Explorer se conecta bien a tecnologías de streaming como Azure Event Hubs, centros de IoT y Kafka para potenciar esas cargas de trabajo. Pero si es necesario realizar análisis en tiempo real, es posible que Azure Data Explorer no sea la mejor opción.

Volumen de datos

¿Cuántos datos hay que ingerir?

Azure Data Explorer se ha creado para proporcionar análisis de rutas de acceso semiactivo, interactivo y por medio de API, en cargas de trabajo de datos masivas. En escenarios en los que el tamaño total de los datos acumulados es de unos gigabytes, es posible que haya otras soluciones más rentables.

Organización de datos

¿Con qué coherencia se organizan los datos?

Azure Data Explorer se ha creado para aplicar el esquema al leer datos sin procesar. Este enfoque crea flexibilidad para examinar los datos de maneras diferentes y desde distintos puntos de vista en función de las necesidades actuales. Esta funcionalidad es valiosa para afrontar desafíos inesperados en la seguridad, las operaciones y en entornos competitivos, entre otras áreas. Azure Data Explorer proporciona velocidad, escalabilidad y rentabilidad extremas para analizar datos sin procesar. A menudo, en las implementaciones de almacenamiento de datos, un proceso de extracción, transformación y carga de datos (ETL) genera periódicamente un conjunto de entidades y atributos bien seleccionado, muy coherente y bien documentado. Los análisis de estos esquemas de estrella complejos suelen implicar grandes combinaciones de hechos para las que Azure Data Explorer no está optimizado.

Simultaneidad de consultas

¿Cuántos usuarios tienen que consultar, ingerir o procesar datos al mismo tiempo?

Azure Data Explorer se usa ampliamente para implementar ofertas de SaaS de análisis. Si es necesario admitir diferentes necesidades de análisis únicas de un gran número de solicitudes en paralelo, Azure Data Explorer proporciona una buena solución.

Diferencias entre compilación y compra

¿Cuánto se quiere personalizar la plataforma de datos?

Azure Data Explorer es una plataforma como servicio totalmente administrada. Pero no proporciona una solución lista para su uso. Es necesario personalizar, configurar, conectar y crear experiencias sobre ella para ofrecer una solución (compilación). Hay varias soluciones, de Microsoft y de terceros, que usan Azure Data Explorer para ofrecer estas soluciones llave en mano en dominios y verticales diferentes; por ejemplo, Azure Monitor para operaciones de TI. Microsoft Advanced Threat Protection y Microsoft Sentinel en el dominio de seguridad, y Azure Time Series Insights y Azure IoT Central en los dominios de IoT.

Aplicación de los criterios

Azure Data Explorer funciona mejor para habilitar funcionalidades de análisis interactivo para los trabajadores del conocimiento mediante datos sin procesar diversos y de alta velocidad. Vamos a pensar en cómo aplicar los criterios enumerados anteriormente a nuestros procesos de ejemplo en el caso de las empresas textiles.

¿Se debería usar Azure Data Explorer para los datos de producción?

El departamento de producción de la empresa textil de ejemplo debe tomar decisiones sobre cómo administrar volúmenes de inventario y producción. Tienen registros entrantes de datos para el inventario. También quieren usar datos geoespaciales de marketing para anticiparse a las necesidades de productos por región. Estos datos tienen un alto grado de variedad, velocidad y volumen. No se organizan de forma coherente y muchas partes interesadas tienen que consultar simultáneamente estos datos. Desde la ingesta hasta la consulta, necesitan una latencia baja. Necesitan tiempos de respuesta de consulta inferiores a un segundo y menos. En función de los criterios de decisión, Azure Data Explorer es una buena opción para la división de producción de la empresa textil.

¿Se debería usar Azure Data Explorer para los datos de marketing?

El departamento de marketing de la empresa textil quiere evaluar la eficacia de su campaña. Tienen información de la secuencia de clic de su sitio web y campañas publicitarias. También tienen datos de texto libre (no estructurados) de las redes sociales. Estos datos son muy variados y no están organizados. El departamento va a querer realizar análisis interactivos exploratorios. En función de los criterios de decisión, Azure Data Explorer es una buena opción para la división de marketing de la empresa textil.

Resumen de instrucciones

En la tabla siguiente se muestra cómo evaluar nuevos casos de uso. Aunque aquí no se tratan todos los casos de uso, creemos que puede ayudarle a decidir si Azure Data Explorer es la solución adecuada para usted.

Caso de uso Análisis interactivo Macrodatos (variedad, velocidad y volumen) Organización de datos Concurrency Diferencias entre compilación y compra ¿Debo usar Azure Data Explorer?
Implementación de un SaaS de análisis de seguridad Uso intensivo de análisis interactivos, casi en tiempo real. Los datos de seguridad son diversos, de gran volumen y de alta velocidad. Varía A menudo, varios analistas de varios inquilinos usan el sistema. La implementación de una oferta de SaaS es un escenario de Creación.
Análisis de registros de CDN Interactivo para la solución de problemas, supervisión de QoS. Los registros de CDN son diversos, de gran volumen y de alta velocidad. Separe las entradas de registro. Un pequeño grupo de científicos de datos puede usar estos análisis, pero también puede servir para muchos paneles. El valor extraído del análisis de CDN es específico del escenario y necesita análisis personalizados.
Base de datos de serie temporal para telemetría de IoT Interactivo para la solución de problemas, el análisis de tendencias, el uso y la detección de anomalías. La telemetría de IoT es de alta velocidad, pero puede estar estructurada o tener un tamaño medio. Conjuntos de registros relacionados. Un pequeño grupo de científicos de datos puede usar estos análisis, pero también puede servir para muchos paneles. El contexto suele ser la compilación al buscar una base de datos.

En la tabla de diagrama de flujo siguiente se resumen las preguntas clave que se pueden plantear cuando se considera la posibilidad de usar Azure Data Explorer.

Flowchart showing when to use Azure Data Explorer. Questions include: do you need to read and write a specific record, do you need to perform long running tasks, classic data warehouse, must run on other clouds, and small data.