Diagnóstico de consultas

Con diagnósticos de consultas, puede comprender mejor lo que Power Query hace en la creación y en el momento de la actualización en Power BI Desktop. Aunque en el futuro ampliaremos esta característica, incluida la posibilidad de usarla durante las actualizaciones completa, en este momento puede usarla para comprender qué tipo de consultas emite, en qué ralentizaciones podría encontrarse durante la actualización de creación y qué tipo de eventos en segundo plano se están produciendo.

Para usar diagnósticos de consulta, vaya a la pestaña Herramientas de la cinta Power Query Editor de consultas.

Diagnósticos de consultas.

De forma predeterminada, Los diagnósticos de consultas pueden requerir derechos administrativos para ejecutarse (en función de la directiva de IT). Si no puede ejecutar diagnósticos de consulta, abra la página de opciones de Power BI y, en la pestaña Diagnósticos, seleccione Habilitar en el Editor de consultas (no requiere ejecutar como administrador). Esta selección le restringe la posibilidad de realizar un seguimiento de los diagnósticos al realizar una actualización completa en Power BI en lugar del editor de Power Query, pero le permite seguir usarlo al obtener una vista previa, crear, y así sucesivamente.

Opciones de diagnóstico de consulta.

Cada vez que inicie el diagnóstico, Power Query seguimiento de las evaluaciones que cause. La evaluación que la mayoría de los usuarios piensa es cuando se presiona la actualización o cuando se recuperan datos por primera vez, pero hay muchas acciones que pueden provocar evaluaciones, dependiendo del conector. Por ejemplo, con el conector SQL, al recuperar una lista de valores para filtrar, esto también iniciaría una evaluación, pero no se asocia a una consulta de usuario, y eso se representa en el — diagnóstico. Otras consultas generadas por el sistema pueden incluir el navegador o la experiencia de obtener datos.

Al presionar Paso de diagnóstico, Power Query una evaluación especial del paso que está viendo. A continuación, muestra los diagnósticos de ese paso, sin mostrar los diagnósticos de otros pasos de la consulta. Esto puede hacer que sea mucho más fácil obtener una vista estrecha de un problema.

Es importante que, si va a grabar todos los seguimientos desde Iniciar diagnósticos, presione Detener diagnóstico. Detener el diagnóstico permite que el motor recopile los seguimientos registrados y los analice en la salida adecuada. Sin este paso, perderá los seguimientos.

Tipos de diagnóstico

Actualmente se proporcionan tres tipos de diagnóstico, uno de los cuales tiene dos niveles de detalle.

El primero de estos diagnósticos son los diagnósticos principales, que tienen una vista detallada y una vista resumida. La vista resumida está destinada a proporcionar una visión inmediata de dónde se dedica el tiempo en la consulta. La vista detallada es mucho más profunda, línea por línea, y, en general, solo es necesaria para un diagnóstico grave por parte de los usuarios avanzados.

Para esta vista, algunas funcionalidades, como la columna Consulta de origen de datos, solo están disponibles actualmente en determinados conectores. Trabajaremos para ampliar la amplitud de esta cobertura en el futuro.

Las particiones de privacidad de datos proporcionan una mejor comprensión de las particiones lógicas que se usan para la privacidad de los datos.

Nota

Power Query realizar evaluaciones que es posible que no se haya desencadenado directamente. Algunas de estas evaluaciones se realizan con el fin de recuperar metadatos para que podamos optimizar mejor nuestras consultas o para proporcionar una mejor experiencia de usuario (como recuperar la lista de valores distintos dentro de una columna que se muestran en la experiencia Filtrar filas). Otros pueden estar relacionados con la forma en que un conector controla las evaluaciones paralelas. Al mismo tiempo, si ve en los diagnósticos de consultas consultas repetidas que no cree que tienen sentido, no dude en irse en contacto con los canales de soporte técnico normales que sus comentarios son la forma en que mejoramos nuestro — producto.

Vista resumida frente a vista detallada

El diagnóstico de consultas proporciona dos vistas: resumida y detallada. La vista resumida "contrae" varias operaciones relacionadas en una sola operación. En este proceso, se combinan los detalles recopilados por cada operación y se suman las duraciones exclusivas. No se pierde información como parte de este proceso.

La vista resumida proporciona información general de lo que ha ocurrido durante una evaluación para facilitar la revisión de alto nivel. Si se desea un desglose adicional para una operación específica, el usuario puede ver el identificador de grupo y ver las operaciones correspondientes que se agruparon en la vista de detalles.

Explicación de varias evaluaciones

Al actualizar en el editor Power Query, se realiza mucho en segundo plano para intentar ofrecer una experiencia de usuario fluida. Por ejemplo, cuando actualice la versión preliminar , el evaluador ejecutará el paso final de cada consulta determinada. Pero, en segundo plano, ejecuta secuencialmente los pasos n-1, n-2, pasos, y así sucesivamente, para que, si vuelve a seguir los pasos, ya esté disponible.

Para proporcionar un mayor rendimiento, actualmente se produce algún almacenamiento en caché para que no tenga que volver a ejecutar todas las partes del plan de consulta final a medida que se retrase por los pasos. Aunque este almacenamiento en caché es útil para la creación normal, significa que no siempre se obtiene información de comparación de pasos correcta debido a evaluaciones posteriores que se extraerán de los datos almacenados en caché.

Esquema de diagnóstico

Identificador

Al analizar los resultados de una grabación, es importante filtrar la sesión de grabación por identificador, de modo que las columnas como Duración exclusiva % tienen sentido.

Id. es un identificador compuesto. Está formado por dos números — uno antes del punto y otro después. El primer número es el mismo para todas las evaluaciones resultantes de una sola acción del usuario. En otras palabras, si presiona actualizar dos veces, habrá dos números diferentes que llevan el punto, uno para cada actividad de usuario realizada. Esta numeración es secuencial para una grabación de diagnóstico determinada.

El segundo número representa una evaluación por parte del motor. Este número es secuencial durante la vigencia del proceso en el que se pone en cola la evaluación. Si ejecuta varias sesiones de grabación de diagnóstico, verá que este número sigue creciendo en las distintas sesiones.

En resumen, si inicia la grabación, presiona la evaluación una vez y detiene la grabación, tendrá un número de identificadores en los diagnósticos. Pero como solo ha hecho una acción, todas serán 1.1, 1.2, 1.3, y así sucesivamente.

La combinación de activityId y evaluationId, separados por el punto, proporciona un identificador único para una evaluación de una sola sesión de grabación.

Consultar

Nombre de la consulta en el panel izquierdo del editor de Power Query.

Paso

Nombre del paso en el panel derecho del editor de Power Query. Por lo general, elementos como las listas desplegables de filtros se asocian con el paso por el que se filtra, incluso si no se actualiza el paso.

Category

Categoría de la operación.

Tipo de origen de datos

Esto le indica a qué tipo de origen de datos está accediendo, como SQL u Oracle.

Operación

Operación real que se está realizando. Esta operación puede incluir el trabajo del evaluador, la apertura de conexiones, el envío de consultas al origen de datos y muchos más.

Hora de inicio

Hora a la que se inició la operación.

Hora de finalización

Hora a la que finalizó la operación.

Duración exclusiva (%)

La columna Duración exclusiva de un evento es la cantidad de tiempo que el evento estaba activo. Esto contrasta con el valor de "duración" que resulta de restar los valores de la columna Hora de inicio y hora de finalización de un evento. Este valor de "duración" representa el tiempo total transcurrido entre el momento en que se inició un evento y el momento en que finalizó, que puede incluir las veces que el evento estaba en estado suspendido o inactivo y que otro evento estaba consumiendo recursos.

El porcentaje de duración exclusiva se suma aproximadamente al 100 % dentro de una evaluación determinada, como se representa en la columna Id. Por ejemplo, si filtra por filas con id. 1.x, los porcentajes de duración exclusiva sumaría aproximadamente el 100 %. Este no es el caso si suma los valores de % de duración exclusiva de todas las filas de una tabla de diagnóstico determinada.

Duración exclusiva

Tiempo absoluto, en lugar de %, de duración exclusiva. La duración total (es decir, la duración exclusiva + el tiempo en que el evento estaba inactivo) de una evaluación se puede calcular de una de estas dos maneras:

  • Busque la operación denominada "Evaluation". La diferencia entre la hora de inicio – de la hora de finalización da como resultado la duración total de un evento.

  • Resta la hora de inicio mínima de todas las operaciones de un evento de la hora de finalización máxima. Tenga en cuenta que en los casos en los que la información recopilada para un evento no tiene en cuenta la duración total, se genera una operación denominada "Brechas de seguimiento" para tener en cuenta este intervalo de tiempo.

Recurso

Recurso al que está accediendo para los datos. El formato exacto de este recurso depende del origen de datos.

Consulta de origen de datos

Power Query hace algo denominado Plegado, que es el acto de ejecutar tantas partes de la consulta en el origen de datos back-end como sea posible. En el modo direct query (sobre Power Query), donde está habilitado, solo se ejecutarán las transformaciones que se van a plegar. En el modo de importación, las transformaciones que no se pueden plegar se ejecutarán localmente.

La columna Consulta de origen de datos permite ver la consulta o la solicitud/respuesta HTTP enviadas en el origen de datos back-end. A medida que cree la consulta en el editor, se emitirán muchas consultas de origen de datos. Algunos de ellos son la consulta final del origen de datos real para representar la vista previa, pero otros pueden ser para la generación de perfiles de datos, listas desplegables de filtros, información sobre combinaciones, recuperación de metadatos para esquemas y cualquier número de otras consultas pequeñas.

En general, no debería preocuparse por el número de consultas de origen de datos emitidas a menos que haya motivos específicos que preocuparse. En su lugar, debe centrarse en asegurarse de que se recupera el contenido adecuado. Esta columna también puede ayudar a determinar si la Power Query evaluación se ha plegado por completo.

Información adicional

Nuestros conectores recuperan mucha información. Gran parte de ella es desigual y no cabe bien en una jerarquía de columnas estándar. Esta información se coloca en un registro en la columna de información adicional. La información registrada desde conectores personalizados también aparece aquí.

Recuento de filas

Número de filas devueltas por una consulta de origen de datos. No habilitado en todos los conectores.

Longitud del contenido

Longitud de contenido devuelta por las solicitudes HTTP, como se define normalmente. Esto no está habilitado en todos los conectores y no será preciso para los conectores que recuperan solicitudes en fragmentos.

Is User Query

Valor booleano que indica si se trata de una consulta que ha creado el usuario y está presente en el panel izquierdo, o si se ha generado mediante alguna otra acción del usuario. Otras acciones del usuario pueden incluir aspectos como la selección de filtros o el uso del navegador en la experiencia de obtener datos.

Path

Path representa la ruta relativa de la operación cuando se ve como parte de un árbol de intervalos para todas las operaciones dentro de una sola evaluación. En la parte superior (raíz) del árbol, hay una única operación denominada Evaluación con la ruta de acceso "0". La hora de inicio de esta evaluación corresponde al inicio de esta evaluación en su conjunto. La hora de finalización de esta evaluación muestra cuándo finalizó toda la evaluación. Esta operación de nivel superior tiene una duración exclusiva de 0, ya que su único propósito es actuar como raíz del árbol.

Otras operaciones se bifurcan desde la raíz. Por ejemplo, una operación podría tener "0/1/5" como ruta de acceso. Esta ruta de acceso se entendería como:

  • 0: raíz del árbol
  • 1: elemento primario de la operación actual
  • 5: índice de la operación actual

La operación "0/1/5" podría tener un nodo secundario, en cuyo caso, la ruta de acceso tiene el formato "0/1/5/8", con 8 que representa el índice del elemento secundario.

Identificador de grupo

La combinación de dos (o más) operaciones no se producirá si conduce a una pérdida de detalles. La agrupación está diseñada para aproximarse a los "comandos" ejecutados durante la evaluación. En la vista detallada, varias operaciones comparten un identificador de grupo, correspondiente a los grupos agregados en la vista Resumen.

Al igual que con la mayoría de las columnas, el identificador de grupo solo es relevante dentro de una evaluación específica, según se filtra por la columna Id.

Esquema de particiones de privacidad de datos

Identificador

Igual que el identificador de los demás resultados de diagnóstico de consulta. La parte entera representa un identificador de actividad único, mientras que la parte fraccionera representa una evaluación única.

Partition Key

Corresponde a la consulta o paso que se usa como partición de firewall.

Grupo de firewall

Categorización que explica por qué esta partición debe evaluarse por separado, incluidos los detalles sobre el nivel de privacidad de la partición.

Recursos a los que se ha accedido

Lista de rutas de acceso de recursos para todos los recursos a los que accede esta partición y, en general, identifica de forma única un origen de datos.

Entradas de partición

Lista de claves de partición de las que depende la partición actual (esta lista podría usarse para crear un gráfico).

Expression

Expresión que se evalúa sobre el paso o la consulta de la partición. En varios casos, coincide con la consulta o el paso.

Hora de inicio

Hora a la que se inició la evaluación para esta partición.

Hora de finalización

Hora a la que finalizó la evaluación de esta partición.

Duration

Valor derivado de la hora de finalización menos la hora de inicio.

Duración exclusiva

Si se supone que las particiones se ejecutan en un único subproceso, la duración exclusiva es la duración "real" que se puede atribuir a esta partición.

% de duración exclusiva

Duración exclusiva como porcentaje.

Diagnóstico

Esta columna solo aparece cuando también se capturan los diagnósticos de consulta "Agregado" o "Detallado", lo que permite al usuario corresponder entre las dos salidas de diagnóstico.

Esquema de los contadores de rendimiento

Al ejecutar contadores de rendimiento, cada segundo Power Query toma una instantánea del uso de recursos. Esta instantánea no es útil para consultas muy rápidas, pero puede ser útil para las consultas que usan muchos más recursos.

% de tiempo de procesador

Porcentaje de tiempo empleado por los procesadores en la consulta. Este porcentaje puede llegar por encima del 100 % debido a varios procesadores.

Tiempo total del procesador

Duración total del tiempo de procesador empleado en la consulta.

Bytes de datos de E/S por segundo

Velocidad de rendimiento de los datos recibidos del origen de datos, expresados en bytes por segundo.

Commit (bytes)

Cantidad de memoria virtual reservada por la evaluación.

Conjunto de trabajo (bytes)

Cantidad de memoria reservada por la evaluación.

Lectura adicional

Cómo registrar diagnósticos en varios casos de uso

Más información sobre la lectura y visualización de los seguimientos grabados

Cómo entender qué operaciones de consulta se están plegando mediante diagnósticos de consultas