Compartir vía


Acceso a los registros de diagnóstico de Azure Data Lake Analytics

Importante

Azure Data Lake Analytics retiró el 29 de febrero de 2024. Más información sobre este anuncio.

Para el análisis de datos, su organización puede usar Azure Synapse Analytics o Microsoft Fabric.

Los registros de diagnóstico le permiten recopilar seguimientos de auditoría de acceso a datos. Estos registros proporcionan información como:

  • Una lista de los usuarios que tienen acceso a los datos.
  • Frecuencia con la que se accede a los datos.
  • Cantidad de datos que se almacena en la cuenta.

Habilitación del registro

  1. Inicie sesión en Azure Portal.

  2. Abra su cuenta de Data Lake Analytics y seleccione Configuración de diagnóstico en la sección Supervisión. Después, seleccione + Agregar configuración de diagnóstico.

    Captura de pantalla que muestra la acción

  3. En Configuración de diagnóstico, escriba un nombre para esta configuración de registro y, a continuación, seleccione las opciones de registro.

    Captura de pantalla que muestra la configuración para activar los diagnósticos para recopilar registros de auditoría y solicitud

    • Puede optar por almacenar o procesar los datos de cuatro maneras diferentes.

      • Seleccione Archive to a storage account (Archivar en cuenta de almacenamiento) para almacenar los registros en una cuenta de almacenamiento de Azure. Utilice esta opción si desea archivar los datos. Si selecciona esta opción, debe proporcionar una cuenta de almacenamiento de Azure para guardar los registros.

      • Seleccione Stream en un centro de eventos para transmitir datos de registro a un Azure Event Hubs. Use esta opción si tiene una canalización de procesamiento de bajada que está analizando los registros entrantes en tiempo real. Si selecciona esta opción, debe proporcionar los detalles del Azure Event Hubs quiere usar.

      • Seleccione Enviar al área de trabajo de Log Analytics para enviar los datos al servicio Azure Monitor. Utilice esta opción si desea usar los registros de Azure Monitor para recopilar y analizar registros.

      • Seleccione Enviar a la solución de asociados si quiere usar nuestra integración de asociados. Para obtener más información, puede seguir este vínculo.

    • Indique si quiere obtener los registros de auditoría, los registros de solicitudes o ambos. Un registro de solicitudes captura todas las solicitudes de API. Un registro de auditoría registra todas las operaciones que esa solicitud de API desencadena.

    • Para Archivar en una cuenta de almacenamiento, especifique el número de días que se retendrán los datos.

    • Seleccione Guardar.

      Nota

      Debe seleccionar Archivar en una cuenta de almacenamiento, Transmitir a un centro de eventos, Enviar al área de trabajo de Log Analytics o Enviar a la solución de asociados antes de hacer clic en el botón Guardar.

Uso de la cuenta de Azure Storage que contiene los datos de registro

  1. Para mostrar los contenedores de blobs que contienen datos de registro, abra la cuenta Azure Storage que se usa en Data Lake Analytics para el registro y, a continuación, haga clic en Contenedores.

    • El contenedor insights-logs-audit contiene los registros de auditoría.
    • El contenedor insights-logs-requests contiene los registros de solicitudes.
  2. Dentro de los contenedores, los registros se almacenan con la siguiente estructura de archivo:

    resourceId=/
      SUBSCRIPTIONS/
        <<SUBSCRIPTION_ID>>/
          RESOURCEGROUPS/
            <<RESOURCE_GRP_NAME>>/
              PROVIDERS/
                MICROSOFT.DATALAKEANALYTICS/
                  ACCOUNTS/
                    <DATA_LAKE_ANALYTICS_NAME>>/
                      y=####/
                        m=##/
                          d=##/
                            h=##/
                              m=00/
                                PT1H.json
    

    Nota

    La hoja ## de la ruta de acceso contienen el año, mes, día y hora en que se creó el registro. Data Lake Analytics crea un archivo cada hora, por lo que m= siempre contiene un valor de 00.

    Por ejemplo, la ruta de acceso completa a un registro de auditoría sería:

    https://adllogs.blob.core.windows.net/insights-logs-audit/resourceId=/SUBSCRIPTIONS/<sub-id>/RESOURCEGROUPS/myresourcegroup/PROVIDERS/MICROSOFT.DATALAKEANALYTICS/ACCOUNTS/mydatalakeanalytics/y=2016/m=07/d=18/h=04/m=00/PT1H.json

    De forma similar, la ruta de acceso completa a un registro de solicitudes sería:

    https://adllogs.blob.core.windows.net/insights-logs-requests/resourceId=/SUBSCRIPTIONS/<sub-id>/RESOURCEGROUPS/myresourcegroup/PROVIDERS/MICROSOFT.DATALAKEANALYTICS/ACCOUNTS/mydatalakeanalytics/y=2016/m=07/d=18/h=14/m=00/PT1H.json

Procesamiento de los datos de registro

Azure Data Lake Analytics proporciona un ejemplo de cómo procesar y analizar los datos de registro. Puede encontrar el ejemplo en https://github.com/Azure/AzureDataLake/tree/master/Samples/AzureDiagnosticsSample.

Estructura de los registros

Los registros de auditoría y de solicitud tienen un formato JSON.

Request Logs

Este es un ejemplo de una entrada en el registro de solicitud con formato JSON. Cada blob tiene un objeto raíz llamado registros que contiene una matriz de objetos de registro.

{
"records":
  [
    . . . .
    ,
    {
         "time": "2016-07-07T21:02:53.456Z",
         "resourceId": "/SUBSCRIPTIONS/<subscription_id>/RESOURCEGROUPS/<resource_group_name>/PROVIDERS/MICROSOFT.DATALAKEANALYTICS/ACCOUNTS/<data_lake_analytics_account_name>",
         "category": "Requests",
         "operationName": "GetAggregatedJobHistory",
         "resultType": "200",
         "callerIpAddress": "::ffff:1.1.1.1",
         "correlationId": "4a11c709-05f5-417c-a98d-6e81b3e29c58",
         "identity": "1808bd5f-62af-45f4-89d8-03c5e81bac30",
         "properties": {
             "HttpMethod":"POST",
             "Path":"/JobAggregatedHistory",
             "RequestContentLength":122,
             "ClientRequestId":"3b7adbd9-3519-4f28-a61c-bd89506163b8",
             "StartTime":"2016-07-07T21:02:52.472Z",
             "EndTime":"2016-07-07T21:02:53.456Z"
             }
    }
    ,
    . . . .
  ]
}

Esquema de un registro de solicitud

Nombre Tipo Descripción
time String Marca de tiempo (en UTC) del registro.
resourceId String Identificador del recurso en el que tuvo lugar la operación
category String Categoría del registro. Por ejemplo, Requests.
operationName String Nombre de la operación que se registra. Por ejemplo, GetAggregatedJobHistory.
resultType String Estado de la operación. Por ejemplo, 200.
callerIpAddress String Dirección IP del cliente que realiza la solicitud.
correlationId String Identificador del registro. Este valor puede utilizarse para agrupar un conjunto de entradas de registro relacionadas.
identity Object Identidad que ha generado el registro.
properties JSON Consulte la siguiente sección (Esquema de propiedades de un registro de solicitud) para más información

Esquema de propiedades de un registro de solicitud

Nombre Tipo Descripción
HttpMethod String Método HTTP usado en la operación. Por ejemplo, GET.
Path String Ruta de acceso en la que se ha realizado la operación.
RequestContentLength int Longitud del contenido de la solicitud HTTP.
ClientRequestId String El identificador que distingue de manera exclusiva esta solicitud
StartTime String Hora a la que el servidor recibió la solicitud
EndTime String Hora a la que el servidor envió una respuesta

Registros de auditoría

Este es un ejemplo de una entrada en el registro de auditoría con formato JSON. Cada blob tiene un objeto raíz llamado registros que contiene una matriz de objetos de registro.

{
"records":
  [
    {
         "time": "2016-07-28T19:15:16.245Z",
         "resourceId": "/SUBSCRIPTIONS/<subscription_id>/RESOURCEGROUPS/<resource_group_name>/PROVIDERS/MICROSOFT.DATALAKEANALYTICS/ACCOUNTS/<data_lake_ANALYTICS_account_name>",
         "category": "Audit",
         "operationName": "JobSubmitted",
         "identity": "user@somewhere.com",
         "properties": {
             "JobId":"D74B928F-5194-4E6C-971F-C27026C290E6",
             "JobName": "New Job",
             "JobRuntimeName": "default",
             "SubmitTime": "7/28/2016 7:14:57 PM"
             }
    }
  ]
}

Esquema de un registro de auditoría

Nombre Tipo Descripción
time String Marca de tiempo (en UTC) del registro.
resourceId String Identificador del recurso en el que tuvo lugar la operación
category String Categoría del registro. Por ejemplo, Audit.
operationName String Nombre de la operación que se registra. Por ejemplo, JobSubmitted.
resultType String Un subestado para el estado del trabajo (operationName).
resultSignature String Detalles adicionales sobre el estado del trabajo (operationName).
identity String El usuario que solicitó la operación. Por ejemplo, susan@contoso.com.
properties JSON Consulte la siguiente sección (Esquema de propiedades de un registro de auditoría) para más información

Nota

resultType y resultSignature proporcionan información sobre el resultado de una operación y solo contienen un valor si se ha completado una operación. Por ejemplo, solo contienen un valor cuando operationName contiene un valor de JobStarted o JobEnded.

Esquema de propiedades de un registro de auditoría

Nombre Tipo Descripción
JobId String El identificador asignado al trabajo
JobName String El nombre que se proporcionó para el trabajo
JobRunTime String El tiempo de ejecución utilizado para procesar el trabajo
SubmitTime String La hora (en UTC) en la que se envió el trabajo
StartTime String La hora en la que el trabajo empezó a ejecutarse tras el envío (en UTC)
EndTime String La hora de finalización del trabajo
Paralelismo String El número de unidades de Data Lake Analytics solicitadas para este trabajo durante el envío

Nota

SubmitTime, StartTime, EndTime y Parallelism proporcionan información sobre una operación. Estas entradas solo contienen un valor si la operación se ha iniciado o completado. Por ejemplo, SubmitTime contiene un valor después de que operationName tenga el valor JobSubmitted.

Pasos siguientes