Conexión a Azure Data Lake Gen2 en Azure Purview

En este artículo se describe el proceso para registrar un origen de datos de Azure Data Lake Storage Gen2 en Azure Purview, incluidas instrucciones para autenticarse e interactuar con el origen de Azure Data Lake Storage Gen2.

Funcionalidades admitidas

Extracción de metadatos Examen completo Examen incremental Examen con ámbito Clasificación Directiva de acceso Lineage
Limitado**

** Se admite el linaje si el conjunto de datos se usa como origen o receptor en la actividad de copia de Data Factory

Prerrequisitos

Register

Esta sección le permitirá registrar el origen de datos de ADLS Gen2 y configurar un mecanismo de autenticación adecuado para garantizar un examen correcto del origen de datos.

Pasos para registrarse

Es importante registrar el origen de datos en Azure Purview antes de configurar un examen para el origen de datos.

  1. Vaya a Azure Portal, vaya a la página Cuentas de Purview y haga clic en su cuenta de Purview.

    Captura de pantalla que muestra la cuenta de Purview usada para registrar el origen de datos

  2. Abra Purview Studio y vaya hasta Mapa de datos --> Orígenes.

    Captura de pantalla que muestra el vínculo para abrir Purview Studio

    Captura de pantalla que navega al vínculo Orígenes en el Mapa de datos

  3. Cree la Jerarquía de colecciones mediante el menú Colecciones y asigne permisos a las subcolecciones individuales, según sea necesario.

    Captura de pantalla que muestra el menú de colecciones para crear la jerarquía de colecciones

  4. Vaya a la colección adecuada en el menú Orígenes y haga clic en el icono Registrar para registrar un nuevo origen de datos de ADLS Gen2.

    Captura de pantalla que muestra la colección usada para registrar el origen de datos

  5. Seleccione el origen de datos Azure Data Lake Storage Gen2 y haga clic en Continuar.

    Captura de pantalla que permite seleccionar el origen de datos

  6. Asigne un Nombre adecuado al origen de datos, seleccione la suscripción de Azure correspondiente, el nombre de la cuenta de Data Lake Store existente y la colección, y haga clic en Aplicar.

    Captura de pantalla que muestra los detalles que debe escribir para registrar el origen de datos

  7. La cuenta de almacenamiento de ADLS Gen2 aparecerá en la colección seleccionada.

    Captura de pantalla que muestra el origen de datos asignado a la colección para iniciar el examen

Examinar

Requisitos previos para el examen

Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de almacenamiento de ADLS Gen2. Se admiten las siguientes opciones:

Nota

Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.

  • Identidad administrada (recomendado) : En cuanto se crea la cuenta de Azure Purview, se crea automáticamente una identidad administrada por el sistema en el inquilino de Azure AD. Según el tipo de recurso, se requieren asignaciones de roles RBAC específicas para que la MSI de Azure Purview realice los exámenes.

  • Clave de cuenta: los secretos se pueden crear dentro de una instancia de Azure Key Vault para almacenar las credenciales con el fin de permitir el acceso de Azure Purview para examinar los orígenes de datos de forma segura mediante los secretos. Un secreto puede ser una clave de cuenta de almacenamiento, una contraseña de inicio de sesión SQL o una contraseña.

    Nota

    Si usa esta opción, debe implementar un recurso de Azure Key Vault en la suscripción y asignar el MSI de la cuenta de Azure Purview con el permiso de acceso necesario a los secretos dentro de Azure Key Vault.

  • Entidad de servicio: En este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.

Autenticación para un examen

Uso de la identidad administrada para examinar

Es importante conceder a la cuenta de Purview el permiso para examinar el origen de datos de ADLS Gen2. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.

Nota

Debe ser propietario de la suscripción para poder agregar una identidad administrada a un recurso de Azure.

  1. En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen2) que quiere permitir que examine el catálogo.

    Captura de pantalla que muestra la cuenta de almacenamiento

  2. Haga clic en Control de acceso (IAM) en el panel de navegación izquierdo y, después, haga clic en + Agregar --> Agregar asignación de roles.

    Captura de pantalla que muestra el control de acceso para la cuenta de almacenamiento

  3. Establezca el Rol en el Lector de datos de blobs de almacenamiento y escriba el nombre de la cuenta de Azure Purview en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.

    Captura de pantalla que muestra los detalles para asignar permisos para la cuenta de Purview

Nota

Para obtener más información, consulte los pasos que se detallan en Autorización del acceso a blobs y colas con Azure Active Directory.

Nota

Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.

  1. Vaya a la cuenta de almacenamiento de ADLS Gen2 en Azure Portal.

  2. Vaya a Seguridad y redes > Redes

    Captura de pantalla que muestra los detalles para proporcionar acceso al firewall

  3. Seleccione Redes seleccionadas en Permitir acceso desde.

    Captura de pantalla que muestra los detalles para permitir el acceso a redes seleccionadas

  4. En la sección Excepciones, seleccione Permitir que los servicios de Microsoft de confianza accedan a esta cuenta de almacenamiento y haga clic en Guardar.

    Captura de pantalla que muestra las excepciones para permitir que los servicios de Microsoft de confianza accedan a la cuenta de almacenamiento .

Uso de la clave de cuenta para el examen

Cuando el método de autenticación seleccionado es Clave de cuenta, debe obtener la clave de acceso y almacenarla en el almacén de claves:

  1. Vaya a la cuenta de almacenamiento de ADLS Gen2.

  2. Seleccione Seguridad y redes > Claves de acceso.

    Captura de pantalla que muestra las claves de acceso de la cuenta de almacenamiento

  3. Copie la clave y guárdela por separado para usarla en los pasos siguientes.

    Captura de pantalla que muestra las claves de acceso que se deben copiar

  4. Vaya a almacén de claves.

    Captura de pantalla que muestra el almacén de claves

  5. Seleccione Configuración > Secretos y haga clic en + Generar o importar Captura de pantalla que muestra la opción del almacén de claves para generar un secreto .

  6. Escriba el Nombre y Valor como clave de la cuenta de almacenamiento.

    Captura de pantalla que muestra la opción del almacén de claves para especificar los valores del secreto

  7. Seleccione Crear para completar la acción.

    Captura de pantalla que muestra la opción del almacén de claves para crear un secreto

  8. Si el almacén de claves no está conectado todavía a Purview, necesitará crear una conexión del almacén de claves.

  9. Por último, cree una nueva credencial mediante la clave para configurar el examen.

Uso de la entidad de servicio para examinar

Creación de una nueva entidad de servicio

Si tiene que crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como el administrador de aplicaciones, pueden realizar esta operación.

Obtención del identificador de aplicación de la entidad de servicio
  1. Copie el Id. de aplicación (cliente) presente en la Información general de la Entidad de servicio ya creada.

    Captura de pantalla que muestra el identificador de aplicación (cliente) de la entidad de servicio

Concesión de acceso a la entidad de servicio a la cuenta de ADLS Gen2

Es importante conceder a la entidad de servicio el permiso para examinar el origen de datos de ADLS Gen1. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.

Nota

Debe ser propietario de la suscripción para poder agregar una entidad de servicio a un recurso de Azure.

  1. En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen2) que quiere permitir que examine el catálogo.

    Captura de pantalla que muestra la cuenta de almacenamiento

  2. Haga clic en Control de acceso (IAM) en el panel de navegación izquierdo y, después, haga clic en + Agregar --> Agregar asignación de roles.

    Captura de pantalla que muestra el control de acceso para la cuenta de almacenamiento

  3. Establezca el Rol en Lector de datos de Storage Blob y especifique la entidad de servicio en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.

    Captura de pantalla que muestra los detalles para proporcionar permisos de cuenta de almacenamiento en la entidad de servicio

Creación del examen

  1. Abra la cuenta de Purview, haga clic en Apertura de Purview Studio.

  2. Vaya a Mapa de datos --> Orígenes para ver la jerarquía de colecciones.

  3. Haga clic en el icono Nuevo examen en el origen de datos de ADLS Gen2 registrado anteriormente.

    Captura de pantalla que muestra la pantalla para crear un nuevo examen

Si se utiliza una identidad administrada

  1. Proporcione un Nombre para el examen, seleccione Purview MSI en Credencial, elija la colección adecuada para el examen y haga clic en Probar conexión. Tras una conexión correcta, haga clic en Continuar.

    Captura de pantalla que muestra la opción de identidad administrada para ejecutar el examen

Si usa una clave de cuenta

  1. Proporcione un Nombre para el examen, elija la colección adecuada para el examen y seleccione Método de autenticación como Clave de cuenta.

    Captura de pantalla que muestra la opción Clave de cuenta para el examen

Si se utiliza una entidad de servicio

  1. Proporcione un Nombre para el examen, elija la colección adecuada para el examen y haga clic en + Nuevo en Credencial.

    Captura de pantalla que muestra la opción para que la entidad de servicio habilite el examen

  2. Seleccione la conexión del almacén de claves adecuada y el Nombre de secreto que se usó al crear la Entidad de servicio. El Id. de la entidad de servicio es el Id. de aplicación (cliente) que se copió anteriormente.

    Captura de pantalla que muestra la opción de entidad de servicio

  3. Haga clic en Probar la conexión. Tras una conexión correcta, haga clic en Continuar.

Ámbito y ejecución del examen

  1. Elija los elementos adecuados de la lista para limitar el ámbito del examen a carpetas y subcarpetas específicas.

    Ámbito del examen

  2. A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los valores predeterminados del sistema, los conjuntos de reglas personalizadas existentes o la creación de un conjunto de reglas en línea.

    Conjunto de reglas de examen

  3. Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.

    Tipos de archivo del conjunto de reglas de examen

  4. Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.

    Reglas de clasificación del conjunto de reglas de examen

    Selección del conjunto de reglas de examen

  5. Elija el desencadenador del examen. Puede configurar una programación o ejecutar el examen una vez.

    desencadenador del examen

  6. Revise el examen y seleccione Save and run (Guardar y ejecutar).

    revisión del examen

Visualización de los exámenes y las ejecuciones de exámenes

Para ver los exámenes existentes, haga lo siguiente:

  1. Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.

  2. Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.

  3. Seleccione el examen que tiene los resultados que quiere ver.

  4. En esta página se muestran todas las ejecuciones de exámenes anteriores, junto con el estado y las métricas de cada ejecución del examen. También mostrará si el análisis se ha programado o es manual, a cuántos recursos se han aplicado clasificaciones, cuántos recursos totales se han detectado, la hora de inicio y finalización del examen y la duración total del examen.

Administración de exámenes: editar, eliminar o cancelar

Para administrar o eliminar un examen, haga lo siguiente:

  1. Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.

  2. Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.

  3. Seleccione el examen que desea administrar. Para editar el examen, puede seleccionar Edit scan (Editar examen).

  4. Para cancelar un examen en curso, puede seleccionar Cancelar ejecución del examen.

  5. Para eliminar el examen, seleccione Eliminar examen.

Nota

  • Al eliminar el examen no se eliminan los recursos del catálogo creados a partir de examenes anteriores.
  • El recurso no se volverá a actualizar con los cambios de esquema si ha cambiado la tabla de origen y se vuelve a examinar la tabla de origen después de editar la descripción en la pestaña de esquema de Purview.

Pasos siguientes

Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.