Conexión a Azure Data Lake Gen2 en Azure Purview
En este artículo se describe el proceso para registrar un origen de datos de Azure Data Lake Storage Gen2 en Azure Purview, incluidas instrucciones para autenticarse e interactuar con el origen de Azure Data Lake Storage Gen2.
Funcionalidades admitidas
| Extracción de metadatos | Examen completo | Examen incremental | Examen con ámbito | Clasificación | Directiva de acceso | Lineage |
|---|---|---|---|---|---|---|
| Sí | Sí | Sí | Sí | Sí | Sí | Limitado** |
** Se admite el linaje si el conjunto de datos se usa como origen o receptor en la actividad de copia de Data Factory
Prerrequisitos
Una cuenta de Azure con una suscripción activa. Cree una cuenta gratuita.
Un recurso de Purview activo.
Tendrá que ser administrador de orígenes de datos y lector de datos para poder registrar un origen y administrarlo en Purview Studio. Para obtener más información, consulte la página Permisos de Azure Purview.
Register
Esta sección le permitirá registrar el origen de datos de ADLS Gen2 y configurar un mecanismo de autenticación adecuado para garantizar un examen correcto del origen de datos.
Pasos para registrarse
Es importante registrar el origen de datos en Azure Purview antes de configurar un examen para el origen de datos.
Vaya a Azure Portal, vaya a la página Cuentas de Purview y haga clic en su cuenta de Purview.
Abra Purview Studio y vaya hasta Mapa de datos --> Orígenes.
Cree la Jerarquía de colecciones mediante el menú Colecciones y asigne permisos a las subcolecciones individuales, según sea necesario.
Vaya a la colección adecuada en el menú Orígenes y haga clic en el icono Registrar para registrar un nuevo origen de datos de ADLS Gen2.
Seleccione el origen de datos Azure Data Lake Storage Gen2 y haga clic en Continuar.
Asigne un Nombre adecuado al origen de datos, seleccione la suscripción de Azure correspondiente, el nombre de la cuenta de Data Lake Store existente y la colección, y haga clic en Aplicar.
La cuenta de almacenamiento de ADLS Gen2 aparecerá en la colección seleccionada.
Examinar
Requisitos previos para el examen
Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de almacenamiento de ADLS Gen2. Se admiten las siguientes opciones:
Nota
Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.
Identidad administrada (recomendado) : En cuanto se crea la cuenta de Azure Purview, se crea automáticamente una identidad administrada por el sistema en el inquilino de Azure AD. Según el tipo de recurso, se requieren asignaciones de roles RBAC específicas para que la MSI de Azure Purview realice los exámenes.
Clave de cuenta: los secretos se pueden crear dentro de una instancia de Azure Key Vault para almacenar las credenciales con el fin de permitir el acceso de Azure Purview para examinar los orígenes de datos de forma segura mediante los secretos. Un secreto puede ser una clave de cuenta de almacenamiento, una contraseña de inicio de sesión SQL o una contraseña.
Nota
Si usa esta opción, debe implementar un recurso de Azure Key Vault en la suscripción y asignar el MSI de la cuenta de Azure Purview con el permiso de acceso necesario a los secretos dentro de Azure Key Vault.
Entidad de servicio: En este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.
Autenticación para un examen
Uso de la identidad administrada para examinar
Es importante conceder a la cuenta de Purview el permiso para examinar el origen de datos de ADLS Gen2. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.
Nota
Debe ser propietario de la suscripción para poder agregar una identidad administrada a un recurso de Azure.
En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen2) que quiere permitir que examine el catálogo.
Haga clic en Control de acceso (IAM) en el panel de navegación izquierdo y, después, haga clic en + Agregar --> Agregar asignación de roles.
Establezca el Rol en el Lector de datos de blobs de almacenamiento y escriba el nombre de la cuenta de Azure Purview en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.
Nota
Para obtener más información, consulte los pasos que se detallan en Autorización del acceso a blobs y colas con Azure Active Directory.
Nota
Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.
Vaya a la cuenta de almacenamiento de ADLS Gen2 en Azure Portal.
Vaya a Seguridad y redes > Redes
Seleccione Redes seleccionadas en Permitir acceso desde.
En la sección Excepciones, seleccione Permitir que los servicios de Microsoft de confianza accedan a esta cuenta de almacenamiento y haga clic en Guardar.
.
Uso de la clave de cuenta para el examen
Cuando el método de autenticación seleccionado es Clave de cuenta, debe obtener la clave de acceso y almacenarla en el almacén de claves:
Vaya a la cuenta de almacenamiento de ADLS Gen2.
Seleccione Seguridad y redes > Claves de acceso.
Copie la clave y guárdela por separado para usarla en los pasos siguientes.
Vaya a almacén de claves.
Seleccione Configuración > Secretos y haga clic en + Generar o importar
.Escriba el Nombre y Valor como clave de la cuenta de almacenamiento.
Seleccione Crear para completar la acción.
Si el almacén de claves no está conectado todavía a Purview, necesitará crear una conexión del almacén de claves.
Por último, cree una nueva credencial mediante la clave para configurar el examen.
Uso de la entidad de servicio para examinar
Creación de una nueva entidad de servicio
Si tiene que crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como el administrador de aplicaciones, pueden realizar esta operación.
Obtención del identificador de aplicación de la entidad de servicio
Copie el Id. de aplicación (cliente) presente en la Información general de la Entidad de servicio ya creada.
Concesión de acceso a la entidad de servicio a la cuenta de ADLS Gen2
Es importante conceder a la entidad de servicio el permiso para examinar el origen de datos de ADLS Gen1. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.
Nota
Debe ser propietario de la suscripción para poder agregar una entidad de servicio a un recurso de Azure.
En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Data Lake Storage Gen2) que quiere permitir que examine el catálogo.
Haga clic en Control de acceso (IAM) en el panel de navegación izquierdo y, después, haga clic en + Agregar --> Agregar asignación de roles.
Establezca el Rol en Lector de datos de Storage Blob y especifique la entidad de servicio en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.
Creación del examen
Abra la cuenta de Purview, haga clic en Apertura de Purview Studio.
Vaya a Mapa de datos --> Orígenes para ver la jerarquía de colecciones.
Haga clic en el icono Nuevo examen en el origen de datos de ADLS Gen2 registrado anteriormente.
Si se utiliza una identidad administrada
Proporcione un Nombre para el examen, seleccione Purview MSI en Credencial, elija la colección adecuada para el examen y haga clic en Probar conexión. Tras una conexión correcta, haga clic en Continuar.
Si usa una clave de cuenta
Proporcione un Nombre para el examen, elija la colección adecuada para el examen y seleccione Método de autenticación como Clave de cuenta.
Si se utiliza una entidad de servicio
Proporcione un Nombre para el examen, elija la colección adecuada para el examen y haga clic en + Nuevo en Credencial.
Seleccione la conexión del almacén de claves adecuada y el Nombre de secreto que se usó al crear la Entidad de servicio. El Id. de la entidad de servicio es el Id. de aplicación (cliente) que se copió anteriormente.
Haga clic en Probar la conexión. Tras una conexión correcta, haga clic en Continuar.
Ámbito y ejecución del examen
Elija los elementos adecuados de la lista para limitar el ámbito del examen a carpetas y subcarpetas específicas.
A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los valores predeterminados del sistema, los conjuntos de reglas personalizadas existentes o la creación de un conjunto de reglas en línea.
Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.
Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.
Elija el desencadenador del examen. Puede configurar una programación o ejecutar el examen una vez.
Revise el examen y seleccione Save and run (Guardar y ejecutar).
Visualización de los exámenes y las ejecuciones de exámenes
Para ver los exámenes existentes, haga lo siguiente:
Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.
Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.
Seleccione el examen que tiene los resultados que quiere ver.
En esta página se muestran todas las ejecuciones de exámenes anteriores, junto con el estado y las métricas de cada ejecución del examen. También mostrará si el análisis se ha programado o es manual, a cuántos recursos se han aplicado clasificaciones, cuántos recursos totales se han detectado, la hora de inicio y finalización del examen y la duración total del examen.
Administración de exámenes: editar, eliminar o cancelar
Para administrar o eliminar un examen, haga lo siguiente:
Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.
Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.
Seleccione el examen que desea administrar. Para editar el examen, puede seleccionar Edit scan (Editar examen).
Para cancelar un examen en curso, puede seleccionar Cancelar ejecución del examen.
Para eliminar el examen, seleccione Eliminar examen.
Nota
- Al eliminar el examen no se eliminan los recursos del catálogo creados a partir de examenes anteriores.
- El recurso no se volverá a actualizar con los cambios de esquema si ha cambiado la tabla de origen y se vuelve a examinar la tabla de origen después de editar la descripción en la pestaña de esquema de Purview.
Pasos siguientes
Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.