Conexión a Azure Blob Storage en Azure Purview
En este artículo se describe el proceso para registrar una cuenta de Azure Blob Storage en Azure Purview, incluidas instrucciones para autenticarse e interactuar con el origen de Azure Blob Storage.
Funcionalidades admitidas
| Extracción de metadatos | Examen completo | Examen incremental | Examen con ámbito | Clasificación | Directiva de acceso | Lineage |
|---|---|---|---|---|---|---|
| Sí | Sí | Sí | Sí | Sí | Sí | Limitado** |
** Se admite el linaje si el conjunto de datos se usa como origen o receptor en la actividad de copia de Data Factory
En el caso de los tipos de archivo como csv, tsv, psv y ssv, el esquema se extrae cuando se implementan las siguientes lógicas:
- Los valores de la primera fila no están vacíos.
- Los valores de la primera fila son únicos.
- Los valores de la primera fila no son una fecha ni un número
Prerrequisitos
Una cuenta de Azure con una suscripción activa. Cree una cuenta gratuita.
Un recurso de Purview activo.
Tendrá que ser administrador de orígenes de datos y lector de datos para poder registrar un origen y administrarlo en Purview Studio. Para obtener más información, consulte la página Permisos de Azure Purview.
Register
Esta sección le permitirá registrar la cuenta de Azure Blob Storage y configurar un mecanismo de autenticación adecuado para garantizar un examen correcto del origen de datos.
Pasos para registrarse
Es importante registrar el origen de datos en Azure Purview antes de configurar un examen para el origen de datos.
Vaya a Azure Portal, vaya a la página Cuentas de Purview y seleccione su cuenta de Purview.
Abra Purview Studio y vaya hasta Mapa de datos --> Orígenes.
Cree la Jerarquía de colecciones mediante el menú Colecciones y asigne permisos a las subcolecciones individuales, según sea necesario.
Vaya a la colección adecuada en el menú Orígenes y seleccione el icono Registrar para registrar un nuevo origen de datos de Azure Blob.
Seleccione el origen de datos de Azure Blob Storage en la lista y, a continuación, Continuar.
Asigne un Nombre adecuado al origen de datos, seleccione la suscripción de Azure correspondiente, el nombre de la cuenta de Azure Blob Storage existente y la colección, y seleccione Aplicar.
La cuenta de Azure Blob Storage aparecerá en la colección seleccionada.
Examinar
Autenticación para un examen
Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de Azure Blob Storage.
Se admiten las siguientes opciones:
Nota
Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.
Identidad administrada (recomendado) : En cuanto se crea la cuenta de Azure Purview, se crea automáticamente una identidad administrada por el sistema en el inquilino de Azure AD. Según el tipo de recurso, se requieren asignaciones de roles RBAC específicas para que la MSI de Azure Purview realice los exámenes.
Clave de cuenta: los secretos se pueden crear dentro de una instancia de Azure Key Vault para almacenar las credenciales con el fin de permitir el acceso de Azure Purview para examinar los orígenes de datos de forma segura mediante los secretos. Un secreto puede ser una clave de cuenta de almacenamiento, una contraseña de inicio de sesión SQL o una contraseña.
Nota
Si usa esta opción, debe implementar un recurso de Azure Key Vault en la suscripción y asignar el MSI de la cuenta de Azure Purview con el permiso de acceso necesario a los secretos dentro de Azure Key Vault.
Entidad de servicio: En este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.
Uso de la identidad administrada para examinar
Es importante conceder a la cuenta de Purview el permiso para examinar el origen de datos de Azure Blob. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.
Nota
Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.
Nota
Debe ser propietario de la suscripción para poder agregar una identidad administrada a un recurso de Azure.
En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Blob) que desea permitir que el catálogo examine.
Seleccione Control de acceso (IAM) en el panel de navegación izquierdo y, después, seleccione + Agregar --> Adición de la asignación de roles.
Establezca el Rol en el Lector de datos de blobs de almacenamiento y escriba el nombre de la cuenta de Azure Purview en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.
Vaya a la cuenta de almacenamiento de Azure Blob en Azure Portal.
Vaya a Seguridad y redes > Redes
Seleccione Redes seleccionadas en Permitir acceso desde.
En la sección Excepciones, seleccione Permitir que los servicios de Microsoft de confianza accedan a esta cuenta de almacenamiento y haga clic en Guardar.
.
Nota
Para obtener más información, consulte los pasos que se detallan en Autorización del acceso a blobs y colas con Azure Active Directory.
Uso de la clave de cuenta para el examen
Cuando el método de autenticación seleccionado es Clave de cuenta, debe obtener la clave de acceso y almacenarla en el almacén de claves:
Vaya a la cuenta de Azure Blob Storage.
Seleccione Seguridad y redes > Claves de acceso.
Copie la clave y guárdela por separado para usarla en los pasos siguientes.
Vaya a almacén de claves.
Seleccione Configuración > Secretos y, después, + Generar/Importar
Escriba el Nombre y Valor como clave de la cuenta de almacenamiento.
Seleccione Crear para completar la acción.
Si el almacén de claves no está conectado todavía a Purview, necesitará crear una conexión del almacén de claves.
Por último, cree una nueva credencial mediante la clave para configurar el examen.
Uso de la entidad de servicio para examinar
Creación de una nueva entidad de servicio
Si tiene que crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como el administrador de aplicaciones, pueden realizar esta operación.
Obtención del identificador de aplicación de la entidad de servicio
Copie el Id. de aplicación (cliente) presente en la Información general de la Entidad de servicio ya creada.
Concesión de acceso a la entidad de servicio a la cuenta de Azure Blob
Es importante conceder a la entidad de servicio el permiso para examinar el origen de datos de Azure Blob. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.
Nota
Debe ser propietario de la suscripción para poder agregar una entidad de servicio a un recurso de Azure.
En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Blob Storage) que desea permitir que el catálogo examine.
Seleccione Control de acceso (IAM) en el panel de navegación izquierdo y, después, seleccione + Agregar --> Adición de la asignación de roles.
Establezca el Rol en Lector de datos de Storage Blob y especifique la entidad de servicio en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.
Creación del examen
Abra la cuenta de Purview y seleccione Apertura de Purview Studio.
Vaya a Mapa de datos --> Orígenes para ver la jerarquía de colecciones.
Seleccione el icono Nuevo examen en el origen de datos de Azure Blob registrado anteriormente.
Si se utiliza una identidad administrada
Proporcione un Nombre para el examen, seleccione el MSI de Purview en Credencial, elija la colección adecuada para el examen y seleccione Probar conexión. Tras una conexión correcta, haga clic en Continuar.
Si usa una clave de cuenta
Proporcione un Nombre para el examen, elija la recopilación adecuada para el examen, seleccione Método de autenticación como Clave de cuenta y elija Crear.
Si se utiliza una entidad de servicio
Proporcione un Nombre para el examen, elija la colección adecuada para el examen y seleccione + Nuevo en Credencial.
Seleccione la conexión del almacén de claves adecuada y el Nombre de secreto que se usó al crear la Entidad de servicio. El identificador de la entidad de servicio es el Id. de aplicación (cliente) que se copió anteriormente.
Seleccione Test connection (Probar conexión). Tras una conexión correcta, haga clic en Continuar.
Ámbito y ejecución del examen
Para limitar el ámbito del examen a carpetas y subcarpetas específicas, puede elegir los elementos adecuados en la lista.
A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los valores predeterminados del sistema, los conjuntos de reglas personalizadas existentes o la creación de un conjunto de reglas en línea.
Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.
Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.
Elija el desencadenador del examen. Puede configurar una programación o ejecutar el examen una vez.
Revise el examen y seleccione Save and run (Guardar y ejecutar).
Visualización del examen
Vaya al origen de datos en la Colección y seleccione Ver detalles para comprobar el estado del examen.
Los detalles del examen indican el progreso del examen en el Estado de la última ejecución y el número de recursos examinados y clasificados.
El Estado de la última ejecución se actualizará a En curso y, posteriormente, a Completado una vez que todo el examen se haya ejecutado correctamente.
Administración del examen
Los exámenes se pueden administrar o ejecutar de nuevo al finalizar.
Seleccione el Nombre del examen para administrar el examen.
Puede volver a ejecutar el examen, editarlo o eliminarlo.
Puede volver a ejecutar un examen incremental o un examen completo.
Pasos siguientes
Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.