Conexión a Azure Blob Storage en Azure Purview

En este artículo se describe el proceso para registrar una cuenta de Azure Blob Storage en Azure Purview, incluidas instrucciones para autenticarse e interactuar con el origen de Azure Blob Storage.

Funcionalidades admitidas

Extracción de metadatos Examen completo Examen incremental Examen con ámbito Clasificación Directiva de acceso Lineage
Limitado**

** Se admite el linaje si el conjunto de datos se usa como origen o receptor en la actividad de copia de Data Factory

En el caso de los tipos de archivo como csv, tsv, psv y ssv, el esquema se extrae cuando se implementan las siguientes lógicas:

  • Los valores de la primera fila no están vacíos.
  • Los valores de la primera fila son únicos.
  • Los valores de la primera fila no son una fecha ni un número

Prerrequisitos

Register

Esta sección le permitirá registrar la cuenta de Azure Blob Storage y configurar un mecanismo de autenticación adecuado para garantizar un examen correcto del origen de datos.

Pasos para registrarse

Es importante registrar el origen de datos en Azure Purview antes de configurar un examen para el origen de datos.

  1. Vaya a Azure Portal, vaya a la página Cuentas de Purview y seleccione su cuenta de Purview.

    Captura de pantalla que muestra la cuenta de Purview usada para registrar el origen de datos

  2. Abra Purview Studio y vaya hasta Mapa de datos --> Orígenes.

    Captura de pantalla que muestra el vínculo para abrir Purview Studio

    Captura de pantalla que navega al vínculo Orígenes en el Mapa de datos

  3. Cree la Jerarquía de colecciones mediante el menú Colecciones y asigne permisos a las subcolecciones individuales, según sea necesario.

    Captura de pantalla que muestra el menú de colecciones para crear la jerarquía de colecciones

  4. Vaya a la colección adecuada en el menú Orígenes y seleccione el icono Registrar para registrar un nuevo origen de datos de Azure Blob.

    Captura de pantalla que muestra la colección usada para registrar el origen de datos

  5. Seleccione el origen de datos de Azure Blob Storage en la lista y, a continuación, Continuar.

    Captura de pantalla que permite seleccionar el origen de datos

  6. Asigne un Nombre adecuado al origen de datos, seleccione la suscripción de Azure correspondiente, el nombre de la cuenta de Azure Blob Storage existente y la colección, y seleccione Aplicar.

    Captura de pantalla que muestra los detalles que debe escribir para registrar el origen de datos

  7. La cuenta de Azure Blob Storage aparecerá en la colección seleccionada.

    Captura de pantalla que muestra el origen de datos asignado a la colección para iniciar el examen

Examinar

Autenticación para un examen

Para tener acceso para examinar el origen de datos, es necesario configurar un método de autenticación en la cuenta de Azure Blob Storage.

Se admiten las siguientes opciones:

Nota

Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.

  • Identidad administrada (recomendado) : En cuanto se crea la cuenta de Azure Purview, se crea automáticamente una identidad administrada por el sistema en el inquilino de Azure AD. Según el tipo de recurso, se requieren asignaciones de roles RBAC específicas para que la MSI de Azure Purview realice los exámenes.

  • Clave de cuenta: los secretos se pueden crear dentro de una instancia de Azure Key Vault para almacenar las credenciales con el fin de permitir el acceso de Azure Purview para examinar los orígenes de datos de forma segura mediante los secretos. Un secreto puede ser una clave de cuenta de almacenamiento, una contraseña de inicio de sesión SQL o una contraseña.

    Nota

    Si usa esta opción, debe implementar un recurso de Azure Key Vault en la suscripción y asignar el MSI de la cuenta de Azure Purview con el permiso de acceso necesario a los secretos dentro de Azure Key Vault.

  • Entidad de servicio: En este método, puede crear una nueva o usar una entidad de servicio existente en el inquilino de Azure Active Directory.

Uso de la identidad administrada para examinar

Es importante conceder a la cuenta de Purview el permiso para examinar el origen de datos de Azure Blob. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.

Nota

Si tiene el firewall habilitado para la cuenta de almacenamiento, debe usar el método de autenticación de Identidad administrada al configurar un examen.

Nota

Debe ser propietario de la suscripción para poder agregar una identidad administrada a un recurso de Azure.

  1. En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Blob) que desea permitir que el catálogo examine.

    Captura de pantalla que muestra la cuenta de almacenamiento

  2. Seleccione Control de acceso (IAM) en el panel de navegación izquierdo y, después, seleccione + Agregar --> Adición de la asignación de roles.

    Captura de pantalla que muestra el control de acceso para la cuenta de almacenamiento

  3. Establezca el Rol en el Lector de datos de blobs de almacenamiento y escriba el nombre de la cuenta de Azure Purview en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.

    Captura de pantalla que muestra los detalles para asignar permisos para la cuenta de Purview

  4. Vaya a la cuenta de almacenamiento de Azure Blob en Azure Portal.

  5. Vaya a Seguridad y redes > Redes

  6. Seleccione Redes seleccionadas en Permitir acceso desde.

  7. En la sección Excepciones, seleccione Permitir que los servicios de Microsoft de confianza accedan a esta cuenta de almacenamiento y haga clic en Guardar.

    Captura de pantalla que muestra las excepciones para permitir que los servicios de Microsoft de confianza accedan a la cuenta de almacenamiento .

Nota

Para obtener más información, consulte los pasos que se detallan en Autorización del acceso a blobs y colas con Azure Active Directory.

Uso de la clave de cuenta para el examen

Cuando el método de autenticación seleccionado es Clave de cuenta, debe obtener la clave de acceso y almacenarla en el almacén de claves:

  1. Vaya a la cuenta de Azure Blob Storage.

  2. Seleccione Seguridad y redes > Claves de acceso.

    Captura de pantalla que muestra las claves de acceso de la cuenta de almacenamiento

  3. Copie la clave y guárdela por separado para usarla en los pasos siguientes.

    Captura de pantalla que muestra las claves de acceso que se deben copiar

  4. Vaya a almacén de claves.

    Captura de pantalla que muestra el almacén de claves

  5. Seleccione Configuración > Secretos y, después, + Generar/Importar

    Captura de pantalla que muestra la opción del almacén de claves para generar un secreto

  6. Escriba el Nombre y Valor como clave de la cuenta de almacenamiento.

    Captura de pantalla que muestra la opción del almacén de claves para especificar los valores del secreto

  7. Seleccione Crear para completar la acción.

  8. Si el almacén de claves no está conectado todavía a Purview, necesitará crear una conexión del almacén de claves.

  9. Por último, cree una nueva credencial mediante la clave para configurar el examen.

Uso de la entidad de servicio para examinar

Creación de una nueva entidad de servicio

Si tiene que crear una nueva entidad de servicio, es necesario registrar una aplicación en el inquilino de Azure AD y proporcionar acceso a la entidad de servicio en los orígenes de datos. El administrador global de Azure AD u otros roles, como el administrador de aplicaciones, pueden realizar esta operación.

Obtención del identificador de aplicación de la entidad de servicio
  1. Copie el Id. de aplicación (cliente) presente en la Información general de la Entidad de servicio ya creada.

    Captura de pantalla que muestra el identificador de aplicación (cliente) de la entidad de servicio

Concesión de acceso a la entidad de servicio a la cuenta de Azure Blob

Es importante conceder a la entidad de servicio el permiso para examinar el origen de datos de Azure Blob. Puede Agregar la MSI del catálogo en el nivel de suscripción, grupo de recursos o recurso, en función de para qué desea que tenga permisos de examen.

Nota

Debe ser propietario de la suscripción para poder agregar una entidad de servicio a un recurso de Azure.

  1. En Azure Portal, busque la suscripción, el grupo de recursos o el recurso (por ejemplo, una cuenta de almacenamiento de Azure Blob Storage) que desea permitir que el catálogo examine.

    Captura de pantalla que muestra la cuenta de almacenamiento

  2. Seleccione Control de acceso (IAM) en el panel de navegación izquierdo y, después, seleccione + Agregar --> Adición de la asignación de roles.

    Captura de pantalla que muestra el control de acceso para la cuenta de almacenamiento

  3. Establezca el Rol en Lector de datos de Storage Blob y especifique la entidad de servicio en el cuadro de entrada Seleccionar. A continuación, seleccione Save (Guardar) para dar esta asignación de rol a su cuenta de Purview.

    Captura de pantalla que muestra los detalles para proporcionar permisos de cuenta de almacenamiento en la entidad de servicio

Creación del examen

  1. Abra la cuenta de Purview y seleccione Apertura de Purview Studio.

  2. Vaya a Mapa de datos --> Orígenes para ver la jerarquía de colecciones.

  3. Seleccione el icono Nuevo examen en el origen de datos de Azure Blob registrado anteriormente.

    Captura de pantalla que muestra la pantalla para crear un nuevo examen

Si se utiliza una identidad administrada

Proporcione un Nombre para el examen, seleccione el MSI de Purview en Credencial, elija la colección adecuada para el examen y seleccione Probar conexión. Tras una conexión correcta, haga clic en Continuar.

Captura de pantalla que muestra la opción de identidad administrada para ejecutar el examen

Si usa una clave de cuenta

Proporcione un Nombre para el examen, elija la recopilación adecuada para el examen, seleccione Método de autenticación como Clave de cuenta y elija Crear.

Captura de pantalla que muestra la opción Clave de cuenta para el examen

Si se utiliza una entidad de servicio

  1. Proporcione un Nombre para el examen, elija la colección adecuada para el examen y seleccione + Nuevo en Credencial.

    Captura de pantalla que muestra la opción para que la entidad de servicio habilite el examen

  2. Seleccione la conexión del almacén de claves adecuada y el Nombre de secreto que se usó al crear la Entidad de servicio. El identificador de la entidad de servicio es el Id. de aplicación (cliente) que se copió anteriormente.

    Captura de pantalla que muestra la opción de entidad de servicio

  3. Seleccione Test connection (Probar conexión). Tras una conexión correcta, haga clic en Continuar.

Ámbito y ejecución del examen

  1. Para limitar el ámbito del examen a carpetas y subcarpetas específicas, puede elegir los elementos adecuados en la lista.

    Ámbito del examen

  2. A continuación, seleccione un conjunto de reglas de examen. Puede elegir entre los valores predeterminados del sistema, los conjuntos de reglas personalizadas existentes o la creación de un conjunto de reglas en línea.

    Conjunto de reglas de examen

  3. Si crea un nuevo conjunto de reglas de examen, seleccione los tipos de archivo que se incluirán en la regla de examen.

    Tipos de archivo del conjunto de reglas de examen

  4. Puede seleccionar las reglas de clasificación que se incluirán en la regla de examen.

    Reglas de clasificación del conjunto de reglas de examen

    Selección del conjunto de reglas de examen

  5. Elija el desencadenador del examen. Puede configurar una programación o ejecutar el examen una vez.

    desencadenador del examen

  6. Revise el examen y seleccione Save and run (Guardar y ejecutar).

    revisión del examen

Visualización del examen

  1. Vaya al origen de datos en la Colección y seleccione Ver detalles para comprobar el estado del examen.

    visualización del examen

  2. Los detalles del examen indican el progreso del examen en el Estado de la última ejecución y el número de recursos examinados y clasificados.

    Ver detalles del examen

  3. El Estado de la última ejecución se actualizará a En curso y, posteriormente, a Completado una vez que todo el examen se haya ejecutado correctamente.

    visualización del examen en curso

    visualización del examen completado

Administración del examen

Los exámenes se pueden administrar o ejecutar de nuevo al finalizar.

  1. Seleccione el Nombre del examen para administrar el examen.

    administración del examen

  2. Puede volver a ejecutar el examen, editarlo o eliminarlo.

    administración de las opciones del examen

  3. Puede volver a ejecutar un examen incremental o un examen completo.

    examen completo o incremental

Pasos siguientes

Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.