Conexión y administración de áreas de trabajo de Azure Synapse Analytics en Azure Purview

En este artículo se describe cómo registrar áreas de trabajo Azure Synapse Analytics y cómo autenticarse e interactuar con áreas de trabajo de Azure Synapse Analytics en Azure Purview. Para obtener más información sobre Azure Purview, consulte el artículo de introducción.

Funcionalidades admitidas

Extracción de metadatos Examen completo Examen incremental Examen con ámbito Clasificación Directiva de acceso Lineage
No Sí: canalizaciones de Synapse

Prerrequisitos

Register

En esta sección se describe cómo registrar áreas de trabajo de Azure Synapse Analytics en Azure Purview mediante Purview Studio.

Autenticación para registro

Solo los usuarios con al menos un rol de Lector en el área de trabajo de Azure Synapse que también sean administradores de orígenes de datos en Azure Purview pueden realizar este paso.

Pasos para registrarse

  1. Vaya a la cuenta de Azure Purview.

  2. En el panel izquierdo, seleccione Dispositivos.

  3. Seleccione Registrar.

  4. En Registrar orígenes, seleccione Azure Synapse Analytics (varios) .

  5. Seleccione Continuar.

    Captura de pantalla de una selección de orígenes en Azure Purview, incluidos Azure Synapse Analytics.

  6. En la página Registrar orígenes (Azure Synapse Analytics) , haga lo siguiente:

    a. Escriba un nombre con el que se muestre el origen de datos en el catálogo.
    b. También puede seleccionar una suscripción por la que filtrar.
    c. En la lista desplegable Nombre del área de trabajo, seleccione el área de trabajo con la que está trabajando.
    d. En las listas desplegables de puntos de conexión, los puntos de conexión SQL se rellenan automáticamente en función de la selección del área de trabajo.
    e. En la lista desplegable Seleccionar una colección, elija la colección con la que está trabajando o, opcionalmente, cree una nueva.
    f. Seleccione Registrar para registrar el origen de datos.

    Captura de pantalla de la página "Registrar orígenes (Azure Synapse Analytics)" para especificar detalles sobre el Azure Synapse origen.

Examinar

Siga los pasos que se indican a continuación para áreas de trabajo de Azure Synapse Analytics para identificar automáticamente los recursos y clasificar los datos. Para obtener más información sobre el examen en general, consulte la introducción a los exámenes y la ingesta.

Primero deberá configurar la autenticación para enumerar los recursos dedicados o sin servidor. Esto permitirá a Purview enumerar los recursos de área de trabajo y realizar exámenes dentro de ámbito.

Posteriormente, deberá aplicar permisos para examinar el contenido del área de trabajo.

Autenticación para enumerar recursos de base de datos SQL dedicados

  1. En Azure Portal, vaya al recurso de área de trabajo de Azure Synapse.

  2. En el panel izquierdo, seleccione  Control de acceso (IAM) .

    Nota

    Debe ser propietario o administrador de acceso de usuarios para agregar un rol al grupo de recursos.

  3. Seleccione el botón Agregar.

  4. Establezca el rol Lector y escriba el nombre de la cuenta de Azure Purview, que representa su identidad de servicio administrada (MSI).

  5. Haga clic en Guardar para finalizar la asignación del rol.

Nota

Si planea registrar y examinar varias áreas de trabajo de Azure Synapse en su cuenta de Azure Purview, también puede asignar el rol desde un nivel superior, como un grupo de recursos o una suscripción.

Autenticación para enumerar recursos de base de datos SQL sin servidor

Hay tres lugares en los que deberá establecer la autenticación para permitir que Purview enumere los recursos de base de datos SQL sin servidor: el área de trabajo de Synapse, el almacenamiento asociado y las bases de datos sin servidor. Los pasos siguientes establecerán permisos para los tres.

  1. En Azure Portal, vaya al recurso de área de trabajo de Azure Synapse.

  2. En el panel izquierdo, seleccione  Control de acceso (IAM) .

    Nota

    Debe ser propietario o administrador de acceso de usuarios para agregar un rol al grupo de recursos.

  3. Seleccione el botón Agregar.

  4. Establezca el rol Lector y escriba el nombre de la cuenta de Azure Purview, que representa su identidad de servicio administrada (MSI).

  5. Haga clic en Guardar para finalizar la asignación del rol.

  6. En Azure Portal, vaya al grupo de recursos o a la suscripción donde se encuentre el área de trabajo de Azure Synapse.

  7. En el panel izquierdo, seleccione  Control de acceso (IAM) .

    Nota

    Debe ser propietario o administrador de acceso de usuarios para agregar un rol a los campos Grupo de recursos o Suscripción.

  8. Seleccione el botón Agregar.

  9. Establezca el rol Lector de datos de Storage Blob y escriba el nombre de la cuenta de Azure Purview (que representa su MSI) en el cuadro Seleccionar.

  10. Haga clic en Guardar para finalizar la asignación del rol.

  11. Vaya al área de trabajo de Azure Synapse y abra el Synapse Studio.

  12. Seleccione la pestaña Datos del menú de la izquierda.

  13. Seleccione los puntos suspensivos ( ... ) junto a una de las bases de datos y, a continuación, inicie un nuevo SQL script.

  14. Agregue el MSI de la cuenta de Azure Purview (representado mediante el nombre de la cuenta) en las bases de datos SQL sin servidor ejecutando el siguiente comando en el script de SQL:

    CREATE LOGIN [PurviewAccountName] FROM EXTERNAL PROVIDER;
    

Aplicación de permisos para examinar el contenido del área de trabajo

Puede configurar la autenticación para un origen de Azure Synapse de dos maneras:

  • Uso de una identidad administrada
  • Uso de una entidad de servicio

Importante

Estos pasos para las bases de datos sin servidor no se aplican a las bases de datos replicadas. Actualmente en Synapse, las bases de datos sin servidor que se replican desde bases de datos de Spark son de solo lectura. Haga clic aquí para obtener más información.

Nota

Debe configurar la autenticación en cada base de datos SQL dedicada que esté contenida en el área de trabajo de Azure Synapse que tenga intención de registrar y examinar. Los permisos que se mencionan en las secciones siguientes para la base de datos SQL sin servidor se aplican a todas las bases de datos dentro del área de trabajo. Es decir, tendrá que configurar la autenticación solo una vez.

Uso de una identidad administrada para bases de datos SQL dedicadas

  1. Vaya al área de trabajo de Azure Synapse.

  2. Vaya a la sección Datos y busque una de las bases de datos SQL dedicadas.

  3. Seleccione los puntos suspensivos ( ... ) junto a ella y, a continuación, inicie un nuevo SQL script.

    Nota

    Para ejecutar los comandos en el procedimiento siguiente, debe ser administrador de Azure Synapse en el área de trabajo. Para obtener más información sobre los permisos de Azure Synapse Analytics, consulte Configuración del control de acceso para el área de Azure Synapse de trabajo.

  4. Agregue el MSI de la cuenta de Azure Purview (representado mediante el nombre de la cuenta) como db_datareader en la base de datos SQL dedicada ejecutando el siguiente comando en el script de SQL:

    CREATE USER [PurviewAccountName] FROM EXTERNAL PROVIDER
    GO
    
    EXEC sp_addrolemember 'db_datareader', [PurviewAccountName]
    GO
    

Uso de una identidad administrada para bases de datos SQL sin servidor

  1. Vaya al área de trabajo de Azure Synapse.
  2. Vaya a la sección Datos y siga los pasos siguientes para cada base de datos que quiera examinar.
  3. Seleccione los puntos suspensivos ( ... ) junto a la base de datos y, a continuación, inicie un nuevo SQL script.
  4. Agregue el MSI de la cuenta de Azure Purview (representado mediante el nombre de la cuenta) como db_datareader en las bases de datos SQL sin servidor ejecutando el siguiente comando en el script de SQL:
    CREATE USER [PurviewAccountName] FOR LOGIN [PurviewAccountName];
    ALTER ROLE db_datareader ADD MEMBER [PurviewAccountName]; 
    

Concesión de permiso para usar credenciales para tablas externas

Si el área de trabajo de Azure Synapse tiene tablas externas, a la identidad administrada de Azure Purview se le debe conceder el permiso Referencias en las credenciales con ámbito de tabla externa. Con el permiso Referencias, Azure Purview puede leer datos de tablas externas.

GRANT REFERENCES ON DATABASE SCOPED CREDENTIAL::[scoped_credential] TO [PurviewAccountName];

Uso de una entidad de servicio para bases de datos SQL dedicadas

Nota

Primero debe configurar una nueva credencial del tipo de entidad de servicio siguiendo las instrucciones de Credenciales para la autenticación de origen en Azure Purview.

  1. Vaya al área de trabajo de Azure Synapse.

  2. Vaya a la sección Datos y busque una de las bases de datos SQL dedicadas.

  3. Seleccione los puntos suspensivos ( ... ) junto a ella y, a continuación, inicie un nuevo SQL script.

  4. Agregue el identificador de la entidad de servicio como db_datareader en la base de datos SQL dedicada ejecutando el siguiente comando en el script de SQL:

    CREATE USER [ServicePrincipalID] FROM EXTERNAL PROVIDER
    GO
    
    EXEC sp_addrolemember 'db_datareader', [ServicePrincipalID]
    GO
    

Nota

Repita el paso anterior para todas las bases de datos SQL dedicadas en el área de trabajo de Synapse.

Uso de una entidad de servicio para bases de datos SQL sin servidor

  1. Vaya al área de trabajo de Azure Synapse.

  2. Vaya a la sección Datos y busque una de las bases de datos SQL sin servidor.

  3. Seleccione los puntos suspensivos ( ... ) junto a ella y, a continuación, inicie un nuevo SQL script.

  4. Agregue el identificador de la entidad de servicio para bases de datos SQL sin servidor ejecutando el siguiente comando en el script de SQL:

    CREATE LOGIN [ServicePrincipalID] FROM EXTERNAL PROVIDER;
    
  5. Agregue el identificador de la entidad de servicio como db_datareader para las bases de datos SQL sin servidor que desee examinar. ejecutando el siguiente comando en el script de SQL:

     CREATE USER [ServicePrincipalID] FOR LOGIN [ServicePrincipalID];
     ALTER ROLE db_datareader ADD MEMBER [ServicePrincipalID]; 
    

Configuración del acceso al firewall de área de trabajo de Azure Synapse

  1. En Azure Portal, vaya al área de trabajo de Azure Synapse.

  2. En el panel izquierdo, seleccione Firewalls.

  3. En Permitir que los servicios y recursos de Azure accedan a esta área de trabajo, seleccione Activado.

  4. Seleccione Guardar.

Creación y ejecución de un examen

Para crear y ejecutar un nuevo examen, siga estos pasos:

  1. Seleccione la pestaña Mapa de datos en el panel izquierdo de Purview Studio.

  2. Seleccione el origen de datos que ha registrado.

  3. Seleccione Ver detalles y, a continuación, seleccione la pestaña Nuevo examen. También puede usar el icono de acción rápida Escanear en el mosaico de origen.

  4. En el panel de detalles Examen, en el cuadro Nombre, escriba un nombre para este examen.

  5. En la lista desplegable Tipo, seleccione los tipos de recursos que quiere examinar dentro de este origen. SQL Database es el único tipo que se admite actualmente en un área de trabajo de Azure Synapse.

    Captura de pantalla del panel de detalles del origen de Azure Synapse.

  6. En la lista desplegable Credencial, seleccione la credencial para conectarse a los recursos del origen de datos.

  7. En cada tipo puede optar por examinar todos los recursos o un subconjunto de ellos por nombre.

  8. Haga clic en Continuar para seguir.

  9. Seleccione un conjunto de reglas de examen de tipo Azure Synapse SQL. También puede crear conjuntos de reglas de examen insertados.

  10. Elija el desencadenador del examen. Puede programarlo para que se ejecute semanalmente, mensualmente o una vez.

  11. Revise el examen y seleccione Guardar para completar la configuración.

Visualización de los exámenes y las ejecuciones de exámenes

Para ver los exámenes existentes, haga lo siguiente:

  1. Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.

  2. Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.

  3. Seleccione el examen que tiene los resultados que quiere ver.

  4. En esta página se muestran todas las ejecuciones de exámenes anteriores, junto con el estado y las métricas de cada ejecución del examen. También mostrará si el análisis se ha programado o es manual, a cuántos recursos se han aplicado clasificaciones, cuántos recursos totales se han detectado, la hora de inicio y finalización del examen y la duración total del examen.

Administración de exámenes: editar, eliminar o cancelar

Para administrar o eliminar un examen, haga lo siguiente:

  1. Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.

  2. Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.

  3. Seleccione el examen que desea administrar. Para editar el examen, puede seleccionar Edit scan (Editar examen).

  4. Para cancelar un examen en curso, puede seleccionar Cancelar ejecución del examen.

  5. Para eliminar el examen, seleccione Eliminar examen.

Nota

  • Al eliminar el examen no se eliminan los recursos del catálogo creados a partir de examenes anteriores.
  • El recurso no se volverá a actualizar con los cambios de esquema si ha cambiado la tabla de origen y se vuelve a examinar la tabla de origen después de editar la descripción en la pestaña de esquema de Purview.

Pasos siguientes

Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.