Anotación de orígenes de datos en Azure Data Catalog

Importante

Azure Data Catalog se va a retirar el 15 de mayo de 2024.

Ya no se pueden crear nuevas cuentas de Azure Data Catalog.

En el caso de las características de catálogo de datos, use el servicio Microsoft Purview, que ofrece una gobernanza de datos unificada para todo el patrimonio de datos.

Si ya usa Azure Data Catalog, deberá Crear un plan de migración para que la organización migre a Microsoft Purview antes del 15 de mayo de 2024.

Introducción

Microsoft Azure Data Catalog es un servicio en la nube totalmente administrado que actúa como sistema de registro y de detección de orígenes de datos empresariales. En otras palabras, Data Catalog ayuda a las personas a detectar, comprender y usar orígenes de datos, así como ayudar a las organizaciones a obtener un mayor valor de sus datos. Cuando un origen de datos se registra en Data Catalog, el servicio copia e indexa sus metadatos, pero eso no es todo. Data Catalog permite que los usuarios faciliten sus propios metadatos descriptivos, como descripciones y etiquetas, para complementar los metadatos extraídos del origen de datos y conseguir que más personas lo comprendan.

Anotación y micromecenazgo

Todo el mundo tiene una opinión. Y eso es algo bueno. Data Catalog reconoce que distintos usuarios tienen diferentes perspectivas sobre los orígenes de datos empresariales y que cada una de estas perspectivas puede ser valiosa. Considere el caso siguiente:

  • El administrador del sistema conoce el contrato de nivel de servicio de los servidores o servicios que hospedan el origen de datos.
  • El administrador de base de datos conoce la programación de copia de seguridad de cada base de datos y las ventanas de procesamiento de ETL permitidas.
  • El propietario del sistema conoce el proceso para que los usuarios soliciten acceso al origen de datos.
  • El administrador de datos conoce cómo se asignan los recursos y atributos del origen de datos al modelo de datos empresarial.
  • El analista conoce cómo se usan los datos en el contexto de los procesos empresariales con los que trabaja.

Cada una de estas perspectivas es importante, y Data Catalog aplica un enfoque de micromecenazgo a los metadatos que permite que cada una se capture y utilice para ofrecer una visión completa de los orígenes de datos registrados. Cada usuario puede agregar y editar sus propias anotaciones en el portal de Data Catalog, a la vez que puede ver las anotaciones proporcionadas por otros usuarios.

Distintos tipos de anotaciones

La búsqueda de Data Catalog admite los siguientes tipos de anotaciones:

Anotación Notas
Nombre descriptivo Se pueden proporcionar nombres descriptivos en el nivel de recursos de datos para que dichos recursos de datos se entiendan con más facilidad. Los nombres descriptivos son más útiles cuando el nombre del objeto subyacente es críptico, está abreviado o no es significativo para los usuarios.
Descripción Las descripciones se pueden proporcionar en los niveles de atributos y recursos de datos o de columnas. Las descripciones son anotaciones de texto breve de forma libre que describen la perspectiva del usuario sobre el recurso de datos o su uso.
Etiquetas (etiquetas de usuario) Las etiquetas se pueden proporcionar en los niveles de atributos y recursos de datos o de columnas. Los usuarios definen las etiquetas que se pueden usar para clasificar los atributos o recursos de datos.
Etiquetas (etiquetas de glosario) Las etiquetas se pueden proporcionar en los niveles de atributos y recursos de datos o de columnas. Las etiquetas del glosario son términos de glosario definidos centralmente que pueden utilizarse para clasificar los recursos de datos o atributos mediante una taxonomía empresarial común. Para más información, consulte Configuración del glosario empresarial para el etiquetado regulado
Expertos Los expertos se pueden facilitar en el nivel de recursos de datos. Los expertos identifican usuarios o grupos con perspectivas de expertos sobre los datos y pueden servir como puntos de contacto para los usuarios que detectan los orígenes de datos registrados y tienen preguntas que las anotaciones existentes no responden.
Solicitar acceso La información de solicitud de acceso se puede proporcionar en el nivel de recursos de datos. Esta información es para los usuarios que detectan un origen de datos al que aún no tienen permisos de acceso. Los usuarios pueden escribir la dirección de correo electrónico del usuario o grupo que concede el acceso, la dirección URL del proceso o la herramienta a los que los usuarios necesitan tener acceso, o pueden especificar el propio proceso como texto.
Documentación La documentación se puede facilitar en el nivel de recursos de datos. La documentación sobre recursos es información de texto enriquecido que puede incluir vínculos e imágenes y proporcionar información que no es posible transmitir a través de descripciones y etiquetas.

Anotación de varios recursos

Los usuarios pueden seleccionar varios recursos de datos en el portal de Data Catalog y anotar todos los recursos seleccionados en una sola operación. Las anotaciones se aplicarán a todos los recursos seleccionados, lo que facilita seleccionar y proporcionar una descripción y unos conjuntos de etiquetas y expertos coherentes para los recursos de datos relacionados.

Nota:

También se pueden proporcionar etiquetas y expertos al registrar recursos de datos mediante la herramienta de registro de orígenes de datos de Data Catalog.

Cuando se seleccionan varias tablas y vistas, solo las columnas que todos los recursos de datos seleccionados tienen en común se mostrarán en el portal de Data Catalog. Esto permite que los usuarios proporcionen etiquetas y descripciones para todas las columnas con el mismo nombre de todos los recursos seleccionados.

Anotaciones y detección

Al igual que los metadatos extraídos del origen de datos durante el registro se agregan al índice de búsqueda de Data Catalog, los metadatos proporcionados por los usuarios también se indexan. Esto significa que las anotaciones no solo facilitan que los usuarios entiendan los datos que detectan, sino que también resultará más sencillo para los usuarios la detección de los recursos de datos anotados mediante la búsqueda con los términos que tengan sentido para ellos.

Resumen

Al registrar un origen de datos con Data Catalog, se consigue que esos datos sean detectables mediante la copia de los metadatos descriptivos y estructurales del origen de datos en el servicio Catálogo. Cuando se ha registrado un origen de datos, los usuarios pueden proporcionar anotaciones para facilitar la detección y comprensión dentro del portal de Data Catalog.