¿Qué es Azure Data Catalog?What is Azure Data Catalog?

Azure Data Catalog es un servicio en la nube totalmente administrado.Azure Data Catalog is a fully managed cloud service. Permite a los usuarios detectar los orígenes de datos que necesitan y comprender los orígenes de datos que encuentran.It lets users discover the data sources they need and understand the data sources they find. Al mismo tiempo, Data Catalog ayuda a las organizaciones a obtener más valor de sus inversiones existentes.At the same time, Data Catalog helps organizations get more value from their existing investments.

Con Data Catalog, cualquier usuario (analista, científico de datos o desarrollador) puede detectar, comprender y consumir orígenes de datos.With Data Catalog, any user (analyst, data scientist, or developer) can discover, understand, and consume data sources. Data Catalog incluye un modelo de colaboración abierta distribuida de metadatos y anotaciones.Data Catalog includes a crowdsourcing model of metadata and annotations. Es un único lugar centralizado para que todos los usuarios de una organización aporten sus conocimientos y generen una comunidad y la referencia cultural de los datos.It is a single, central place for all of an organization's users to contribute their knowledge and build a community and culture of data.

Desafíos de detección para los consumidores de datosDiscovery challenges for data consumers

Tradicionalmente, la detección de orígenes de datos empresariales ha sido un proceso orgánico basado en conocimiento tribal.Traditionally, discovering enterprise data sources has been an organic process based on tribal knowledge. Este enfoque presenta varios desafíos a las empresas que desean sacar el máximo partido de sus recursos de información:For companies that want to get the most value from their information assets, this approach presents numerous challenges:

  • Es posible que los usuarios no sepan que existe un origen de datos, salvo que se lo encuentren como parte de otro proceso.Users might not know that a data source exists unless they come into contact with it as part of another process. No hay ninguna ubicación central en la que estén registrados los orígenes de datos.There is no central location where data sources are registered.
  • Salvo que los usuarios conozcan la ubicación de un origen de datos, no se podrán conectar a los datos mediante una aplicación cliente.Unless users know the location of a data source, they cannot connect to the data by using a client application. Las experiencias de consumo de datos requieren que los usuarios conozcan la cadena de conexión o la ruta de acceso.Data-consumption experiences require users to know the connection string or path.
  • Salvo que los usuarios conozcan la ubicación de la documentación de un origen de datos, no podrán conocer los usos previstos de los datos.Unless users know the location of a data source's documentation, they cannot understand the intended uses of the data. Tanto los orígenes de datos como la documentación pueden encontrarse en varios lugares y consumirse a través de varias experiencias.Data sources and documentation might live in a variety of places and be consumed through a variety of experiences.
  • Si los usuarios tienen dudas acerca de un recurso de información, deben buscar al experto o equipos responsables de los datos e interactuar con ellos sin conexión.If users have questions about an information asset, they must locate the expert or team that's responsible for the data and engage them offline. No hay ninguna conexión explícita entre los datos y los expertos que tienen perspectivas sobre su uso.There is no explicit connection between data and the experts that have perspectives on its use.
  • A menos que los usuarios conozcan el proceso de solicitud de acceso al origen de datos, la detección del origen de datos y su documentación no les ayudan a acceder a los datos.Unless users understand the process for requesting access to the data source, discovering the data source and its documentation still does not help them access the data.

Desafíos de detección para los productores de datosDiscovery challenges for data producers

Aunque los consumidores de datos se enfrentan a los desafíos mencionados, los usuarios responsables de producir y mantener recursos de información se enfrentan a los suyos propios:Although data consumers face the previously mentioned challenges, users who are responsible for producing and maintaining information assets face challenges of their own:

  • A menudo, la anotación de orígenes de datos con metadatos descriptivos es un esfuerzo baldío.Annotating data sources with descriptive metadata is often a lost effort. Las aplicaciones cliente suelen ignorar las descripciones que se almacenan en el origen de datos.Client applications typically ignore descriptions that are stored in the data source.
  • La creación de documentación para los orígenes de datos suele ser un esfuerzo baldío.Creating documentation for data sources is often a lost effort. Mantener la documentación en sincronización con los orígenes de datos es una responsabilidad constante.Keeping documentation in sync with data sources is an ongoing responsibility. Los usuarios pueden llegar a dejar de confiar en aquella documentación que se percibe como obsoleta.Users may lack trust in documentation that's perceived as being out of date.
  • La creación y el mantenimiento de la documentación de los orígenes de datos son tareas complejas y lentas.Creating and maintaining documentation for data sources is complex and time-consuming. Que dicha documentación esté disponible para todos los que usen el origen de datos también puede serlo.Making that documentation readily available to everyone who uses the data source can be even more so.
  • La restricción del acceso a los orígenes de datos y la garantía de que los consumidores de datos saben cómo solicitar el acceso suponen un desafío continuo.Restricting access to data sources and ensuring that data consumers know how to request access is an ongoing challenge.

Cuando dichos retos de se combinan, suponen una barrera importante para las empresas que desean estimular y promover el uso y conocimiento de los datos empresariales.When such challenges are combined, they present a significant barrier for companies who want to encourage and promote the use and understanding of enterprise data.

Azure Data Catalog puede ser de gran ayudaAzure Data Catalog can help

Data Catalog está diseñado para abordar estos problemas y ayudar a las empresas a sacar el máximo partido a los recursos de información existentes.Data Catalog is designed to address these problems and to help enterprises get the most value from their existing information assets. Data Catalog facilita que los usuarios que administran los datos puedan detectar y comprender los orígenes de datos.Data Catalog makes data sources easily discoverable and understandable by the users who manage the data.

Data Catalog proporciona un servicio basado en la nube en el que es posible registrar un origen de datos.Data Catalog provides a cloud-based service into which a data source can be registered. Los datos permanecen en la ubicación existente, pero se agrega una copia de sus metadatos a Data Catalog, junto con una referencia a la ubicación del origen de datos.The data remains in its existing location, but a copy of its metadata is added to Data Catalog, along with a reference to the data-source location. Los metadatos también se indexan no solo para que todos los orígenes de datos se puedan detectar fácilmente a través de la búsqueda, sino también para que los usuarios que los detecten puedan comprenderlos.The metadata is also indexed to make each data source easily discoverable via search and understandable to the users who discover it.

Una vez registrado un origen de datos, se pueden mejorar sus metadatos.After a data source has been registered, its metadata can then be enriched. Los metadatos pueden agregarlos el usuario que los ha registrado, o bien otros usuarios de la empresa.The metadata can be added either by the user who registered it or by other users in the enterprise. Cualquier usuario puede anotar un origen de datos proporcionando descripciones, etiquetas u otros metadatos, como la documentación y procesos para solicitar acceso al origen de datos.Any user can annotate a data source by providing descriptions, tags, or other metadata, such as documentation and processes for requesting data source access. Estos metadatos descriptivos complementan a los metadatos estructurales (como los nombres de columna y los tipos de datos) registrados desde el origen de datos.This descriptive metadata supplements the structural metadata (such as column names and data types) that's registered from the data source.

El descubrimiento y comprensión de los orígenes de datos y su uso es el propósito principal de registrar los orígenes.Discovering and understanding data sources and their use is the primary purpose of registering the sources. Los usuarios empresariales pueden necesitar los datos para la inteligencia empresarial, el desarrollo de aplicaciones, la ciencia de datos o cualquier otra tarea en la que se requieran los datos correctos.Enterprise users might need data for business intelligence, application development, data science, or any other task where the right data is required. Pueden usar la detección de Data Catalog para encontrar rápidamente datos que se ajusten a sus necesidades, conocer los datos para evaluar su idoneidad para un fin concreto y consumir los datos abriendo el origen de datos en su herramienta preferida.They can use the Data Catalog discovery experience to quickly find data that matches their needs, understand the data to evaluate its fitness for the purpose, and consume the data by opening the data source in their tool of choice.

Al mismo tiempo, los usuarios pueden contribuir al catálogo mediante el etiquetado, la documentación y la anotación de los orígenes de datos que ya han registrado.At the same time, users can contribute to the catalog by tagging, documenting, and annotating data sources that have already been registered. También pueden registrar nuevos orígenes de datos que la comunidad de usuarios del catálogo, posteriormente, puede detectar, entender y consumir.They can also register new data sources, which can then be discovered, understood, and consumed by the community of catalog users.

Funcionalidades de Data Catalog

Más información acerca de Data CatalogLearn more about Data Catalog

Para más información acerca de las funcionalidades de Data Catalog, consulte:To learn more about the capabilities of Data Catalog, see:

Pasos siguientesNext steps

Introducción a Data Catalog:To get started with Data Catalog: