Registro de datos de Azure Data Lake Storage Gen1 en Azure Data Catalog

En este artículo, obtendrá información sobre cómo integrar Azure Data Lake Storage Gen1 con Azure Data Catalog para hacer que los datos sean reconocibles dentro de una organización mediante la integración con Data Catalog. Para más información sobre la catalogación de datos, consulte ¿Qué es Azure Data Catalog?. Para saber en qué escenarios se puede utilizar Data Catalog, consulte Escenarios comunes de Azure Data Catalog.

Prerrequisitos

Antes de empezar este tutorial, debe contar con lo siguiente:

Registro de Data Lake Storage Gen1 como origen para Data Catalog

  1. Vaya a https://azure.microsoft.com/services/data-catalogy haga clic en Iniciado.

  2. Inicie sesión en el portal de Azure Data Catalog y haga clic en Publicar datos.

    Registrar un origen de datos

  3. En la siguiente página, haga clic en Iniciar aplicación. Esto descargará el archivo de manifiesto de la aplicación en el equipo. Haga doble clic en este archivo para iniciar la aplicación.

  4. En la página principal, haga clic en Iniciar sesióny escriba sus credenciales.

    Pantalla de bienvenida

  5. En la página Seleccionar un origen de datos, seleccione Azure Data Lake Store y, a continuación, haga clic en Siguiente.

    Seleccionar origen de datos

  6. En la siguiente página, proporcione el nombre de la cuenta de Data Lake Storage Gen1 que quiere registrar en Data Catalog. Deje las demás opciones con el valor predeterminado y, a continuación, haga clic en Conectar.

    Conectar al origen de datos

  7. La página resultante se puede dividir en los siguientes segmentos.

    a. El cuadro Jerarquía de servidor representa la estructura de carpetas de la cuenta de Data Lake Storage Gen1. $Root representa la raíz de la cuenta de Data Lake Storage Gen1 y AmbulanceData representa la carpeta creada en la raíz de dicha cuenta.

    b. El cuadro Objetos disponibles muestra los archivos y carpetas de la carpeta AmbulanceData.

    c. En el cuadro Objetos que se registrarán se enumeran los archivos y las carpetas que quiere registrar en Azure Data Catalog.

    Captura de pantalla de Microsoft Azure Data Catalog: cuadro de diálogo de la cuenta del almacén.

  8. Para este tutorial, deberá registrar todos los archivos del directorio. Para ello, haga clic en el botón (Mover objetos) para mover todos los archivos al cuadro Objetos que se registrarán.

    Dado que los datos se registrarán en un catálogo de datos de toda la organización, es recomendable agregar algunos metadatos que podrá usar posteriormente para localizar rápidamente los datos. Por ejemplo, puede agregar una dirección de correo electrónico del propietario de los datos (por ejemplo, la persona que está cargando los datos) o agregar una etiqueta para identificar los datos. En la captura de pantalla siguiente se muestra una etiqueta que ha agregado a los datos.

    Captura de pantalla de Microsoft Azure Data Catalog: cuadro de diálogo de la cuenta del almacén con la etiqueta que se ha agregado a los datos resaltada.

    Haga clic en Registrar.

  9. La captura de pantalla siguiente indica que los datos se han registrado correctamente en el Catálogo de datos.

    Registro completo

  10. Haga clic en Ver portal para volver atrás al portal del Catálogo de datos y comprobar que ya puede acceder a los datos registrados desde el portal. Para realizar búsquedas en los datos, puede utilizar la etiqueta que usó al registrar los datos.

    Buscar datos en el catálogo

  11. Ahora ya puede realizar operaciones como agregar anotaciones y documentación a los datos. Para más información, consulte los vínculos siguientes:

Consulte también