Conexión y administración de proyectos de Google BigQuery en Azure Purview (versión preliminar)
En este artículo se describe cómo registrar proyectos de Google BigQuery y cómo autenticarse e interactuar con Google BigQuery en Azure Purview. Para obtener más información sobre Azure Purview, consulte el artículo de introducción.
Importante
Google BigQuery como origen está actualmente en VERSIÓN PRELIMINAR. Los Términos de uso complementarios para las versiones preliminares de Microsoft Azure incluyen términos legales adicionales que se aplican a las características de Azure que se encuentran en la versión beta, en versión preliminar o que todavía no se han publicado para que estén disponibles con carácter general.
Funcionalidades admitidas
| Extracción de metadatos | Examen completo | Examen incremental | Examen con ámbito | Clasificación | Directiva de acceso | Lineage |
|---|---|---|---|---|---|---|
| Sí | Sí | No | No | No | No | Sí |
Importante
La versión compatible de Google BigQuery es la 11.0.0.
Prerrequisitos
Una cuenta de Azure con una suscripción activa. Cree una cuenta gratuita.
Un recurso de Purview activo.
Tendrá que ser administrador de orígenes de datos y lector de datos para poder registrar un origen y administrarlo en Purview Studio. Para obtener más información, consulte la página Permisos de Azure Purview.
Configure la versión más reciente del entorno de ejecución de integración autohospedado. Para obtener más información, consulte la guía de creación y configuración de un entorno de ejecución de integración autohospedado.
Asegúrese de que JDK 11 esté instalado en la máquina virtual donde también lo esté el entorno de ejecución de integración autohospedado.
Asegúrese de que Visual C++ Redistributable para Visual Studio 2012 Update 4 esté instalado en la máquina del entorno de ejecución de integración autohospedado. Si no tiene instalada esta actualización, puede descargarla de aquí.
Descargue e instale el controlador JDBC de BigQuery en la máquina en la que se ejecuta el entorno de ejecución de integración autohospedado. Puede encontrar el controlador aquí.
Nota
Todas las cuentas de la máquina virtual deben poder acceder al controlador. No lo instale en una cuenta de usuario.
Register
En esta sección se describe cómo registrar un proyecto de Google BigQuery en Azure Purview mediante Purview Studio.
Pasos para registrarse
Vaya a la cuenta de Purview.
Seleccione Data Map (Mapa de datos) en el panel de navegación izquierdo.
Seleccione Registrar.
En Register sources (Registrar orígenes), seleccione Google BigQuery. Seleccione Continue (Continuar).
En la pantalla Register sources (Registrar orígenes) (Google BigQuery), siga estos pasos:
Escriba en Name (Nombre), el nombre con el que el origen de datos se va a mostrar en el catálogo.
Escriba el valor de ProjectID. Debe ser un identificador de proyecto completo. Por ejemplo, mydomain.com:myProject.
Seleccione una colección o cree una nueva (opcional).
Seleccione Registrar.
Examinar
Siga los pasos que tiene a continuación para examinar un proyecto de Google BigQuery e identificar automáticamente los recursos y clasificar los datos. Para obtener más información sobre el examen en general, consulte la introducción a los exámenes y la ingesta.
Creación y ejecución de un examen
En el centro de administración, seleccione Entornos de ejecución de integración. Asegúrese de que está configurado un entorno de ejecución de integración autohospedado. Si no está configurado, siga los pasos mencionados aquí.
Vaya a Sources (Orígenes).
Seleccione el proyecto de BigQuery registrado.
Seleccione + New scan (+ Nuevo examen).
Especifique los detalles siguientes:
Name (Nombre): el nombre del examen.
Connect via integration runtime (Conectar mediante IR): seleccione el entorno de ejecución de integración configurado.
Credencial: al configurar las credenciales de BigQuery, asegúrese de:
- Seleccionar Basic Authentication (Autenticación básica) como método de autenticación
- Proporcione el identificador de correo electrónico de la cuenta de servicio en el campo Nombre de usuario. Por ejemplo:
xyz\@developer.gserviceaccount.com - Siga los pasos que se indican a continuación para generar la clave privada, copie el archivo JSON y almacénelo como el valor de un secreto de Key Vault.
Para crear una nueva clave privada desde la plataforma en la nube de Google:
- En el menú de navegación, en las opciones IAM y administrador, seleccione >Cuentas de servicio>, Seleccionar un proyecto>.
- Seleccione la dirección de correo electrónico de la cuenta de servicio para la que desea crear una clave.
- Seleccione la pestaña Claves.
- Seleccione el menú desplegable Agregar clave y, a continuación, seleccione Crear nueva clave.
- Elija el formato JSON.
Nota
El contenido de la clave privada se guarda en un archivo temporal en la máquina virtual cuando se ejecutan los procesos de examen. Este archivo temporal se elimina después de que los exámenes se hayan completado correctamente. Si se produce un error en cualquiera de ellos, el sistema seguirá reintentando la operación hasta que se ejecute correctamente. Asegúrese de que el acceso está restringido adecuadamente en la máquina virtual en la que se ejecuta SHIR.
Para obtener más información sobre credenciales, vea el vínculo que se indica aquí.
Driver location (Ubicación del controlador): especifique la ruta de acceso a la ubicación del controlador JDBC en la máquina virtual donde se ejecuta el entorno de ejecución de integración autohospedado. Debe ser la ruta de acceso a la ubicación válida de la carpeta JAR.
Nota
Todas las cuentas de la máquina virtual deben poder acceder al controlador. No lo instale en una cuenta de usuario.
Conjunto de datos: especifique una lista de conjuntos de datos de BigQuery que se importarán. Por ejemplo, dataset1; dataset2. Si la lista está vacía, se importan todos los conjuntos de datos disponibles. Los patrones de nombres de conjunto de datos aceptables que usan la sintaxis de expresiones SQL LIKE incluyen el uso de %.
Por ejemplo, A%; %B; %C%; D
- empieza por A o
- termina en B o
- contiene C o
- igual a D
No se acepta el empleo de NOT ni de caracteres especiales.
Memoria máxima disponible: memoria máxima (en GB) disponible en la máquina virtual que se va a usar en los procesos de examen. Depende del tamaño del proyecto de Google BigQuery que se va a examinar.
Seleccione Test Connection (Probar conexión).
Seleccione Continuar.
Elija el desencadenador del examen. Puede configurar una programación o ejecutar el examen una vez.
Revise el examen y seleccione Save and run (Guardar y ejecutar).
Visualización de los exámenes y las ejecuciones de exámenes
Para ver los exámenes existentes, haga lo siguiente:
Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.
Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.
Seleccione el examen que tiene los resultados que quiere ver.
En esta página se muestran todas las ejecuciones de exámenes anteriores, junto con el estado y las métricas de cada ejecución del examen. También mostrará si el análisis se ha programado o es manual, a cuántos recursos se han aplicado clasificaciones, cuántos recursos totales se han detectado, la hora de inicio y finalización del examen y la duración total del examen.
Administración de exámenes: editar, eliminar o cancelar
Para administrar o eliminar un examen, haga lo siguiente:
Vaya a Purview Studio. Seleccione la Mapa de datos en el panel izquierdo.
Seleccione el origen de datos que desee. Verá una lista de exámenes existentes en ese origen de datos en Exámenes recientes o puede ver todos los exámenes en la pestaña Exámenes.
Seleccione el examen que desea administrar. Para editar el examen, puede seleccionar Edit scan (Editar examen).
Para cancelar un examen en curso, puede seleccionar Cancelar ejecución del examen.
Para eliminar el examen, seleccione Eliminar examen.
Nota
- Al eliminar el examen no se eliminan los recursos del catálogo creados a partir de examenes anteriores.
- El recurso no se volverá a actualizar con los cambios de esquema si ha cambiado la tabla de origen y se vuelve a examinar la tabla de origen después de editar la descripción en la pestaña de esquema de Purview.
Pasos siguientes
Ahora que ha registrado el origen, siga las guías a continuación para obtener más información sobre Purview y sus datos.