Preguntas más frecuentes de Microsoft Graph Data Connect

Microsoft Graph Data Connect permite a los desarrolladores crear aplicaciones que los clientes pueden usar para proporcionar acceso administrado a los conjuntos de datos de Microsoft Graph en escala. Este artículo proporciona sugerencias que le ayudarán a aprovechar la característica de Data Connect. Para obtener una introducción a Microsoft Graph Data Connect, consulte el artículo Introducción.

¿Es Microsoft Graph Data Connect adecuada para mí?

Las API de Microsoft Graph y Data Connect proporcionan acceso a los mismos datos subyacentes, pero de formas muy diferentes. Data Connect está diseñado para extraer grandes cantidades de datos de forma masiva, mientras que las API de Microsoft Graph son más adecuadas para acceder a conjuntos menores de datos en tiempo real. En algunos casos, incluso puede ser lógico combinarlas. Por ejemplo, es posible que le interese usar Data Connect para realizar una extracción inicial de los datos de correo electrónico del último año y, a partir de ahí, usar la API de Microsoft Graph para analizar los mensajes de correo electrónico en tiempo real. Data Connect y las API de Microsoft Graph son herramientas diferentes para tareas distintas. Es importante considerar cuál es el mejor método de acceso para su caso.

¿Habrá alguna sobrecarga inicial?

Puesto que Data Connect está diseñada para extraer grandes cantidades de datos de forma masiva, se produce cierta sobrecarga antes de que se puedan extraer los datos. Esta sobrecarga es de aproximadamente 45 minutos, lo que significa que todas las canalizaciones le llevarán al menos ese tiempo independientemente del tamaño de los datos. Esto puede ser un coste mínimo para grandes cantidades de datos, pero si no es aceptable en su caso, las API de Microsoft Graph pueden proporcionar un método mejor.

¿Cuánto tengo que pagar por Microsoft Graph Data Connect?

Los cargos de consumo de Microsoft Graph Data Connect se facturan mensualmente con un modelo de pago por uso. La unidad de facturación de Microsoft Graph Data Connect es en múltiplos de 1 000 objetos, donde 1 objeto se asigna a 1 instancia individual de una entidad en Microsoft 365. Por ejemplo, 1 correo electrónico == 1 objeto, 1 archivo == 1 objeto, 1 mensaje de chat de Teams == 1 objeto, y así sucesivamente. Los cargos se calculan con una tasa fija basándose en el recuento de cada 1 000 objetos extraídos a través del conector. No hay ningún cargo para la extracción de objetos de los siguientes conjuntos de datos:

  • BasicDataSet_v0.User
  • BasicDataSet_v0.MailboxSettings
  • BasicDataSet_v0.Manager
  • BasicDataSet_v0.DirectReport.

¿Es posible que mis datos permanezcan dentro de la suscripción de la organización con Microsoft Graph Data Connect?

Las canalizaciones de Data Connect están organizadas por Azure Data Factory, un servicio de integración de datos que se ejecuta en una suscripción de Azure. La suscripción de Azure está asociada exactamente con un inquilino de Microsoft 365. De esta forma, los datos deben transmitirse inicialmente a una suscripción de Azure asociada. Tras una mayor minimalización y agregación, los datos pueden usarse en otro lugar.

Si quiere crear una aplicación para que otros puedan extraer sus datos de Microsoft 365, puede empaquetar la aplicación como una aplicación de administración de Azure y publicarla en el Microsoft Azure Marketplace. Después, alguien puede implementar la aplicación en su propia suscripción de Azure y la aplicación puede acceder a los datos en su espacio empresarial.

¿Son necesarias las entidades de servicio con Microsoft Graph Data Connect?

Al crear la canalización de Data Factory, tendrá que proporcionar a una entidad de servicio en el servicio vinculado de Microsoft 365. En Azure, una entidad de servicio es una identidad de seguridad que representa una aplicación o servicio (en lugar de un usuario). Data Connect usa esta entidad de servicio como su identidad al recibir acceso autorizado a los datos de Microsoft 365.

Si crea una aplicación administrada por Azure para que otros puedan usarla en sus espacios empresariales, aún deberá proporcionar una entidad de servicio para que use la aplicación. Esta entidad de servicio se encuentra en el espacio empresarial (del editor). Sin embargo, si la aplicación necesita otras entidades de servicio, el cliente (el instalador) las creará en su propio espacio empresarial. Por ejemplo, es probable que la canalización de Data Factory necesite acceder a un recurso de almacenamiento de Azure. El cliente crearía la entidad de servicio con permisos para la cuenta de almacenamiento para que use la canalización.

¿Cómo puedo buscar solicitudes pendientes de Privileged Access Management?

Antes de que Data Connect pueda copiar los datos, un administrador debe aprobar una solicitud de Privileged Access Management (PAM). PAM es el mecanismo utilizado para autorizar el acceso a la canalización de datos en Microsoft 365. La primera vez que desencadena una canalización, esperará a que un administrador de Microsoft 365 (o delegado designado) apruebe la solicitud de acceso. Aunque el estado de la canalización muestra En curso, la actividad de copia subyacente tendrá el estado de ConsentPending hasta que se apruebe, como se muestra en la siguiente captura de pantalla.

Captura de pantalla del panel de estado de la canalización con un estado de ConsentPending

Durante el desarrollo, es recomendable asegurarse de que las ejecuciones de canalización no se detienen en ConsentPending, especialmente después de realizar un cambio en la canalización. Por ejemplo, si agrega un campo adicional en el esquema, la siguiente ejecución de canalización emitirá una nueva solicitud de PAM que deberá aprobarse. No pierda el tiempo esperando una canalización que está esperando su aprobación.

¿Cómo puedo aprobar solicitudes de PAM a través del portal de administración de Microsoft 365?

La documentación de Data Connect muestra cómo usar PowerShell y PAM UX para aprobar las solicitudes de PAM. Para aprobar con PAM UX, visite la interfaz de PAM en el portal de administración de Microsoft 365. El portal proporciona una forma fácil e intuitiva para ver y aprobar, denegar o revocar solicitudes de PAM. Encontrará un vínculo en el complemento de Microsoft Graph Data Connect en Configuración > Servicios y complementos > Microsoft Graph Data Connect.

¿Puedo tener un segundo usuario para aprobar solicitudes de PAM?

Al ejecutar una canalización y desencadenar una solicitud PAM, la solicitud se adjunta a la cuenta de usuario a la que pertenezca la entidad de servicio usada por la canalización. Pero, aunque esta cuenta forme parte del grupo de aprobadores que configuró, no puede utilizarla para aprobar la solicitud de PAM porque las aprobaciones propias no están permitidas. Si lo intenta, recibirá un mensaje de error en el portal de PAM: "El solicitante y el aprobador coinciden. No se admite la aprobación automática." Para el desarrollo, es recomendable tener una segunda cuenta además del administrador responsable de aprobar las solicitudes. Tanto el remitente como el aprobador deben tener cuentas activas de Exchange Online.

¿Puedo desduplicar los correos electrónicos cuando sea necesario?

Al extraer los correos electrónicos del conjunto de datos de Message, a menudo verá que existen varios objetos JSON para el mismo correo electrónico. Estos duplicados existen porque cuando se envía un correo electrónico a varias personas, hay una copia del correo electrónico en el buzón de cada destinatario. Puesto que el conjunto de datos se extrae de todos los buzones, contendrá todas las copias de los usuarios. En algunos casos, puede que sea necesario mantener todas las copias, pero en otros casos, puede que quiera eliminar los duplicados. Puede eliminar los duplicados de los objetos JSON exportados según el internetMessageId de los mensajes: dos mensajes con el mismo internetMessageId son duplicados de la misma instancia. Como los duplicados pueden existir en diferentes blobs, debe eliminar los duplicados en todos los blobs en lugar de hacerlo en cada blob por separado.

¿Puedo usar el campo de usuario para determinar el usuario relevante?

Los datos extraídos incluyen algunas propiedades de metadatos que no se encuentran al usar las API de Microsoft Graph correspondientes. Concretamente, el campo puser puede ser útil para determinar de qué usuario se han extraído los datos. En el caso de que tenga dos copias del mismo correo electrónico en diferentes buzones, puede usar el campo puser para determinar de qué buzón proviene cada copia. El campo puser también es útil para conjuntos de datos, como el conjunto de datos Manager. El JSON exportado contiene información sobre un administrador, pero esto solo es útil si sabe de quién es administrador. El campo puser le indicará a qué administrador corresponde ese objeto JSON.

¿Es compatible una combinación de usuarios con y sin licencias de Workplace Analytics?

Hoy en día, es necesario que todos los usuarios de la lista de usuarios tengan una licencia de Workplace Analytics o que ninguno de los usuarios de la lista de usuarios tenga licencia de Workplace Analytics. Desafortunadamente, no se admite la lista de usuarios mixtos, es decir, que algunos usuarios tengan licencia de Workplace Analytics y otros no. Esto se debe a que si hay usuarios de la lista de usuarios tienen licencia de Workplace Analytics, no se requieren cargos adicionales para Data Connect, mientras que, si los clientes no tienen licencia de Workplace Analytics, se factura a los clientes mediante la facturación de consumo que se detalla aquí. Si esto supone un problema en su caso de uso en este momento, háganoslo saber y podremos ver si hay oportunidades para ayudarle con ese escenario.

¿Es compatible la configuración de espacio empresarial de modo híbrido?

Si la configuración de Microsoft 365 tiene algunos usuarios en Exchange Online y algunos usuarios en Exchange local, no se admitirán los usuarios que están en Exchange local. Desafortunadamente, en estos momentos no se admite la conexión de datos para usuarios de Exchange local.

¿Son compatibles las cuentas de recursos?

Actualmente no se admite el acceso a mensajes o eventos de cuentas de recursos. Agregaremos compatibilidad para esto en el futuro.

Veo que se ejecutan varios archivos por canalización de ADF, pero a veces solo 1 archivo por ejecución. ¿Por qué sucede esto?

Microsoft Graph Data Connect toma la lista de usuarios para cada ejecución de canalización y, después, distribuye la extracción y la conservación de conjuntos de datos entre varios trabajos que se ejecutan en paralelo. Para cada ejecución paralela, se genera 1 archivo de salida en el receptor de datos definido por usted. En algunos casos, si la lista de usuarios es pequeña, puede que se asignen a 1 trabajo de extracción y conservación, en cuyo casos solo se generaría 1 archivo de salida en el receptor de datos.

¿Cómo se calcula la facturación si el recuento de objetos no es un número redondo?

A efectos de facturación, Microsoft Graph Data Connect redondea hacia arriba el recuento de objetos extraídos al múltiplo de 1 000 más cercano. Por ejemplo, si extrae 125 objetos o 999 objetos, se facturarán 1 000 objetos. De forma similar, si extrae entre 1 001 y 2 000 objetos, se cobrarán 2 000 objetos.

Mi actividad de datos de copia de Microsoft 365 siempre tiene errores cuando se inicializa a través de Azure Synapse. ¿Por qué sucede esto?

Actualmente, no se admite la actividad de datos de copia de Microsoft 365 inicializada a través de Azure Synapse. Estamos trabajando para agregar la integración de la actividad inicializada de Azure Synapse y actualizaremos la documentación cuando se complete.