Información general acerca de los formatos de archivo XML en Office 2010

 

Se aplica a: Office 2010

Última modificación del tema: 2016-11-29

Microsoft Office 2010 y 2007 Microsoft Office system admiten formatos robustos de archivo XML que simplifican el intercambio de datos entre las aplicaciones de Office y los sistemas de negocios de las empresas. Basados en estándares abiertos, estos formatos de archivo XML permiten la creación rápida de documentos de distintos orígenes de datos y aceleran el ensamblaje de documentos, la minería de datos y reutilización de contenido.

2007 Office System admite el estándar de formatos Office Open XML ECMA-376 que posteriormente fue enviado a ISO/IEC y publicado hacia fines del 2008 como el estándar de formatos ISO/IEC 29500. Office 2010 proporciona compatibilidad de lectura para ECMA-376, compatibilidad de lectura y escritura para ISO/IEC 29500 Transitional y compatibilidad de lectura y escritura para ISO/IEC 29500 Strict.

La documentación sobre los formatos Office Open XML ISO/IEC 29500 está disponible en ISO/IEC y la documentación para ECMA-376 está disponible en Ecma International. Para obtener información detallada acerca de cómo se admiten estos formatos en Office 2010 y 2007 Office System, vea los documentos de formatos de archivo de Microsoft Office (https://go.microsoft.com/fwlink/?linkid=191143\&clcid=0xC0A) en MSDN.

En este artículo:

  • Ventajas de los formatos Open XML

  • Estructura de los formatos Open XML

Ventajas de los formatos Open XML

Los formatos Open XML ofrecen varias ventajas para los desarrolladores, profesionales de TI y usuarios; dichas ventajas incluyen:

  • Formato de archivo compacto   los documentos se comprimen automáticamente y se vuelven hasta un 75% más pequeños.

  • Recuperación mejorada de archivos dañados   el almacenamiento de datos modulares permite que se abran los archivos incluso cuando un componente dentro del archivo, como un gráfico o una tabla, está dañado.

  • Documentos más seguros   el código incrustado, por ejemplo los objetos OLE o el código de Microsoft Visual Basic para Aplicaciones (VBA), se almacena en una sección aparte dentro del archivo de forma que pueden identificarse fácilmente para procesamientos especiales. Los administradores de TI pueden bloquear los documentos que contienen macros o controles no deseados. Esto ayuda a hacer que los documentos sean más seguros cuando los usuarios los abren.

  • Integración más simple   los desarrolladores tienen acceso directo a contenido específico dentro del archivo, como gráficos, comentarios y metadatos de documentos.

  • Transparencia y seguridad de la información mejoradas   los documentos se pueden compartir confidencialmente porque los datos personales y la información confidencial de negocios, por ejemplo nombres de usuario, comentarios, control de cambios y rutas de acceso de archivo, pueden identificarse y eliminar fácilmente.

  • Compatibilidad   al instalar el paquete de compatibilidad de Microsoft Office, los usuarios de las ediciones de Microsoft Office 2000, Microsoft Office XP y Microsoft Office 2003 pueden abrir, editar y guardar documentos en uno de los nuevos formatos XML.

Estructura de los formatos Open XML

La estructura básica de los formatos Open XML está conformada por los siguientes cinco elementos que se describen con más detalle en las secciones a continuación.

  • Parte inicial   La parte de más alto nivel en la jerarquía.

  • Partes XML   Archivos o carpetas que se componen de XML y que conforman el contenido del archivo.

  • Partes que no son XML   Partes que no son XML y generalmente son imágenes u objetos OLE.

  • Parte de la relación   Un tipo de parte que generalmente señala a otras partes para definir la jerarquía relacional de la estructura de partes.

  • Paquete ZIP   Agrupa elementos en un solo archivo.

Parte inicial

La parte inicial, una parte XML que es una parte de la relación y se podría considerar la parte de orden de mayor nivel, determina el tipo de archivo. Por ejemplo, si el nombre del contenedor principal es WordDoc, la extensión de nombre de archivo es .docx.

Partes XML

Cuando se guarda un archivo de Office con formato XML en Office 2010 o en 2007 Office System, el archivo se divide en un conjunto de partes lógicas que describe todo el archivo. Para Microsoft Word, dividir el archivo en estas partes permite que éste se pueda consultar o modificar fácilmente fuera de la aplicación de Office original.

Por ejemplo, resulta más fácil para un desarrollador quitar las propiedades de un documento de un archivo ya que las propiedades se colocan en una parte única que se puede eliminar desde el contenedor de documentos mediante la eliminación de la parte. Con WordprocessingML (proporcionado como un formato de archivo XML opcional en Office 2003), la eliminación de comentarios implica analizar todo el archivo para buscar y quitar el código XML que representa el contenido del comentario. Con el nuevo formato de archivo, los datos relacionados con la característica se dividen en partes. Los vínculos, comentarios, encabezados, pies de página y demás datos están en partes separadas que se pueden quitar. No necesita analizar todo el documento de Word.

Partes que no son XML

Las partes que no son XML generalmente son imágenes y objetos OLE. Cualquier tipo de archivo que usa el contenido binario o no usa XML se identifica por no ser XML. Una parte que no es XML por lo general es un archivo adjunto a un documento o incrustado en él. La documentación del esquema de formato XML en Word XML explica la relación literal y la jerarquía de esquema usada por Word para archivos de este tipo.

Parte de relación

Una parte de relación es una parte XML que señala a otras partes y define la jerarquía relacional de las partes. La mayoría de las partes XML de alto nivel son partes de relación. Las partes XML que contienen datos y no señalan a otras partes son también conocidas como primitivas y por lo general tienen un tipo de contenido de application/xml.

Paquete ZIP

El uso de un paquete ZIP proporciona las siguientes ventajas en todas las aplicaciones:

  • Estándar abierto   el algoritmo de compresión ZIP es un estándar abierto bien definido.

  • Tamaño de archivo reducido   Los archivos son generalmente más pequeños que un archivo binario equivalente. En promedio, los archivos Open XML de Word son un 75 por ciento más pequeños que sus equivalentes binarios, según la cantidad de imágenes.

  • Mayor solidez   Los archivos son más robustos y menos sensibles a potenciales errores en el archivo. Los archivos anteriores requerían que el archivo estuviese completamente intacto para funcionar correctamente.

Si bien el uso de un paquete ZIP significa que el archivo es binario, el conjunto de interfaz programación de aplicaciones (API) WinFX ofrece compatibilidad nativa para el formato de paquete en el espacio de nombres System.IO.Packaging. Esto permite a los programadores crear herramientas que procesen el formato y trabajen directamente con el modelo lógico (las partes) sin tener que considerar la expansión o compresión del paquete.