Présentation des formats de fichier Open XML Microsoft Office (2007)

Par Frank Rice, Microsoft Corporation

Mai 2006

Lire cet article en anglais 

Concerne :
Suites Microsoft Office 2007
Microsoft Office Excel 2007
Microsoft Office PowerPoint 2007
Microsoft Office Word 2007

Résumé : Découvrez les avantages des formats Open XML de Microsoft Office (2007). Les utilisateurs peuvent échanger des données entre les applications Office et les systèmes d'entreprise en utilisant les technologies XML et ZIP. Les documents sont accessibles de manière universelle. En outre, vous réduisez le risque de fichiers endommagés. (26 pages imprimées)

*

Sur cette page

Introduction Introduction
Nouveaux scénarios de format de fichier Nouveaux scénarios de format de fichier
Avantages des nouveaux formats de fichiers Avantages des nouveaux formats de fichiers
Glossaire des formats Open XML Glossaire des formats Open XML
Structure des formats Office XML Formats Structure des formats Office XML Formats
Développement de solutions à l'aide des formats Office XML Formats Développement de solutions à l'aide des formats Office XML Formats
Utilisation des nouveaux formats de fichier dans les produits Office Utilisation des nouveaux formats de fichier dans les produits Office
Modification des fichiers Office XML Formats afin de personnaliser l'interface utilisateur Ruban Modification des fichiers Office XML Formats afin de personnaliser l'interface utilisateur Ruban
Conclusion Conclusion
Ressources supplémentaires Ressources supplémentaires

Introduction

Après l'apparition du langage XML dans les années 90, les clients professionnels ont commencé à comprendre la valeur ajoutée liée à l'adoptation de formats ouverts et de la normalisation dans les produits et applications qu'ils utilisaient. Les professionnels de l'informatique ont tiré parti du format de données XML en raison de sa capacité à être lu par les applications, les plates-formes et les navigateurs Internet.

De la même façon, avec l'adoption de la prise en charge du langage XML dans Microsoft Office 2000, les développeurs ont commencé à comprendre la nécessité de passer des formats de fichier binaires des versions antérieures de Microsoft Office au format XML. Les fichiers binaires (.doc, .dot, .xls et .ppt files), qui ont été très utiles pendant des années pour le stockage et le transport des données, ne pouvaient plus répondre aux nouveaux défis tels que le déplacement facile de données entre des applications disparates, ainsi que la possibilité pour les utilisateurs de bénéficier d'une vue d'ensemble de ces données.

Le système Microsoft Office 2007 poursuit cette transition en adoptant un format de fichier basé sur XML pour Microsoft Office Excel 2007, Microsoft Office Word 2007 et Microsoft Office PowerPoint 2007. Le nouveau format de fichier, appelé formats Microsoft Office Open XML (formats Office XML), répond à ces problèmes avec des modifications qui affectent la façon dont vous approchez les solutions basées sur les documents Microsoft Office.

Les nouveaux formats améliorent la gestion des fichiers et des données, la récupération des données, ainsi que l'interopérabilité avec les systèmes métier. Ils étendent les possibilités des fichiers binaires des versions antérieures. Toute application prenant en charge XML peut accéder aux données au nouveau format et les utiliser. L'application n'a pas besoin de faire partie du système Microsoft Office, ni même d'un produit Microsoft. Les utilisateurs peuvent également employer des transformations standard pour extraire ou réutiliser les données. En outre, les problèmes de sécurité sont considérablement réduits, car les informations sont stockées au format XML, c'est-à-dire pour l'essentiel en texte brut. Par conséquent, les données peuvent transiter sans problème via les pare-feu d'entreprise.

Remarque : Ne confondez pas Office XML Formats avec le format Microsoft Windows XPS (XML Paper Specification. Les formats Office XML Formats utilisent les conventions Open Packaging, également utilisées par la spécification XPS (XML Paper Specification). En revanche, les formats diffèrent sur plusieurs points importants. Le format XPS est un format de document paginé fixe introduit dans le système d'exploitation Microsoft Windows Vista. Les formats Office XML Formats sont des formats de fichier totalement modifiables pour Office Word 2007, Office Excel 2007 et Office PowerPoint 2007. Bien qu'ils partagent des similitudes dans leur utilisation de XML et de la compression ZIP, la conception du format de fichier et l'utilisation prévue sont différentes.

Nouveaux scénarios de format de fichier

Les formats Office XML Formats changent la façon dont les clients utilisent les données. Prenez l'exemple des scénarios suivants, désormais possibles avec les nouveaux formats de fichier :

  • Un processus côté serveur peut lire l'un des éléments d'une archive ZIP sans avoir à les extraire tous. Par exemple, vous pouvez extraire uniquement le fichier XML contenant les données du document, sans ouvrir les fichiers contenant la mise en forme, les propriétés et autres informations concernant le document.

  • Dans la plupart des scénarios, le nouveau conteneur de fichier est transparent pour l'utilisateur. Il ressemble à un fichier de document binaire typique. Cependant, le nouveau document au format XML est compressé et plus petit, ce qui facilite son envoi aux autres utilisateurs par courrier électronique ou sur d'autres supports.

  • Les analyseurs antivirus et les applications serveur peuvent facilement extraire le conteneur afin d'afficher uniquement les éléments directement affectés, sans se soucier de la corruption du conteneur ou de son contenu

  • Les fichiers enregistrés dans le nouveau format de fichier ne peuvent pas contenir de code de macro exécutable. Cela ne concerne pas les fichiers utilisant les macros, sujet étudié plus loin dans cet article. Ils sont dont considérés comme « sûrs » et peuvent transiter via les pare-feu et être envoyés par l'intermédiaire d'applications de courrier électronique sans problèmes de sécurité. Ce comportement est mis en oeuvre par les applications Microsoft Office. Si une partie de macro est ajoutée à un document au format Office XML, Office empêche l'ouverture du document.

    Remarque : Certaines applications ZIP vous permettent de créer des fichiers cryptés. Le nouveau format de fichier ne crée pas de fichiers cryptés. Si vous tentez de lire un fichier crypté, la lecture du fichier cesse et une erreur est renvoyée.

  • Si un élément du conteneur est corrompu, les autres éléments restent disponibles. Par exemple, si un utilisateur tente d'ouvrir un fichier créé à partir d'un disque endommagé et que le fichier est corrompu, le mécanisme de récupération de fichiers d'Office recrée le répertoire central et récupère totalement le contenu du fichier

  • Les développeurs Office peuvent utiliser des interfaces API (Application Programming Interface) Microsoft WinFX pour créer un fichier XPS valide. Ces API permettent aux solutions d'interagir avec le contenu du nouveau format de fichier. Les développeurs Office peuvent également utiliser les API pour ouvrir une archive ZIP créée par une autre application ZIP, en supposant qu'elle n'utilise pas l'une des fonctionnalités ZIP non prises en charge par Office.

    Remarque : Microsoft Office crée des fichiers conformes aux conventions Open Packaging pouvant être lus par les API WinFX et, à l'inverse, WinFX peut créer des packages que vous pouvez ouvrir à l'aide des applications Microsoft Office. Les API WinFX fonctionnent avec les versions antérieures de Microsoft Windows, notamment les suivantes : Microsoft Windows Vista, Microsoft Windows Server 2003 et Microsoft Windows XP. En outre, des convertisseurs sont disponibles pour Microsoft Office 2000, Microsoft Office XP et Microsoft Office 2003.

Le nouveau format de fichier change également la façon dont les utilisateurs Office utilisent les applications au quotidien. Les scénarios suivants illustrent comment le nouveau format change la façon de travailler avec Office 2007 :

  • Howard, un utilisateur curieux, constate que le nouveau conteneur de format de fichier d'Office 2007 est un fichier ZIP. Howard souhaite comprendre cela, il ouvre donc l'un des documents créés dans Word 2007 avec une application ZIP. Il voit des fichiers se présentant comme des documents XML, et quelques images correspondant à ce qu'il a vu dans le document d'origine. Intrigué, Howard ouvre l'un des fichiers XML dans le Bloc-notes afin de voir le type de code XML généré par le fichier Word. Satisfait de la facilité avec laquelle il peut accéder au contenu du document, il ferme le Bloc-notes et l'application ZIP, puis il rouvre le fichier dans Word afin de continuer à travailler sur le document.

  • Jan doit changer une propriété de son document Word 2007. Elle ouvre le fichier au nouveau format dans un produit ZIP, extrait l'élément XML contenant les propriétés du document, apporte la modification, puis rajoute l'élément au conteneur, avant de l'enregistrer et de le fermer. Elle ouvre ensuite le document dans Word et constate que tout son contenu s'y trouve et que seule la propriété modifiée a changé.

  • Le logo d'une entreprise de consulting a changé afin de refléter sa nouvelle mission. Le département informatique est chargé de changer le logo dans les milliers de documents actuellement stockés sur le serveur. Dans les versions antérieures de Microsoft Office, il était nécessaire soit d'ouvrir chaque document individuellement et de remplacer l'ancien logo par le nouveau, soit de créer et de tester une application personnalisée complexe afin d'automatiser cette tâche. Avec le nouveau format de fichier, le département informatique crée un processus batch qui explore la structure des fichiers afin de localiser le graphique dans le dossier des images (le même pour chaque document), puis il le remplace par le nouveau. Lorsque le document est ouvert, le nouveau logo s'affiche automatiquement.

  • Un cabinet de juristes doit protéger la confidentialité de ses données client et de ses propres données. L'entreprise sait que les documents, y compris ceux créés dans Word, contiennent diverses propriétés, dont certaines sont visibles et d'autres masquées dans le document. Certaines de ces propriétés peuvent contenir des informations sensibles et confidentielles. Par l'intermédiaire d'essais, l'entreprise a créé une procédure permettant de supprimer ces informations. Cependant, le processus prend du temps et, dans la mesure où il nécessite que l'utilisateur suive scrupuleusement la procédure, des erreurs sont possibles. Avec le nouveau format de fichier, le département informatique développe un simple processus batch qui parcourt la structure des dossiers afin de supprimer les parties ciblées du package. L'entreprise a désormais la certitude que toutes les informations sensibles et confidentielles sont supprimées du document.

  • Denise apporte les derniers changements à son rapport de doctorat. Après l'ajout de la bibliographie, elle se prépare à l'enregistrement final. L'enregistrement est interrompu prématurément et elle voit avec horreur un message indiquant que le document semble corrompu. Une fois passé le choc, Denise se souvient qu'elle utilise le nouveau format de fichier. Elle importe le texte dans un nouveau document, réassocie les images, puis inclut la mise en forme et le style afin de recréer le document. Elle enregistre ensuite le nouveau document.

  • Elizabeth est une utilisatrice de Windows 2000 qui utilise Office 2000 avec le convertisseur inclus dans la version Office 2007. Elle peut ouvrir un document au format Word XML. En outre, elle peut modifier le document et le réenregistrer en tant que document au nouveau format, car les convertisseurs prennent en charge l'ouverture et l'enregistrement.

Avantages des nouveaux formats de fichiers

Les nouveaux formats Office XML Formats introduisent un certain nombre d'avantages qui aident non seulement les développeurs et les solutions qu'ils créent, mais également les utilisateurs et organisations individuels de toutes tailles.

Voici quelques-uns des avantages complémentaires des formats Office XML Formats :

  • Intégration facile d'informations métier dans les documents. Les formats Office XML Formats permettent la création rapide de documents à partir de sources de données disparates, accélérant ainsi l'assemblage des documents, l'extraction des données et la réutilisation du contenu. L'échange de données entre les applications Office et les systèmes d'entreprise est simplifiée. En outre, vous pouvez modifier les informations d'un document Office ou en créer un à partir des composantes du document sans utiliser l'application Office. Les employés peuvent améliorer la productivité en publiant, en recherchant et en réutilisant les informations plus rapidement et plus précisément dans l'application de leur choix, dès lors qu'elle prend en charge la lecture et l'écriture du format XML.

  • Ouvert et gratuit. Les formats Office XML Formats sont basés sur les technologies XML et ZIP et sont donc accessibles de manière universelle. La spécification des formats et schémas sera publiée et rendue disponible sous la même licence gratuite que celle qui existe aujourd'hui pour les schémas de référence Microsoft Office 2003, ouverte et disponible pour une utilisation étendue.

  • Interopérable. Le langage standard XML étant au coeur des formats Office XML Formats, l'échange de données entre les applications Microsoft Office et les systèmes d'entreprise est simplifié. Sans nécessiter d'accès aux applications Office, les solutions peuvent modifier les informations au sein d'un document Office ou créer un document en utilisant des outils et technologies standard capables de manipuler du code XML. Les nouveaux formats vous permettent de créer des archives de documents sans utiliser de code Office.

  • Robuste. Les formats Office XML Formats sont conçus pour être plus robustes que les formats binaires, contribuant ainsi à limiter les risques de pertes d'informations suite à des fichiers endommagés ou corrompus. Même les documents créés ou modifiés en dehors d'Office risquent moins d'être corrompus, car les applications Office sont conçues pour récupérer les documents de manière plus fiable avec les nouveaux formats. À mesure de l'augmentation du nombre de documents qui transitent sous forme de pièces jointes ou sur supports amovibles, le risque d'une défaillance du réseau ou du stockage accroît la possibilité de corruption d'un document.

    Les nouveaux formats de fichier améliorent la récupération de données en segmentant et en stockant séparément chaque partie dans le package de fichier. Cela permet aux entreprises de réaliser d'importantes économies en termes de temps et d'argent consacrés à la récupération des données perdues. Lorsqu'un composant d'un fichier est corrompu, le reste du fichier peut toujours être ouvert dans l'application. Par exemple, si un graphique est endommagé, cela n'empêche pas le client d'ouvrir les autres parties du document, sans le graphique. En outre, les applications Office peuvent détecter ces défaillances et tenter de réparer un document sans l'ouvrir en restaurant la structure de données du document.

  • Efficace. Les formats Office XML Formats utilisent des technologies de compression et ZIP pour stocker les documents. Un avantage significatif des nouveaux formats est leur taille nettement inférieure, jusqu'à 75 % plus petits que les documents binaires comparables. Il s'agit là d'un des avantages de la combinaison de code XML et des technologies ZIP pour le stockage des fichiers. Dans la mesure où XML est un format texte qui peut très facilement être compressé, et où le conteneur ZIP prend en charge la compression du contenu, les utilisateurs obtiennent des fichiers dont la taille est fortement réduite. Ce type de compression de fichier permet des économies substantielles, car il réduit l'espace disque requis pour stocker les fichiers et limite la bande passante nécessaire pour transporter les fichiers par courrier électronique, via des réseaux et sur le Web.

  • Sécurisé. Le caractère ouvert des formats Office XML Formats se traduit par des fichiers plus sûrs et plus transparents. Vous pouvez partager les documents en toute confiance, car vous pouvez facilement identifier et supprimer les informations personnelles et sensibles, telles que les noms des utilisateurs, les commentaires et les chemins de fichiers. De la même façon, vous pouvez identifier les fichiers avec du contenu, par exemple les objets OLE ou le code Microsoft VBA (Visual Basic for Applications), en vue d'un traitement spécial. Les formats de fichier permettent également d'améliorer la sécurité par rapport aux documents avec du code intégré ou des macros. Par défaut, les nouveaux formats de fichier Word 2007, Excel 2007 et PowerPoint 2007 n'exécutent pas le code intégré. Par conséquent, si une personne reçoit un message électronique avec un document Word en pièce jointe, il peut ouvrir le document en sachant qu'il n'exécutera pas de code malveillant. Les formats Office XML Formats incluent un format spécial avec une extension distincte pour les fichiers avec du code intégré, ce qui permet au personnel informatique d'identifier rapidement les fichiers contenant du code.

  • Compatibilité descendante. Le système Microsoft Office 2007 bénéficie d'une compatibilité descendante avec les versions antérieures suivantes : Microsoft Office 2000, Microsoft Office XP et Microsoft Office 2003. Les utilisateurs de ces versions peuvent adopter facilement le nouveau format et continuer d'utiliser les fichiers existants. En particulier, ils peuvent continuer d'utiliser les anciens formats binaires .doc, .xls et .ppt, lesquels sont totalement compatibles avec le format de fichier 2007. Les utilisateurs des versions antérieures d'Office peuvent télécharger une mise à jour gratuite leur permettant d'ouvrir et de modifier les fichiers au nouveau format à partir de leurs versions antérieures. Les utilisateurs qui installent la version Office 2007 peuvent définir le format de fichier par défaut. Cela permet de garantir que les utilisateurs peuvent continuer d'utiliser les solutions tierces basées sur les versions antérieures, et collaborer avec les collègues, fournisseurs, clients et autres utilisateurs ayant procédé à la mise à niveau.

Glossaire des formats Open XML

La liste suivante définit les termes utilisés dans cet article et dans le contenu associé :

  • API : Ensemble de fonctions ou de méthodes utilisées pour accéder aux fonctionnalités d'un logiciel. API est l'acronyme de Application Programming Interface.

  • Convertisseurs : Outils grauits permettant d'ouvrir dans les versions antérieures d'Office les fichiers créés au format Office XML Formats.

    Remarque : Les convertisseurs lisent, respectent et appliquent la protection de gestion des droits (IRM, Information Rights Management) des documents. Un document incluant une protection IRM reste protégé, que le destinataire utilise la version Office 2007 ou une version antérieure.

  • Compatibilité ascendante : Possibilité pour une version plus ancienne d'une application d'ouvrir des fichiers d'une version plus récente en ignorant les fonctionnalités qui ne sont pas implémentées dans l'ancienne version. Par exemple, Word 2003 bénéficie d'une compatibilité ascendante avec Word 2007, car il peut ouvrir les fichiers Word 2007 avec un convertisseur.

  • Formats Office Open XML : Structure de blocs et de relations utilisée pour composer, packager, distribuer et afficher le contenu des documents. Ces blocs définissent un environnement indépendant de la plate-forme pour les formats de document, permettant aux applications logicielles de générer, d'échanger et d'afficher les documents de manière fiable et cohérente.

  • Package : Conteneur ZIP contenant les composants (parties) du document, tel que défini par la spécification Open Packaging Conventions.

  • Partie : Correspond à un fichier du package. Par exemple, si un utilisateur clique avec le bouton droit sur un fichier Excel 2007 et choisit de l'extraire, il voit des fichiers, par exemple un fichier classeur.xml et plusieurs fichiers feuillen.xml. Chacun de ces fichiers est une partie du package.

  • Relations : Méthode utilisée pour spécifier la façon dont les parties sont assemblées afin de constituer un document. Cette méthode spécifie la connexion entre une partie source et une ressource cible. Les relations sont stockées dans les parties XML (par exemple /_rels/.rels) dans le package du document.

  • XML : Le langage XML (Extensible Markup Language) est un format texte simple et flexible conçu pour la publication électronique et l'échange d'un large éventail de données via Internet ou d'autres moyens.

  • ZIP : Format de compression standard utilisé pour stocker et transporter des fichiers entre des ordinateurs, par courrier électronique ou via Internet.

Structure des formats Office XML Formats

Le nouveau conteneur de format de fichier est basé sur la spécification du format de fichier ZIP compressé, simple et basé sur les parties. L'utilisation de schémas de référence XML et d'un conteneur ZIP est au coeur des nouveaux formats de fichier Office XML Formats. Chaque fichier est constitué d'un ensemble de parties ; cet ensemble définit le document.

Les parties d'un document sont stockées dans le fichier de conteneur ou dans le package au format ZIP standard. La plupart des parties sont des fichiers XML qui décrivent les données de l'application, les métadonnées et même les données client, stockées dans le fichier conteneur. D'autres parties non XML peuvent également être incluses dans le package du conteneur, notamment des fichiers binaires représentant les images ou les objets OLE intégrés dans le document. En outre, il existe des parties de relation qui spécifient les relations entre les parties ; cette conception définit la structure d'un fichier Office. Tandis que les parties constituent le contenu du fichier, les relations décrivent la façon dont les éléments de contenu collaborent.

Il en résulte des fichiers au format XML pour les documents Office, étroitement intégrés, mais modulaires et hautement flexibles. Les quelques sections qui suivent décrivent en détail chaque composant des formats Office XML Formats. Elles décrivent également les applications Office avec le nouveau format de fichier.

Remarque : Pour comprendre la composition d'un fichier au format Office XML Formats, vous pouvez extraire un fichier. Pour ouvrir le fichier, vous pouvez utiliser une application ZIP, telle que WinZip de WinZip Computing Corporation.

Pour ouvrir un fichier XML Word 2007 :

  1. Créez un dossier temporaire dans lequel stocker le fichier et ses parties.

  2. Enregistrez un document Word 2007, contenant du texte, des images et d'autres éléments, en tant que fichier .docx.

  3. Ajoutez une extension .zip à la fin du nom du fichier.

  4. Double-cliquez sur le fichier. Il s'ouvre dans l'application ZIP. Vous pouvez voir les éléments qui constituent le fichier.

  5. Extrayez les parties dans le dossier créé précédemment.

Package ZIP

De nombreux éléments interviennent dans la création d'un document Microsoft Office. Certains sont partagés par toutes les applications Office, par exemple les propriétés des documents, les feuilles de style, les graphiques, les liens hypertextes, les schémas et les dessins. D'autres éléments sont propres à chaque application, par exemple les feuilles de calcul dans Excel, les diapositives dans PowerPoint ou les en-têtes et pieds de page dans Word.

Lorsque les utilisateurs enregistrent un document avec Office 2003 ou les versions antérieures de Microsoft Office, un fichier unique est écrit sur le disque, que vous pouvez facilement ouvrir. Cette métaphore est importante pour la façon dont les documents sont stockés, gérés et partagés en pratique. En encapsulant les parties individuelles d'un fichier Microsoft Office 2007 dans un conteneur ZIP, un document reste une instance de fichier unique. L'utilisation d'un fichier de package unique pour représenter un document unique signifie que les utilisateurs emploient les fichiers de la même façon qu'avec les versions Office antérieures lors de l'enregistrement et de l'ouverture de documents Office (2007). Ils peuvent continuer de travailler avec un fichier unique.


Figure 1. Le conteneur de format de fichier dans la version 2007

Avec les versions antérieures d'Office, les développeurs qui souhaitaient manipuler le contenu d'un document Office devaient savoir comment lire et écrire les données en fonction du stockage structuré défini dans le fichier binaire. Ce processus était complexe, en particulier parce que les formats de fichier binaire Office étaient conçus pour être accessibles principalement par l'intermédiaire d'applications Office. Les formats reflétaient les structures en mémoire des applications et pouvaient s'exécuter sur des ordinateurs avec peu de mémoire et des disques durs lents. En outre, la modification des fichiers binaires Office par programmation sans les applications Office constituait une cause majeure de corruption de fichiers. Cela dissuadait certains développeurs de toute tentative de modification des fichiers.

Le format ZIP a été choisi comme format de package des formats Office XML Formats, car il s'agit d'une norme bien comprise. Il existe aujourd'hui de nombreux outils permettant d'utiliser le format ZIP, et l'utilisation de ce format offre une structure flexible et modulaire permettant l'extension des fonctionnalités. Par conséquent, vous avez accès à l'ensemble du contenu des documents Microsoft Office 2007 en utilisant l'un des nombreux outils permettant de travailler avec les fichiers ZIP. Une fois que vous avez ouvert un fichier conteneur, vous pouvez manipuler n'importe quelles parties du package qui définissent le document. Par exemple, vous pouvez ouvrir un document Word 2007 qui utlise les formats Office XML Formats, localiser la partie XML qui représente le corps du document Word, modifier cette partie via n'importe quelle technologie capable de modifier le code XML, puis réintégrer la partie XML dans le package du conteneur afin de créer un document Office mis à jour.

Parties

Dans un package au format Office XML Formats, de nombreuses parties logiques du fichier sont stockées sous forme de fichiers ou de parties individuel(le)s. Cette modularité est l'une des caractéristiques importantes du format de fichier. La modularité vous permet de localiser rapidement une partie spécifique et de travailler directement avec seulement cette partie. Vous pouvez modifier, échanger ou même supprimer des parties de documents en fonction du résultat préféré d'un besoin métier spécifique.

Toutes les applications Office partagent certains types de parties, par exemple les parties miniature, métadonnées, média et relations. D'autres constituent une partie spécifique de tous les fichiers, par exemple les propriétés des documents. De nombreuses parties sont en revanche propres au type de document qu'elles représentent. Par exemple, une partie feuille de calcul se trouve uniquement dans un document Excel, tandis qu'une partie maître de diapositive apparaît uniquement dans un document PowerPoint.

Il est important de noter que, à part quelques exceptions définies dans les conversions Open Packaging Conventions, la structure réelle du répertoire des fichiers est arbitraire. Les relations des fichiers dans le package, et non la structure des fichiers, sont ce qui détermine la validité des fichiers. Vous pouvez réorganiser et renommer les parties d'un fichier au format Office (2007) XML dans son conteneur ZIP, dès lors que vous mettez correctement à jour les relations de sorte que les parties du document continuent d'être liées les unes aux autres. Si les relations sont correctes, le fichier s'ouvre sans erreur. La structure de fichiers initiale d'un fichier au format Office XML Formats est la structure par défaut créée. Cette structure par défaut vous permet de déterminer facilement la composition des fichiers Office XML Formats. Dès lors que vous maintenez les relations actuelles, vous pouvez changer cette structure de fichiers par défaut. Pour plus d'informations, reportez-vous à l'article (en anglais) Walkthrough: Word 2007 XML Format (Procédure : Format de fichier Word 2007 Open XML).

Les parties peuvent être de différents types de contenu. Les parties utilisées pour décrire les données des applications Microsoft Office sont stockées au format XML. Ces parties sont conformes au schéma de référence XML qui définit la fonctionnalité ou l'objet Office associé. Par exemple, dans un fichier Excel 2007, les données qui représentent une feuille de calcul se trouvent dans une partie XML qui adhère au schéma Office d'une feuille de calcul Excel. En outre, s'il y a plusieurs feuilles de calcul dans le classeur, une partie XML est stockée dans le fichier de package pour chaque feuille de calcul. Tous les schémas qui représentent les parties par défaut des documents Office seront totalement documentés et mis à disposition par Microsoft sous une licence libre. Ensuite, avec n'importe quelle technologie basée sur XML, vous pouvez appliquer vos connaissances des schémas Office pour analyser et créer facilement des documents Microsoft Office 2007.

Dans de nombreux scénarios, il est avantageux de stocker les parties dans leur type de contenu natif. Ces parties ne sont pas stockées au format XML. Les images d'un document Office 2007, par exemple, sont stockées sous forme de fichiers binaires (.png, .jpg et autres) dans le package du document. Par conséquent, vous pouvez ouvrir le conteneur du package en utilisant une application ZIP et afficher, modifier ou remplacer immédiatement l'image dans son format natif. Non seulement cette approche du stockage est plus accessible, mais elle nécessite également moins de traitement interne et d'espace disque que le stockage d'une image au format XML encodé. D'autres parties notables stockées sous forme de parties binaires sont les projets VBA et les objets OLE intégrés. Les objets OLE intégrés ne sont binaires que si le serveur OLE associé offre uniquement une représentation binaire. Les documents intégrés à Microsoft Office 2007, par exemple, intègrent leur contenu sous un autre package. Pour les développeurs, l'accessibilité rend les scénarios plus attractifs. Par exemple, vous pouvez créer une solution qui itère une collection de documents Microsoft Office 2007 afin de mettre à jour un objet OLE existant avec une version plus récente. Vous pouvez effectuer cela, ainsi qu'un certain nombre d'autres opérations, sans avoir à utiliser les applications Office ou à modifier le code XML propre au document. Les sections suivantes décrivent certaines parties communes à tous les produits prenant en charge les formats Office XML Formats. Les types et nombres des parties dépendent de l'application qui crée le fichier conteneur ZIP. Par exemple, Word 2007 crée des parties liées au document, mais PowerPoint 2007 crée des parties liées aux diapositives.

Dossier _rels

Ce dossier contient un fichier .rels qui réfinit les relations racine dans le package. Il s'agit du point de départ pour analyser le package.

Fichier .rels

Contient les relations basées sur la partie de départ (la partie de départ virtuelle). Les relations sont définies avec le format suivant :

        <Relationship Id="someID" Type="relationshipType" Target="targetPart"/>
      

Id est une chaîne quelconque, sous réserve qu'elle soit unique dans le fichier .rels.

Type : Type de la relation, qui distingue les relations les unes des autres et offre un conseil concernant l'objectif de la relation. Il pointe vers le schéma qui définit les types Office XML Formats.

Target: Pointe vers le dossier et le fichier contenant la cible de la relation (une autre partie).

Tableau 1. Types de relation

Types de relation intégrés

          http://schemas.microsoft.com/office/2006/relationships/officeDocument
          http://schemas.microsoft.com/office/2006/relationships/vbaProject
          http://schemas.microsoft.com/office/2006/relationships/userXmlData
          http://schemas.microsoft.com/office/2006/relationships/hyperlink
          http://schemas.microsoft.com/office/2006/relationships/styleSheet
          http://schemas.microsoft.com/office/2006/relationships/comments
          http://schemas.microsoft.com/office/2006/relationships/oleObject
          http://schemas.microsoft.com/office/2006/relationships/e2Object
          http://schemas.microsoft.com/office/2006/relationships/e1Object
          http://schemas.microsoft.com/office/2006/relationships/image
          http://schemas.microsoft.com/office/2006/relationships/sound
          http://schemas.microsoft.com/office/2006/relationships/movie
          http://schemas.microsoft.com/office/2006/relationships/slide
          http://schemas.microsoft.com/office/2006/relationships/layout
          http://schemas.microsoft.com/office/2006/relationships/notesslide
          http://schemas.microsoft.com/office/2006/relationships/slidemaster
          http://schemas.microsoft.com/office/2006/relationships/glossaryDoc
          http://schemas.microsoft.com/office/2006/relationships/cfChunk
          http://schemas.microsoft.com/office/2006/relationships/dataStoreItem
          http://schemas.microsoft.com/office/2006/relationships/embeddedFont
          http://schemas.microsoft.com/office/2006/relationships/embeddedMetroObject
          http://schemas.microsoft.com/office/2006/relationships/chart
          http://schemas.microsoft.com/office/2006/relationships/activeXControl
          http://schemas.microsoft.com/office/2005/relationships/diagram
          http://schemas.microsoft.com/office/2005/relationships/diagramData
          http://schemas.microsoft.com/office/2005/relationships/diagramStyle
          http://schemas.microsoft.com/office/2005/relationships/diagramColorTrans
          http://schemas.microsoft.com/office/2005/relationships/diagramDefinition
          http://schemas.microsoft.com/package/2005/02/md/core-properties
          http://schemas.microsoft.com/office/2006/relationships/docPropsApp
          http://schemas.microsoft.com/office/2006/relationships/docPropsCustom
          http://schemas.microsoft.com/office/2006/relationships/documentThumbnail
          http://schemas.microsoft.com/office/2006/relationships/glossaryDoc

Partie principale du document

La cible de la relation http://schemas.microsoft.com/office/2006/relationships/officeDocument est la partie principale qui définit le document (partie présentation pour PowerPoint, partie classeur pour Excel et partie document pour Word). Toutes les autres relations sont basées sur la partie document principale.

Dossier Application (tel que Word)

Contient des fichiers de composant de document propres à l'application, tels que (pour Word) :

  • wordDocument.xml: Contient les données (texte) du document, ainsi que les styles et les paramètres de police.

  • footer.xml: Contient des informations sur les pieds de page du document, par exemple la page sur laquelle ils se trouvent et certaines informations relatives aux styles.

  • header.xml: Contient des informations semblables à celles du fichier footer.xml, mais concernant les en-têtes.

  • wordDocument.doc: Copie du document original.

  • styles.xml: Contient des informations sur les styles trouvés dans le document, par exemple les tailles des polices, les styles de tableau et les listes à puce.

Fichier audio

Contient n'importe quel fichier de type audio, par exemple .mid, .mp3 ou .wav.

Fichier Content_Types.xml

Fournit la liste des types de contenu pour les autres parties du package. Les types de contenu sont définis comme les types de parties pouvant être stockés dans un package :

Tableau 2. Types de contenu dans un conteneur ZIP

Types de contenu intégrés

application/vnd.ms.powerpoint.template.macroEnabled.12

application/x-font

application/vnd.ms-excel.12

application/x-font

application/vnd.ms-excel.addin.12

application/xml

application/vnd.ms-excel.binary.12

audio/aiff

application/vnd.ms-excel.macroEnabled.12

audio/basic

application/vnd.ms-excel.macroEnabledTemplate.12

audio/midi

application/vnd.ms-excel.template.12

audio/mp3

application/vnd.ms-metro.core-properties+xml

audio/mpegurl

application/vnd.ms-metro.relationships+xml

audio/wav

application/vnd.ms-office.activeX+xml

audio/x-ms-wax

application/vnd.ms-office.chart

audio/x-ms-wma

application/vnd.ms-office.vbaProject

image/bmp

application/vnd.ms-powerpoint.

image/gif

application/vnd.ms-powerpoint.macroEnabled.12

image/jpeg

application/vnd.ms-powerpoint.main.12+xml

image/png

application/vnd.ms-powerpoint.presentation.12

image/tiff

application/vnd.ms-powerpoint.show.12

image/xbm

application/vnd.ms-powerpoint.show.macroEnabled.12

image/x-icon

application/vnd.ms-powerpoint.template.12

video/avi

application/vnd.ms-word.document.12

video/mpeg

application/vnd.ms-word.document.macroEnabled.12

video/mpg

application/vnd.ms-word.document.macroEnabled.main+xml

video/x-ivf

application/vnd.ms-word.document.main+xml

video/x-ms-asf

application/vnd.ms-word.fontTable+xml

video/x-ms-asf-plugin

application/vnd.ms-word.listDefs+xml

video/x-ms-wm

application/vnd.ms-word.settings+xml

video/x-ms-wmv

application/vnd.ms-word.styles+xml

video/x-ms-wmx

application/vnd.ms-word.subDoc+xml

video/x-ms-wvx

application/vnd.ms-word.template.12

 

application/vnd.ms-word.template.macroEnabled.12

 

application/vnd.ms-word.template.macroEnabled.main+xml

 

application/vnd.ms-word.template.main+xml

 

Partie propriétés du document

Contient les propriétés essentielles du document, définies pour tous les fichiers conformes au format XPS, par exemple :

  • Auteur

  • Titre

  • Objet

  • Commentaires

  • Date de dernier enregistrement

  • Date de création

Relations

Les parties sont les éléments individuels qui constituent un document Office dans la version 2007. Les relations représentent la méthode utilisée pour spécifier la façon dont les parties sont assemblées afin de constituer un document. Vous utilisez du code XML pour définir les relations. Les relations spécifient la connexion entre une partie source et une ressource cible. Par exemple, vous pouvez identifier avec une relationnel la connexion entre une diapositive et une image qui apparaît sur cette diapositive. Les relations sont stockées dans des parties XML (ou « parties relations ») dans le conteneur de document. Si une partie source présente plusieurs relations, toutes les relations suivantes sont répertoriées dans la même partie relation XML.

Les relations jouent un rôle important dans Office XML Formats. Chaque partie d'un document est référencée par au moins une relation. L'utilisation de relations permet de découvrir la relation entre les parties sans avoir à examiner leur contenu. Dans les parties, toutes les références aux relations sont représentées avec un ID de relation qui permet à toutes les connexions entre les parties de rester indépendantes du schéma propre au contenu.


Figure 2. Diagramme de relation de haut niveau d'un classeur Excel 2007

Voici un exemple de partie relation dans un classeur Excel 2007 contenant deux feuilles de calcul :

        <Relationships xmlns="http://schemas.microsoft.com/package/2005/06/relationships">
        <Relationship ID="rId3"
        Type="http://schemas.microsoft.com/office/2005/8/relationships/xlStyles"
        Target="styles.xml"/>
        <Relationship ID="rId2"
        Type="http://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet"
        Target="worksheets/Sheet2.xml"/>
        <Relationship ID="rId1"
        Type="http://schemas.microsoft.com/office/2005/8/relationships/xlWorksheet"
        Target="worksheets/Sheet1.xml"/>
        <Relationship ID="rId5"
        Type="http://schemas.microsoft.com/office/2005/8/relationships/xlMetadata"
        Target="metadata.xml"/>
        <Relationship ID="rId4"
        Type="http://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings"
        Target="strings.xml"/>
        </Relationships >
      

Il est également important de noter que les relations représentent non seulement les références des documents internes, mais également les ressources externes. Par exemple, si un document contient des images ou objets liés, ils sont également représentés à l'aide de relations. Cela facilite la localisation, l'inspection et la modification des liens d'un document vers des sources externes. Il permet de réparer les liens externes rompus, de valider les sources non familières ou de supprimer les liens potentiellement malveillants.

Il est également important de noter que les relations représentent non seulement les références des documents internes, mais également les ressources externes. Par exemple, si un document contient des images ou objets liés, ils sont également représentés à l'aide de relations. Cela facilite la localisation, l'inspection et la modification des liens d'un document vers des sources externes. Il permet de réparer les liens externes rompus, de valider les sources non familières ou de supprimer les liens potentiellement malveillants.

Les relations vous permettent également de manipuler des documents sans avoir à connaître la syntaxe ou le balisage de contenu propre à l'application. Par exemple, sans connaissance de la programmation PowerPoint, un développeur peut facilement supprimer les diapositives externes d'une présentation via l'édition des relations du document.

Fichiers avec et sans macros

Les documents Microsoft Office 2007 par défaut enregistrés au format Office XML Formats sont des fichiers exempts de macros et ne peuvent donc pas contenir de code. Ce comportement permet de garantir que du code malveillant résidant dans un document par défaut ne pourra jamais être exécuté de manière imprévisible. Si les documents Microsoft Office 2007 peuvent toujours contenir et utiliser des macros, l'utilisateur ou le développeur doit en revanche enregistrer ces documents dans un type autorisant les macros. Cette protection n'affecte pas votre capacité à créer des solutions, mais elle permet aux organisations d'utiliser les documents plus en confiance.

Les fichiers autorisant les macros présentent le même format que les fichiers sans macros, mais ils contiennent des parties complémentaires. Ces parties dépendent du type d'automatisation du document. Un fichier autorisant les macros et utilisant du code VBA contient une partie binaire avec le projet VBA. N'importe quel classeur Excel utilisant des macros de type Excel 4.0 (macros XLM) ou n'importe quelle présentation PowerPoint contenant des boutons de commande est également enregistré(e) en tant que fichier autorisant les macros. Si une partie propre au code se trouve dans un fichier sans macros, par accident ou par malveillance, les applications Office n'autorisent pas l'exécution du code (et ce sans exception).

Vous pouvez désormais déterminer si un document Microsoft Office 2007 contient du code avant de l'ouvrir. Auparavant, cette information ne pouvait pas être obtenue facilement en dehors d'Office. Vous pouvez inspecter le fichier de package afin de déterminer l'existence de parties et relations basées sur le code sans exécuter Office et sans exécuter de code potentiellement risqué. Si un fichier semble suspect, vous pouvez supprimer du fichier les parties susceptibles d'exécuter du code, de sorte que ce code ne puisse pas occasionner de dommages.

Extensions de nom de fichier

Les documents Microsoft Office 2007 enregistrés au format Office XML Formats présentent de nouvelles extensions, qui permettent à Office de les distinguer des documents binaires utilisés par les versions antérieures d'Office. Les nouvelles extensions sont basées sur les extensions de nom de fichier binaire existantes, via l'ajout d'une lettre à la fin du suffixe. Les extensions par défaut des documents créés dans Word 2007, Excel 2007 et PowerPoint 2007 avec les nouveaux formats de fichier ajoutent la lettre « x » et sont donc respectivement .docx, .xlsx et .pptx. Les autres types de document Office utilisant les nouveaux formats de fichier (notamment les modèles, les compléments et les diaporamas PowerPoint) reçoivent également de nouvelles extensions.

Un autre changement introduit dans la version Office 2007 est l'existence d'extensions différentes pour les fichiers autorisant les macros, par rapport à ceux sans macros. Les documents autorisant les macros incluent une extension qui se termine par la lettre « m » au lieu de « x ». Par exemple, un document Word 2007 autorisant les macros présente l'extension .docm, ce qui permet aux utilisateurs ou applications de savoir qu'il contient du code, avant l'ouverture du document.

Tableau 3. Liste des extensions de noms de fichiers pour les types de documents dans la version Office 2007

Type de fichier Word 2007

Extension

Document XML Word 2007 .docx
Document XML Word 2007 autorisant les macros .docm
Modèle XML Word 2007 .dotx
Modèle XML Word 2007 autorisant les macros .dotm

Type de fichier Excel 2007

Extension

Classeur XML Excel 2007

.xlsx

Classeur XML Excel 2007 autorisant les macros

.xlsm

Modèle XML Excel 2007

.xltx

Modèle XML Excel 2007 autorisant les macros

.xltm

Classeur binaire Excel 2007

.xlsb

Complément XML Excel 2007 autorisant les macros

.xlam

Type de fichier PowerPoint 2007

Extension

Présentation XML PowerPoint 2007 .pptx
Présentation XML PowerPoint 2007 autorisant les macros .pptm
Modèle XML PowerPoint 2007 .potx
Modèle XML PowerPoint 2007 autorisant les macros .potm
Complément XML PowerPoint 2007 autorisant les macros .ppam
Diaporama XML PowerPoint 2007 .ppsx
Diaporama XML PowerPoint 2007 autorisant les macros .ppsm

Développement de solutions à l'aide des formats Office XML Formats

Les formats Office XML Formats introduisent ou améliorent de nombreux types de solutions impliquant des documents que vous pouvez créer. Vous pouvez accéder au contenu d'un document Office dans les nouveaux formats de fichier en utilisant n'importe quel(le) outil ou technologie capable de travailler sur des archives ZIP. Vous pouvez ensuite manipuler le contenu du document en utilisant n'importe quelle technologie de traitement XML standard ou, pour les parties qui existent sous forme de formats natifs intégrés (tels que les images), utiliser n'importe quel outil approprié pour ce type d'objet.

En outre, la possibilité d'ouvrir manuellement le fichier de conteneur d'un document Microsoft Office 2007 en tant qu'archive ZIP présente des avantages intéressants pour les développeurs. Par exemple, lors de la création de solutions basées sur Office, vous pouvez examiner le contenu et la structure d'un document sans avoir à écrire du code. Cette possibilité peut s'avérer très utile dans la conception de solutions et la création de prototypes.

Dans un document Microsoft Office 2007, la structure facilite la navigation dans les parties d'un document et ses relations, qu'il s'agisse de localiser des informations, de changer du contenu ou de supprimer des éléments d'un document. Avec l'utilisation de XML et les schémas de référence Office publiés, vous pouvez facilement créer des documents supplémentaires, ajouter des données aux documents existants ou rechercher du contenu spécifique dans un ensemble de documents.

La suite de cet article décrit quelques scénarios dans lesquels les formats Office XML Formats permettent la création de solutions basées sur les documents. Ce ne sont là que quelques exemples d'une liste presque infinie de possibilités :

  • Interopérabilité des données

  • Manipulation du contenu

  • Partage et réutilisation du contenu

  • Assemblage de documents

  • Sécurité des documents

  • Gestion des informations sensibles

  • Gestion du style des documents

  • Profil de documents

Interopérabilité des données

L'émergence du langage XML comme norme d'échange de données signifie que les nouveaux formats Office XML Formats rendent les données basées sur les documents plus accessibles entre les différents systèmes hétérogènes. Que les utilisateurs partagent les données d'un document dans un département, ou que deux organisations échangent des données métier, l'utilisation de XML en tant que format de fichier par défaut des documents Microsoft Office signifie que les applications Office peuvent participer à des processus métier sans les limitations précédemment imposées par les formats binaires.

Le caractère ouvert des nouveaux formats de fichier déverrouille les données et introduit un nouveau niveau d'intégration, au-delà du poste de travail. Par exemple, vous pouvez faire référence à la spécification publiée des nouveaux formats de fichier afin de créer des documents riches sans utiliser d'application Office. Les applications côté serveur peuvent traiter les documents en masse afin de permettre des solutions à grande échelle pour traiter les données de l'entreprise dans les applications Office familières et flexibles. Vous pouvez utiliser des protocoles XML standard, tels que XPath (un langage d'interrogation XML courant) et XSLT (Extensible Stylesheet Language Transformations) pour extraire les données des documents ou pour mettre à jour le contenu d'un document à partir de données externes.

Un tel scénario peut impliquer la personnalisation de milliers de documents à distribuer aux clients. Vous pouvez insérer des informations par programmation dans un modèle de document standard en utilisant une application serveur qui utilise le code XML que vous avez extrait d'une base de données d'entreprise ou d'une application de gestion de la relation client (CRM, Customer Relationship Management). La création de ces documents est hautement efficace, car il n'est pas nécessaire d'exécuter des applications Office ; il est néanmoins possible de produire des documents Office complets et de qualité.

L'utilisation de schémas personnalisés dans Office est un autre moyen d'utiliser des documents pour partager des données. Les informations qui étaient précédemment verrouillées dans un format binaire sont désormais accessibles et les documents peuvent donc servir de sources de données ouvertes. Non seulement les schémas personnalisés facilitent l'insertion et l'extraction des données, mais ils doivent également structurer les documents et sont capables d'imposer la validation des données.

Manipulation du contenu

La modification du contenu des documents Office existants est un autre exemple d'amélioration d'un processus grâce à Office XML Formats. La modification peut impliquer la mise à jour de petites quantités de données, la permutation de parties entières, la suppression de parties ou l'ajout de nouvelles parties. Avec les relations et les parties, les nouveaux formats de fichier facilitent la recherche et la manipulation du contenu. L'utilisation de XML et des schémas XML permet d'utiliser des technologies XML courantes, telles que XPath et XSLT, pour modifier les données des parties de documents de façon presque infinie.

Un scénario peut impliquer la nécessité de modifier le texte de l'en-tête d'un document Word. Bien entendu, il n'est pas logique d'automatiser une tâche pour un seul document. Mais qu'en est-il si une entreprise a fusionné et doit mettre à jour le nom de l'entreprise dans l'en-tête de centaines de documents ? Un développeur peut écrire du code qui parcourt tous les documents, localise la partie en-tête dans la structure du fichier Word, et effectue une requête XPath afin de localiser l'ancien texte. Il peut ensuite insérer le nouveau texte, remplacer la partie en-tête et répéter le processus jusqu'à ce que chaque document soit mis à jour. L'automatisation permet de gagner beaucoup de temps, permettant l'utilisation d'un processus qui sinon ne serait pas possible, ainsi que d'éviter les erreurs potentielles d'un processus manuel.

Un autre scénario peut être la mise à jour d'un document Office existant, avec modification d'une partie entière. Dans un classeur Excel 2007, vous pouvez remplacer une feuille de calcul complète contenant des données anciennes ou des modèles de calcul obsolètes par une nouvelle feuille, en remplaçant la partie correspondante. Ce type de mise à jour s'applique également aux parties binaires. Vous pouvez remplacer une image existante, ou même un objet OLE, par un(e) autre. Vous pouvez mettre à jour un dessin Microsoft Office Visio intégré en tant qu'objet OLE dans des documents Office, par exemple, en remplaçant cette partie binaire. Vous pouvez mettre à jour les URL de liens hypertextes afin qu'ils pointent vers de nouveaux emplacements.

Voici quelques scénarios complémentaires propres à des applications.

Manipulation de contenu dans Word 2007

Il est courant d'intégrer du texte « générique » dans un document Word. Par exemple, une mention légale ou des conditions générales peuvent être requis dans chaque document public créé par une organisation. Un autre exemple concerne la section « Présentation de l'entreprise », utilisée dans les propositions commerciales ou les annonces publiques. Word offre des fonctionnalités telles que Correction automatique, capables d'effectuer l'insertion de texte formaté, mais la portée de cette fonctionnalité est limitée, car elle nécessite une automatisation Word ou l'interaction directe de l'utilisateur.

Word 2007 offre une alternative très flexible pour l'insertion de contenu dans un document. Le format Word XML vous permet d'ajouter des parties de document, appelées blocs, référencées par le document global lorsqu'il est ouvert dans Word. Cela signifie que vous pouvez créer une bibliothèque de blocs de document, que vous pouvez dériver de formats de document pouvant être affichés par Word, et les réutiliser par programmation dans les solutions de document Word.

Cette possibilité étendue de manipuler du contenu Word offre des scénarios intéressants, tels qu'un assemblage de documents côté serveur. Dans l'exemple précédent, vous pouvez insérer automatiquement une mention légale dans un document créé sur un serveur. Imaginez une multinationale qui nécessite que tous ses documents contiennent une mention légale dans les langues locales. L'entreprise peut créer les mentions propres à la langue sous forme de fichiers .html et les enregistrer sur un serveur. L'application qui crée les documents peut insérer le fragment de document correspondant pour la langue en tant que partie dans le conteneur de document. Ce fragment est alors affiché comme une partie d'un document Word.

Manipulation de contenu dans Excel 2007

Pour optimiser les performances de chargement et d'enregistrement, ainsi que la taille des fichiers, Excel 2007 stocke une seule copie de texte répétitif dans le fichier Excel. Pour cela, Excel implémente une table de chaînes partagée dans une partie de document spécifiée par la cible de la relation

http://schemas.microsoft.com/office/2005/8/relationships/xlSharedStrings

Chaque valeur de texte unique trouvée dans un classeur est répertoriée une fois dans cette partie. Les cellules des feuilles de calcul individuelles font ensuite référence à la table des chaînes afin d'extraire les valeurs.

Si ce processus optimise le format Excel XML, il offre également des opportunités intéressantes pour des solutions complémentaires de manipulation de contenu. Les développeurs d'une organisation multinationale peuvent utiliser la table des chaînes partagée pour offrir une prise en charge multilingue. Plutôt que de créer des classeurs uniques pour chaque langue, un classeur unique peut utiliser des tables de chaînes correspondant aux différentes langues. Une autre possibilité consiste à utiliser des tables de chaînes pour rechercher les mots-clés dans un ensemble de classeurs. Le traitement d'un document XML unique en texte seul est plus rapide et plus simple que d'avoir à manipuler le modèle d'objet Excel sur de nombreux classeurs et feuilles de calcul.

Manipulation de contenu dans PowerPoint 2007

Lorsqu'une présentation PowerPoint 2007 est stockée avec le format PowerPoint XML, le contenu reste parfaitement accessible. Étant donné qu'il s'agit de la première version de PowerPoint à offrir un format XML, de nombreux scénarios deviennent possibles. Vous avez désormais un accès complet aux diapositives et aux commentaires sous forme de texte. Les solutions qui nécessitent la recherche, l'indexation et la création de contenu de présentation sont désormais possibles. Vous pouvez facilement créer des présentations basées sur les données avec du code XML. Vous pouvez également accéder à des diapositives et à des mises en forme via les parties XML afin de formater par programmation des présentations PowerPoint nouvelles ou existantes.

Vous pouvez adopter une approche différente de l'assemblage ou de la réutilisation du contenu à partir de présentations PowerPoint en créant une application qui utilise un catalogue de diapositives stockées indépendamment des présentations existantes. Les diapositives sont représentées en tant que parties XML individuelles ; ainsi, une solution peut optimiser la façon dont une organisation stocke et gère les diapositives PowerPoint 2007 en tant que données. Vous pouvez même écrire une « visionneuse » de diapositives permettant à l'utilisateur de découvrir et de sélectionner les diapositives afin de créer une présentation sans utiliser PowerPoint. L'application peut même être basée sur le Web afin de permettre la gestion centralisée.

Partage et réutilisation du contenu

La modularité des formats Office XML Formats ouvre la possibilité de générer du contenu une fois, puis d'en créer un certain nombre d'autres documents. En tant que développeur, vous pouvez imaginer créer un certain nombre de modèles et d'en réutiliser des portions en tant que blocs pour d'autres documents. Vous pouvez par exemple utiliser dans d'autres documents Word un tableau créé dans un document Word. Vous pouvez créer des graphiques (qui présentent un schéma commun entre les applications Microsoft Office 2007) et les réutiliser un certain nombre de fois dans différents types de document. L'accessibilité du format se prête à des opportunités illimitées de partage de contenu.

Un tel scénario peut par exemple impliquer la création d'un référentiel d'images utilisées dans des documents. Vous pouvez créer une solution qui extrait les images d'une collection de documents Office et autorise les utilisateurs à les réutiliser à partir d'un point d'accès unique. Étant donné que les documents Office de la version 2007 stockent les images intactes sous forme de parties binaires, vous pouvez créer la solution et gérer facilement une bibliothèque d'images. Ensuite, les utilisateurs qui souhaitent intégrer des images utilisées précédemment n'ont pas besoin de parcourir un ensemble de documents, ni de les ouvrir et de les fermer individuellement, pour trouver les images. Ils peuvent utiliser l'application personnalisée afin de trouver les images dans le référentiel et les insérer immédiatement dans le document dans lequel ils travaillent.

Vous pouvez créer une application similaire qui réutilise les images « miniatures » extraites des documents, et ajouter un aspect visuel à un processus de gestion des documents.

Assemblage de documents

L'une des demandes les plus courantes pour les développeurs concerne la possibilité de créer des documents Microsoft Office sur un serveur sans automatiser les applications Microsoft Office. Les organisations qui doivent créer des documents complexes avec des données, ou assembler des documents en nombre, souhaitent un traitement plus efficace. Techniquement, les applications Office n'ont pas été écrites pour l'exécution à partir d'un serveur.

Dans les versions Microsoft Office 2003, l'introduction des formats de document XML pouvant être générés en fonction des schémas de référence XML Office 2003 a contribué à contourner cette limitation. Toute technologie capable d'assembler du code XML peut créer un document Word ou Excel, dès lors qu'elle respecte les schémas Office. Cela représentait une avancée considérable à l'époque, mais malheureusement, elle ne concernait que Word et Excel, et seul Word offrait une fidélité complète dans sa prise en charge des fichiers XML. La version Office 2007 se base sur cet effort en ajoutant les fichiers XML PowerPoint et en s'assurant que les fichiers XML PowerPoint et Excel sont également totalement fidèles.

Cette avancée technologique signifie que, avec la version Office 2007, vous pouvez créer une solution Office qui génère des documents Excel, Word et PowerPoint sans jamais ouvrir Office. La solution doit créer le code XML en fonction des schémas de la version 2007 et créer le contenu du package tel que défini par Office XML Formats. Bien que les schémas Office soit relativement étendus, pour représenter totalement les fonctionnalités complètes des applications Microsoft Office, toutes les structures définies par le format ne sont pas requises pour générer un document. Chacune des applications Office peut ouvrir le fichier avec une quantité minimale d'éléments définis, ce qui facilite la création de nombreux documents.

Notez que l'assemblage de documents ne concerne pas uniquement les nouveaux documents. Bien entendu, en suivant les règles Office XML Formats, vous pouvez créer des documents par programmation sans utiliser Office. Mais souvent, l'assemblage de documents signifie la création de documents avec des portions de documents, données et autres contenus existants. Les nouveaux formats Office XML Formats s'adaptent bien à ce scénario, car ils présentent une architecture modulaire et leur contenu est basé sur XML.

Un exemple d'assemblage de documents s'applique également aux présentations PowerPoint. De nombreuses organisations disposent d'un grand nombre de fichiers PowerPoint pouvant être réutilisés. Les utilisateurs empruntent souvent des diapositives de plusieurs présentations existantes afin de créer une présentation complémentaire ou associée. La recherche, la coordination et l'intégration (copier/coller) des diapositives est généralement un processus long et redondant, que nombre d'organisations souhaitent automatiser pour les présentations client. Avec la version Office 2007, les diapositives individuelles d'un fichier de présentation PowerPoint sont directement accessibles, car chacune est autonome dans sa propre partie XML dans le package du conteneur de présentation. Une solution personnalisée peut utiliser cette architecture pour automatiser complètement le processus d'assemblage pour les présentations. Vous pouvez utiliser du code XML personnalisé pour stocker les métadonnées relatives aux diapositives individuelles, ce qui permet aux utilisateurs de les rechercher facilement avec des mots-clés prédéfinis. Une fois qu'un utilisateur a sélectionné une diapositive, la solution insère la partie XML de la diapositive dans la présentation assemblée et crée la relation de référence.

Sécurité des documents

La sécurité est très importante actuellement en informatique. Les formats Office XML Formats vous permettent de travailler plus en confiance avec les documents Office et de proposer des solutions qui tiennent compte de la sécurité des documents. Avec les nouveaux formats de fichier, vous pouvez créer des solutions qui recherchent et suppriment les vulnérabilités potentielles identifiées avant qu'elles n'entraînent des problèmes.

Par exemple, si une entreprise a besoin d'une solution pour préparer des documents pour le stockage dans une bibliothèque d'archives, où aucun code personnalisé ne doit jamais être exécuté, ou pour l'envoi de documents sans macros à un client. Vous pouvez écrire une application qui supprime tout le code VBA d'un ensemble de documents Office en parcourant les documents et en supprimant la partie spécifiée par la cible de la relation

http://schemas.microsoft.com/office/2006/relationships/vbaProject

. Il en résulte un ensemble de documents de meilleure qualité.

En outre, les formats Office XML Formats offrent un seul type de fichier pour chaque produit de la version 2007 (.docm pour Word, .xlsm pour Excel et .pptm pour PowerPoint) dans lequel vous pouvez exécuter le code de macros. Tout type de fichier ne se terminant pas par le suffixe « m », y compris ceux contenant du code de macro, n'exécuteront pas ce code. Cela permet de garantir que les utilisateurs ne sont pas confrontés à des logiciels malveillants lors de l'utilisation de ces types de fichiers.

Malheureusement, le code des macros n'est pas la seule menace de sécurité pour les utilisateurs Office. Récemment, des vulnérabilités de sécurité ont été détectées dans des fichiers .jpg binaires. Vous pouvez éviter les risques potentiels des fichiers binaires, tels que les objets OLE et les images, en interrogeant les documents Office et en supprimant toute exposition. Par exemple, si un objet OLE spécifique est identifié comme une menace de sécurité connue, vous pouvez créer une application afin de localiser et de nettoyer (ou de mettre en quarantaine) tout document contenant l'objet. De la même façon, vous pouvez identifier toute référence externe à partir d'un document Microsoft Office 2007 en examinant les parties relation. Cette identification permet aux développeurs de solutions de décider si les ressources externes référencées à partir d'un document sont dignes de confiance ou nécessitent une action corrective.

Vous pouvez bloquer les parties par type de contenu et relations. Par exemple, si un administrateur constate que des images .gif peuvent contenir une menace de sécurité, des paramètres de stratégie de groupe peuvent être utilisés pour interdire le chargement du contenu image/gif dans les documents Microsoft Office 2007. Après le déploiement des correctifs de sécurité appropriés, le paramètre peut être désactivé et l'administrateur est alors assuré de la protection rapide des utilisateurs.

Vous pouvez également bloquer des parties par l'intermédiaire de stratégies de format. Par exemple, si l'administrateur informatique découvre une vulnérabilité dans laquelle des commentaires mal rédigés peuvent entraîner le blocage de PowerPoint avec un débordement de tampon exploitable, les utilisateurs et leurs ordinateurs peuvent être protégés via le déploiement d'une stratégie de format de fichier Office. Cette fois-ci, plutôt que de bloquer par type de contenu (puisque dans ce cas, il s'agit de code XML contenant du texte), les commentaires sont bloqués spécifiquement, via le blocage du type de relation schemas.microsoft.com/office/2006/relationships/comments. Pour cela, les administrateurs peuvent utiliser des modèles de stratégie Microsoft Office (fichiers .adm) pour définir ces options. Pour plus d'informations sur l'utilisation de modèles de stratégie Office, reportez-vous à l'article (en anglais) de la base de connaissances Microsoft intitulé Administrators can use Office policy templates with the Group Policy settings of Windows (Les administrateurs peuvent utiliser des modèles de stratégie Office avec les paramètres de stratégie de groupe de Windows).

Gestion des informations sensibles

Lorsque vous souhaitez protéger les utilisateurs contre le contenu malveillant, vous pouvez également aider à protéger les utilisateurs contre le partage accidentel de données. Ces données inappropriées peuvent se présenter sous la forme d'informations personnellement identifiables stockées dans un document, ou de changements, commentaires et annotations faisant l'objet d'un suivi, marqués de telle sorte qu'elles ne doivent pas quitter le département ou l'organisation. Vous pouvez supprimer par programmation les deux types d'informations directement sans avoir à explorer un document entier. Pour supprimer des commentaires d'un document, par exemple, vous pouvez vérifier l'existence d'une relation de partie commentaire et, le cas échéant, supprimer la partie commentaire associée.

Outre la sécurisation des informations personnelles et des commentaires, Office XML Formats permet l'accès à ces informations utiles. Vous pouvez créer une solution qui utilise les données personnelles afin de renvoyer une liste de documents créés par une personne individuelle ou à partir d'une organisation spécifique. Avec les nouveaux formats de fichier, vous pouvez créer cette liste sans avoir à ouvrir Office ou à utiliser son modèle d'objet. De la même façon, une application peut boucler dans un dossier ou un volume de documents Office et agréger tous les commentaires dans les documents. Vous pouvez appliquer des critères supplémentaires afin de qualifier les commentaires et d'aider les utilisateurs à mieux gérer le processus de collaboration lors de la création de documents.

Gestion du style des documents

Comme beaucoup d'autres aspects des documents Office utilisant les formats Office XML Formats, les styles, la mise en forme et les polices des documents sont conservés dans des parties XML distinctes dans le package du conteneur. Ainsi, vous pouvez là encore créer des solutions qui tirent parti de cette séparation. Certaines organisations présentent des normes de document très spécifiques, et leur gestion peut prendre du temps. Vous pouvez cependant par exemple modifier ou remplacer les polices de documents sans ouvrir Office.

Par ailleurs, il est courant d'avoir un document ou un ensemble de documents avec le même contenu, mais formaté différemment par un autre département, une filiale ou un client. Vous pouvez gérer le contenu dans un ensemble unique de documents, puis y appliquer un nouveau jeu de styles si nécessaire. Pour cela, vous remplacez la partie spécifiée par la cible de la relation

http://schemas.microsoft.com/office/2006/relationships/styleSheet

par une autre partie. Cette possibilité d'échange simplifie le processus de contrôle de la présentation d'un document, sans avoir à gérer le contenu dans de nombreux documents.

Profil de documents

La gestion efficace des documents est un vieux problème informatique. Dans Microsoft Office 2003, vous avez accès aux propriétés traditionnelles des documents Office, telles que Auteur, Titre, Sujet, etc., via OLE. Dans les nouveaux formats Office XML Formats, les propriétés des documents sont également accessibles, car elles résident dans leur propre partie d'un document. Voici un exemple de partie Propriétés d'un document dans un fichier Word .docx.

        <?xml version="1.0" encoding="UTF-8" standalone="yes"?>
        <CoreProperties xmlns="http://schemas.microsoft.com/package/2005/06/md/core-properties">
        <Title>Word Document Sample</Title>
        <Subject>Microsoft Office Word 2007</Subject>
        <Creator>2007 Microsoft Office System User</Creator>
        <Keywords/>
        <Description>2007 Microsoft Office system .docx file</Description>
        <LastModifiedBy>2007 Microsoft Office System User</LastModifiedBy>
        <Revision>2</Revision>
        <DateCreated>2005-05-05T20:01:00Z</DateCreated>
        <DateModified>2005-05-05T20:02:00Z</DateModified>
        </CoreProperties>
      

Cependant, les documents Office qui utilisent les nouveaux formats de fichier vous permettent d'ajouter vos propres données et contenu au-delà de ce que permettent les propriétés basées sur Office, par exemple pour les profils de document avancés. Vous pouvez créer votre propre code XML personnalisé et le placer dans le fichier comme une autre partie. Vous pouvez ensuite utiliser ce code XML avec n'importe quel outil ou application capable d'accéder aux formats Office XML Formats.

Utilisation des nouveaux formats de fichier dans les produits Office

Si de nombreuses parties sont communes aux produits Office qui implémentent les nouveaux formats de fichier, il existe également des composants propres à chaque produit.

La structure de format de fichier dans Excel 2007

Outre les parties communes à chaque produit Office (telles que les parties données XML, les parties relations et les parties média), Excel offre également des parties distinctes pour le classeur, les feuilles de calcul, ainsi que les entités telles que les graphiques, les vues dynamiques PivotTable, etc.

La structure de format de fichier dans PowerPoint 2007

PowerPoint utilise nombre des mêmes parties que les autres produits dans son format de fichier, avec en plus des objets propres à la présentation de diapositives, par exemple les parties diapositive individuelle, une partie diapositive maître, les données de présentation, etc.

La structure de format de fichier dans Word 2007

De la même façon, les utilisateurs de Word peuvent s'attendre à voir des parties complémentaires concernant les propriétés des documents, les styles et la mise en forme, les pieds de page, les en-têtes, les notes de fin, etc.

Modification des fichiers Office XML Formats afin de personnaliser l'interface utilisateur Ruban

La procédure suivante illustre la création d'une interface utilisateur Ruban dans Excel 2007, contenant les composants permettant d'appeler une macro personnalisée en modifiant un fichier de classeur autorisant les macros. Dans cet exemple, procédez de la façon suivante :

  • Créez un classeur Excel avec une macro et enregistrez le classeur en tant que fichier Office XML Formats autorisant les macros (.xlsm).

  • Créez un fichier de personnalisation d'extension Ruban avec un onglet, un groupe et un bouton.

  • Spécifiez un événement de rappel dans le bouton afin d'appeler la macro que vous avez créée dans le document.

  • Modifiez le contenu du fichier de conteneur de document autorisant les macros afin de pointer vers le fichier de personnalisation d'extensibilité Ruban.

  • Enregistrez le fichier autorisant les macros et ouvrez-le dans Excel.

Pour créer un fichier Office XML Formats autorisant les macros dans Excel

  1. Démarrez Excel 2007.

  2. Sélectionnez l'onglet Développeur, puis cliquez sur Visual Basic.

    Remarque : Si vous ne voyez pas l'onglet Développeur, vous devez vous identifier en tant que développeur. Pour cela, dans votre application, cliquez sur le bouton Microsoft Office , cliquez sur Options Excel, cliquez sur Personnaliser, puis sélectionnez Afficher l'onglet Développeur dans le Ruban. Il s'agit d'un paramètre global qui vous identifie en tant que développeur dans toutes les autres applications Office qui implémentent l'interface utilisateur Ruban.

  3. Dans l'Éditeur Visual Basic, double-cliquez sur CeClasseur afin d'ouvrir la fenêtre de code.

  4. Tapez le sous-programme VBA suivant, puis fermez l'Éditeur Visual Basic :

Sub MyButtonMacro(ByVal ControlID As IRibbonControl) Msgbox("Hello world") End Sub

  1. Enregistrez le classeur en tant que fichier Office XML Formats autorisant les macros (.xlsm).

Pour créer le fichier XML contenant le balisage pour modifier l'interface utilisateur

  1. Créez un dossier sur votre poste de travail, appelé customUI.

  2. Ouvrez un nouveau fichier dans un éditeur de texte et enregistrez-le en tant que customUI.xml dans le dossier customUI.

  3. Ajoutez le code suivant au fichier :

<customUI xmlns="http://schemas.microsoft.com/office/2006/01/customui"> <ribbon startFromScratch="true"> <tabs> <tab id=":CustomTab" label="My Tab"> <group id="SimpleControls" label="Sample Group"> <button id="Button1" size="large" label="Large Button" onAction="ThisWorkbook.MyButtonMacro" /> </group> </tab> </tabs> </ribbon> </customUI>

Ensuite, vous devez modifier certains des fichiers contenus dans le conteneur de fichier autorisant les macros que vous avez créé précédemment :

  1. Ajoutez une extension .zip au nom du fichier de classeur, puis double-cliquez afin d'ouvrir le fichier.

  2. Ajoutez le fichier de personnalisation au conteneur en faisant glisser le dossier customUI du bureau vers le fichier ZIP.

  3. Extrayez le fichier .rels vers votre bureau. Un dossier _rels contenant le fichier .rels est copié sur votre bureau.

  4. Ouvrez le fichier .rels et ajoutez la ligne suivante entre la dernière balise Relation et la balise Relations. Cela crée une relation entre le fichier de classeur et le fichier de personnalisation :

<Relationship Id="someID" Type="http://schemas.microsoft.com/office/2006/relationships/ui /extensibility" Target="customUI/customUI.xml" />

  1. Fermez et enregistrez le fichier.

  2. Ajoutez le dossier _rels au fichier de conteneur en le faisant glisser à partir du bureau, remplaçant ainsi le fichier existant.

  3. Renommez le fichier de classeur avec son nom original en supprimant l'extension .zip.

  4. Ouvrez le classeur et remarquez que l'interface utilisateur Ruban affiche à présent Mon onglet.

  5. Cliquez sur le bouton afin d'afficher la zone de message.

Conclusion

Les utilisateurs, organisations et développeurs tirent parti des avantages des formats Office XML Formats dans la version 2007 du système Microsoft Office. En tant que formats de fichier par défaut ouverts basés sur XML, les nouveaux formats ouvrent de nombreuses possibilités pour la création de nouveaux types de solutions et scénarios. Vous pouvez accéder aux documents en tant que sources de données, les manipuler sans les applications Office, et les traiter dans des solutions d'entreprise. Les organisations qui associent les investissements système existants avec la plate-forme Microsoft Office, la version Office 2007 et les nouveaux formats de fichier basés sur XML ne peuvent en tirer que des avantages.

Ressources supplémentaires

Pour plus d'informations, consultez les ressources suivantes :