§ Posté le 24/10/2008 à 13h 59m 00
Les données, en informatique, sont présentes sur le disque dur sous forme de fichiers. À l’intérieur de ces fichiers, les données sont rangées (et souvent compressées pour prendre moins de place) sous une forme précise, qu’on appelle un format. Il existe le plus souvent plusieurs formats pour un type de fichiers donné. Par commodité, même si ce n’est absolument pas une obligation, on a l’habitude d’associer à chaque format une extension, c’est-à-dire une sorte de suffixe qu’on ajoute à la fin de son nom. Par exemple, l’extension « .bmp » est généralement utilisée pour repérer les images au format Bitmap, tandis que l’extension « .jpg » l’est plutôt pour les images au format JPEG.
On peut diviser les formats de fichiers en deux grandes catégories : certains sont conçus pour être universels, c’est-à-dire que la manière de ranger les données à l’intérieur du fichier est mise en avant, pour permettre à quiconque disposant du fichier de pouvoir accéder à son contenu. On parle de formats ouverts. D’autres, en revanche, sont conçus avec un système de rangement qui est gardé secret, ce qui fait que le contenu du fichier ne va être accessible que grâce aux logiciels conçus par celui qui a inventé le format. On parle de formats fermés, et c’est une manière d’obliger les utilisateurs à n’utiliser que ce que l’on veut qu’ils utilisent (en s’arrangeant, le plus souvent, pour qu’ils aient besoin de nous payer pour ça).
Il existe plusieurs organismes tels que l’ISO, chargés de contrôler les différents formats de fichiers, et d’établir des normes, dans le but de garantir l’interopérabilité (faire en sorte que quiconque reçoive une information soit capable de s’en servir). On comprend aisément que seuls les formats ouverts vont pouvoir être normalisés, car les formats fermés sont beaucoup trop restrictifs.
Or, le format qui est encore le plus souvent utilisé dans le domaine de l’échange de texte est le format « Document Word », utilisé par le logiciel Microsoft Word (issu de la suite bureautique Microsoft Office), et souvent associé aux extensions « .doc », qui se trouve être un format fermé. Microsoft Word et Microsoft Wordpad sont donc les seuls logiciels réellement capables de lire ce format. C’est d’autant plus restrictif que ces deux logiciels ne peuvent tourner que sous le système d’exploitation Windows.
De plus, ce format peut changer légèrement d’une version de Microsoft Office à l’autre, ce qui fait que même en disposant d’une version officielle et légale du logiciel censé permettre de le lire et du système sur lequel tourne ce logiciel, on peut ne pas parvenir à récupérer correctement les informations (d’ailleurs, les dernières versions de Microsoft Word utilisent une extension « .docx », le format ayant été tellement modifié qu’il n’est plus du tout lisible par les versions antérieures).
Si votre but est de diffuser une information pour qu’elle soit accessible à tous, utiliser ce format-ci est donc une très mauvaise idée. Ce serait comme si vous écriviez votre texte en latin sans savoir si vos destinataires parlent cette langue.
Dans ce cas, quel format utiliser pour envoyer vos fichiers de texte ? Si votre message est du texte simple, sans éléments de style tels que gras, italique, différences de tailles, etc., le plus simple est de l’envoyer au format texte simple (extension « .txt » le plus souvent). S’il s’agit d’un document qui n’a pas pour vocation à être modifiable, deux formats sont conseillés : soit le HTML (« .html », « .xhtml », voire « .htm »), destiné à être lu par un navigateur Web, soit le format PDF (« .pdf »), qui présente l’avantage de pouvoir contenir des informations autre que du texte, telles que des images. Ces trois formats sont ouverts et normalisés, et n’importe quel logiciel de traitement de texte permet normalement d’enregistrer dans l’un d’entre eux.
S’il s’agit d’un fichier contenant du style et qui doit rester modifiable, il existe un format appelé OpenDocument (extension « .odt » pour le texte, ce format pouvant être utilisé également pour d’autres types de données), qui est également ouvert et normalisé, et qui a été reconnu et officialisé par l’Union Européenne. Microsoft n’ayant pas encore daigné intégrer ce format à sa suite bureautique (ce qui leur a d’ailleurs valu une forte amende), il est nécessaire d’utiliser un autre logiciel pour utiliser ce format.
Plusieurs autres logiciels peuvent cependant lire l’OpenDocument. Parmi eux, je vous conseille plus particulièrement LibreOffice, Libre (comme son nom l'indique), multiplateforme et disponible gratuitement sur Internet, et qui est développé par l’équipe également en charge de maintenir ce format.
On pourra faire remarquer que comme d’autres logiciels, OpenOffice.org propose un support du format Document Word, mais le format étant fermé, ce support n’est pas parfait, et un certain nombre de fichiers n’apparaissent pas correctement.
Mise à jour :
-
D’une part, contrairement à ce que j’ai indiqué ci-dessus, la suite logicielle Microsoft Office, qui contient Microsoft Word, existe également pour le système d’exploitation MacOS. Mais toujours pas, en revanche, pour les nombreux autres systèmes existants. Désolé pour l’affirmation hâtive.
-
D’autre part, je voulais préciser que des suites de la condamnation évoquée plus haut, Microsoft a – je crois – été contraint d’implanter le format OpenDocument dans la prochaine version de sa suite office, ce qui devrait réduire les problèmes d’inter-opérabilité. Reste cependant à voir comment cela sera mis en place.
-
De tierce part, enfin, au sujet du format PDF : puisqu’il est ouvert et normalisé, vous pouvez choisir le logiciel de votre choix pour lire un document enregistré avec ce format. On vient de me communiquer cette excellente page à ce sujet, qui liste plusieurs alternatives Libres.
Mise à jour :
-
Microsoft s'est arrangé (je ne voudrais pas médire sur cette entreprise, mais les moyens employés étaient, de l'avis de pas mal de gens, assez douteux) pour faire valider par l'ISO un autre format que l'OpenDocument, baptisé OOXML. Il y a donc maintenant deux formats officiellement normés pour les documents éditables. C'est en fait ce nouveau format que la nouvelle extension (« .docx », pour le texte ; ce format pouvant lui aussi être utilisé pour d'autres données) devait représenter.
Cependant, on ne change pas les vieilles habitudes : Microsoft continue d'utiliser des formats fermés. Le format utilisé par les dernières versions de Microsoft Office est basé sur l'OOXML, mais n'est pas de l'OOXML. C'est donc pour cela que, malgré leurs efforts, les autres suites offices ne peuvent pas garantir une bonne lecture de ces documents.
Encore une fois, je vous conseille d'utiliser des formats ouverts et normés ; et l'OpenDocument reste le seul format normé réellement utilisable.
-
Depuis le rachat de Sun Microsystem, qui produisait OpenOffice.org, par Oracle, quelques doutes sont apparus concernant la survie de cette suite office, conduisant à la création de la Document Foundation, qui fournit une version dérivée (dans le jargon informatique, on appelle ça un « fork ») d'OpenOffice.org, appelée LibreOffice.
Cette version dérivée est désormais plus aboutie que l'orginale, et j'en conseille donc l'utilisation (j'ai modifié le lien dans le message ci-dessus). J'en profite également pour rappeler que d'autres logiciels permettent de faire du traitement de texte en utilisant des formats ouverts et normés. J'aime aussi beaucoup Abiword, par exemple.
Modifié le 02/09/2013 à 17h 48m 56
Mise à jour :
Suite du feuilleton : Oracle, ne souhaitant pas continuer à travailer sur OpenOffice.org, a finalement confié le logiciel aux soins de la fondation Apache, qui s'occupe déjà de quelques exemples célèbres de logiciels libres (notamment le serveur web du même nom). Nous avons donc, désormais, un Apache OpenOffice, libre également, et qui poursuit sa route de son côté, apportant une approche différente et donc une diversité intéressante.
Par ailleurs, je voudrais préciser deux points concernant ce qui précède. D'abord, spécifiquement aux formats de traitement de texte : les différences de rendu d'un logiciel à l'autre ne sont pas uniquement dû à des problèmes de compatibilité, mais également au fait que les formats utilisés sont destinés aux travaux en cours : ils sont conçus pour être modifiables et dépendent de l'environnement dans lesquels on les constitue. Pour diffuser des documents qui n'auront pas à être modifiés, préférez donc le format PDF (standard pour les documents finis) au format ODT (à privilégier, lui, pour les documents à modifier et les archives de travail).
Ensuite et enfin, Shanx vient de me demander de relire un de ses articles traitant notamment du sujet, et cela m'a rappelé un point que j'avais oublié de citer précédemment : le cas particulier de certains formats, comme par exemple le MP3, qui sont, pourrait-on dire, « ouverts techniquement, mais fermés juridiquement », c'est-à-dire que les informations permettant l'interopérabilité sont disponibles, mais que la licence empêche de s'en servir correctement (dans le cas du MP3, il faut payer des royalties pour pouvoir créer un logiciel capable d'enregistrer dans ce format. C'est l'une des raisons pour lesquels les libristes lui préfèrent le format Ogg Vorbis, de qualité à peu près équivalente, mais vraiment ouvert, et même libre )