Formats de fichiers ouverts et fermés

Message 1, par Elzen

§ Posté le 24/10/2008 à 13h 59m 00

Les données, en informatique, sont présentes sur le disque dur sous forme de fichiers. À l’intérieur de ces fichiers, les données sont rangées (et souvent compressées pour prendre moins de place) sous une forme précise, qu’on appelle un format. Il existe le plus souvent plusieurs formats pour un type de fichiers donné. Par commodité, même si ce n’est absolument pas une obligation, on a l’habitude d’associer à chaque format une extension, c’est-à-dire une sorte de suffixe qu’on ajoute à la fin de son nom. Par exemple, l’extension « .bmp » est généralement utilisée pour repérer les images au format Bitmap, tandis que l’extension « .jpg » l’est plutôt pour les images au format JPEG.

On peut diviser les formats de fichiers en deux grandes catégories : certains sont conçus pour être universels, c’est-à-dire que la manière de ranger les données à l’intérieur du fichier est mise en avant, pour permettre à quiconque disposant du fichier de pouvoir accéder à son contenu. On parle de formats ouverts. D’autres, en revanche, sont conçus avec un système de rangement qui est gardé secret, ce qui fait que le contenu du fichier ne va être accessible que grâce aux logiciels conçus par celui qui a inventé le format. On parle de formats fermés, et c’est une manière d’obliger les utilisateurs à n’utiliser que ce que l’on veut qu’ils utilisent (en s’arrangeant, le plus souvent, pour qu’ils aient besoin de nous payer pour ça).


Il existe plusieurs organismes tels que l’ISO, chargés de contrôler les différents formats de fichiers, et d’établir des normes, dans le but de garantir l’interopérabilité (faire en sorte que quiconque reçoive une information soit capable de s’en servir). On comprend aisément que seuls les formats ouverts vont pouvoir être normalisés, car les formats fermés sont beaucoup trop restrictifs.

Or, le format qui est encore le plus souvent utilisé dans le domaine de l’échange de texte est le format « Document Word », utilisé par le logiciel Microsoft Word (issu de la suite bureautique Microsoft Office), et souvent associé aux extensions « .doc », qui se trouve être un format fermé. Microsoft Word et Microsoft Wordpad sont donc les seuls logiciels réellement capables de lire ce format. C’est d’autant plus restrictif que ces deux logiciels ne peuvent tourner que sous le système d’exploitation Windows.

De plus, ce format peut changer légèrement d’une version de Microsoft Office à l’autre, ce qui fait que même en disposant d’une version officielle et légale du logiciel censé permettre de le lire et du système sur lequel tourne ce logiciel, on peut ne pas parvenir à récupérer correctement les informations (d’ailleurs, les dernières versions de Microsoft Word utilisent une extension « .docx », le format ayant été tellement modifié qu’il n’est plus du tout lisible par les versions antérieures).

Si votre but est de diffuser une information pour qu’elle soit accessible à tous, utiliser ce format-ci est donc une très mauvaise idée. Ce serait comme si vous écriviez votre texte en latin sans savoir si vos destinataires parlent cette langue.


Dans ce cas, quel format utiliser pour envoyer vos fichiers de texte ? Si votre message est du texte simple, sans éléments de style tels que gras, italique, différences de tailles, etc., le plus simple est de l’envoyer au format texte simple (extension « .txt » le plus souvent). S’il s’agit d’un document qui n’a pas pour vocation à être modifiable, deux formats sont conseillés : soit le HTML (« .html », « .xhtml », voire « .htm »), destiné à être lu par un navigateur Web, soit le format PDF (« .pdf »), qui présente l’avantage de pouvoir contenir des informations autre que du texte, telles que des images. Ces trois formats sont ouverts et normalisés, et n’importe quel logiciel de traitement de texte permet normalement d’enregistrer dans l’un d’entre eux.

S’il s’agit d’un fichier contenant du style et qui doit rester modifiable, il existe un format appelé OpenDocument (extension « .odt » pour le texte, ce format pouvant être utilisé également pour d’autres types de données), qui est également ouvert et normalisé, et qui a été reconnu et officialisé par l’Union Européenne. Microsoft n’ayant pas encore daigné intégrer ce format à sa suite bureautique (ce qui leur a d’ailleurs valu une forte amende), il est nécessaire d’utiliser un autre logiciel pour utiliser ce format.

Plusieurs autres logiciels peuvent cependant lire l’OpenDocument. Parmi eux, je vous conseille plus particulièrement LibreOffice, Libre (comme son nom l'indique), multiplateforme et disponible gratuitement sur Internet, et qui est développé par l’équipe également en charge de maintenir ce format.


On pourra faire remarquer que comme d’autres logiciels, OpenOffice.org propose un support du format Document Word, mais le format étant fermé, ce support n’est pas parfait, et un certain nombre de fichiers n’apparaissent pas correctement.


Mise à jour :


Mise à jour :


Modifié le 02/09/2013 à 17h 48m 56

Mise à jour :

Suite du feuilleton : Oracle, ne souhaitant pas continuer à travailer sur OpenOffice.org, a finalement confié le logiciel aux soins de la fondation Apache, qui s'occupe déjà de quelques exemples célèbres de logiciels libres (notamment le serveur web du même nom). Nous avons donc, désormais, un Apache OpenOffice, libre également, et qui poursuit sa route de son côté, apportant une approche différente et donc une diversité intéressante.

Par ailleurs, je voudrais préciser deux points concernant ce qui précède. D'abord, spécifiquement aux formats de traitement de texte : les différences de rendu d'un logiciel à l'autre ne sont pas uniquement dû à des problèmes de compatibilité, mais également au fait que les formats utilisés sont destinés aux travaux en cours : ils sont conçus pour être modifiables et dépendent de l'environnement dans lesquels on les constitue. Pour diffuser des documents qui n'auront pas à être modifiés, préférez donc le format PDF (standard pour les documents finis) au format ODT (à privilégier, lui, pour les documents à modifier et les archives de travail).

Ensuite et enfin, Shanx vient de me demander de relire un de ses articles traitant notamment du sujet, et cela m'a rappelé un point que j'avais oublié de citer précédemment : le cas particulier de certains formats, comme par exemple le MP3, qui sont, pourrait-on dire, « ouverts techniquement, mais fermés juridiquement », c'est-à-dire que les informations permettant l'interopérabilité sont disponibles, mais que la licence empêche de s'en servir correctement (dans le cas du MP3, il faut payer des royalties pour pouvoir créer un logiciel capable d'enregistrer dans ce format. C'est l'une des raisons pour lesquels les libristes lui préfèrent le format Ogg Vorbis, de qualité à peu près équivalente, mais vraiment ouvert, et même libre 😊 )

(Suite au décès inopiné de mon précédent serveur, je profite de mettre en place une nouvelle machine pour essayer de refaire un outil de blog digne de ce nom. J'en profiterai d'ailleurs aussi pour repasser un peu sur certains articles, qui commencent à être particulièrement datés. En attendant, le système de commentaires de ce blog n'est plus fonctionnel, et a donc été désactivé. Désolé ! Vous pouvez néanmoins me contacter si besoin par mail (« mon login at ma machine, comme les gens normaux »), ou d'ailleurs par n'importe quel autre moyen. En espérant remettre les choses en place assez vite, tout plein de datalove sur vous !)