Le format Wikipédia n'est pas le bon.

Message 1, par Elzen

§ Posté le 29/02/2024 à 18h 0m 42

J'ai mis beaucoup trop longtemps à m'en rendre compte, mais Wikipédia, sous sa forme actuelle, pose beaucoup plus de problèmes qu'elle n'en résout.


Pourtant, à la base, c'est une des plus grandes success story du monde que j'essaye de défendre : une encyclopédie collaborative, basée sur du logiciel libre, invitant tout le monde à venir contribuer sous une licence ouverte, au point d'avoir totalement fait disparaître une bonne partie des alternatives qui n'avaient pas ces caractéristiques intéressantes. Sauf qu'à bien y réfléchir… le problème commence déjà là.


Wikipédia est unique. Il n'existe pas d'autre encyclopédie collaborative à côté d'elle, ou en tout cas pas il n'en existe pas qui ait ne serait-ce qu'une toute petite partie de sa notoriété. Or, comme tous les espaces collaboratifs, celui-ci possède ses propres règles, qui définissent la manière dont on y contribue. Et, comme tous les sites Internet, ce n'est pas l'espace public, dont on peut envisager de déterminer les règles démocratiquement pour que tout le monde s'y retrouve : pour utiliser Wikipédia, il faut donc accepter des règles sur lesquelles on n'a aucun moyen d'influer.

Ce dernier point n'est pas un problème quand on a la possibilité d'aller voir ailleurs si les règles ne nous plaisent pas. En tant qu'utilisateur de Debian, par exemple, si j'ai besoin de demander de l'aide, il existe au moins trois communautés francophones que je peux consulter. Chacune a ses règles différentes, et je peux donc choisir celle des trois qui me convient le mieux (et en l'occurrence, c'est Debian-Facile). Mais Wikipédia est unique, et si ses règles ne me conviennent pas, je ne peux donc pas aller voir ailleurs.


Or, parfois, les règles de fonctionnement de Wikipédia sont vraiment problématiques. Nous en avons d'ailleurs un exemple assez flagrant en ce moment. D'autres que moi pourront en parler beaucoup mieux, je vous renvoie notamment au très chouette article de Lizzie Crowdagger, mais pour résumer rapidement : les personnes trans changent souvent de nom au moment de leur transition (on peut prendre notamment pour exemple l'acteur canadien Elliot Page, crédité d'un autre prénom dans plusieurs excellents films, ou encore la lanceuse d'alerte américano-britannique Chelsea Manning, qui portait un autre prénom au moment de ses révélations concernant le traitement des civils dans les guerres en Irak et en Afghanistan).

Pour ces personnes, continuer d'utiliser leur ancien nom, qu'on appelle communément un deadname (ce terme étant importé de l'anglais, il est parfois traduit en français par « morinom » ou par « nécronyme », même si l'usage du terme importé reste pour l'instant majoritaire), est généralement ressenti comme assez violent, car cela revient à refuser à la personne le droit de définir sa propre identité(1). Or, il arrive que ce deadname ait eu une certaine notoriété, et se pose alors la question, dans un cadre comme celui de Wikipédia, de savoir si (et le cas échéant, comment) il doit être affiché.

Un sondage a donc été lancé pour recueillir les avis à ce niveau… à la façon dont fonctionnent habituellement les sondages de ce type sur Wikipédia, c'est-à-dire en étant réservé aux contributeurs et contributrices ayant déjà une activité assez prononcée, avec visiblement une interdiction de communiquer autour de ce sondage sur d'autres supports. Ce qui en l'état revient donc à décider entre personnes majoritairement non-concernées comment elles veulent traiter une information sensible à propos de personnes dont on refuse de prendre l'avis en compte, ce qui est en soi quelque chose d'assez violent.

Encore une fois, je ne fais ici que survoler toute cette histoire, Lizzie et d'autres en parlent beaucoup mieux que moi. Mais, si le problème de base de l'unicité de Wikipédia est quelque chose qui me trotte dans la tête depuis un bon moment, cette affaire aura été pour moi le déclencheur ayant conduit au reste de cet article.


Évidemment, pas mal de réactions se sont fait entendre, notamment sur le Fédivers, où les personnes trans sont plutôt présentes et écoutées. Et on a donc eu droit à plusieurs échanges, disons, curieux, entre d'un côté les personnes trans et allié·e·s exprimant leur ressenti sur l'affaire, et de l'autre des contributeurs et contributrices à Wikipédia venant leur expliquer doctement qu'iels n'avaient rien compris, que ce sondage précis avait été lancé parfaitement dans les règles de la plateforme, et qu'il n'y avait donc pas de problème, quand bien même la personne en face indiquait explicitement parler du sujet de manière plus générale.

Je caricature un peu, certes, mais pas tant que ça. Je ne peux par exemple pas vous lier ici la conversation qu'a eu Quota Atypique avec l'une de ces personnes, les messages de Quota n'étant accessibles qu'aux personnes abonnées à son compte, mais c'était très exactement le niveau. L'échange avec Belore Stergann est par contre public, et assez représentatif.

Bref, lisant pas mal de ces échanges, j'ai personnellement fini par en conclure laconiquement qu'un certain nombre de contributeurs et contributrices à Wikipédia sont des gens qui cherchent toujours à expliquer, mais en évitant au maximum de comprendre.


Mais au delà de la formule, et comme l'article déjà sus-mentionné de Lizzie l'expose très bien, il y a à prendre en compte toute la question de la neutralité. Le sujet n'est bien sûr pas neuf : la question de la neutralité, c'est quelque chose sur lequel on s'interroge pas mal dans le scepticisme, et sur certains points, Wikipédia y répond déjà très bien, comme en témoigne notamment cette vidéo d'Hygiène Mentale(2).

Il reste néanmoins ce point essentiel à prendre en compte, entre autres choses : la neutralité n'est potentiellement atteignable qu'en tant que résultat d'un processus collectif, prenant en compte le cas échéant ce que les personnes ont à apporter. Quota Atypique, dans la discussion que je ne peux pas vous lier, suggérait ainsi que pour ce genre de cas, un travail d'audition comme celui qui est mené par les autorités de régulation(3) pourrait être un préalable essentiel à la prise de décision.

Comme l'ont rappelé à plusieurs reprises les contributeurs et contributrices de Wikipédia impliquées dans ces discussions, les règles actuelles de la plateforme ont des raisons d'exister. La limitation aux participants et participantes ayant un certain nombre de contributions à leur actif, par exemple, a été mis en place pour contrer les tentatives d'ingérence de divers mouvements sectaires, ce qui à la base est une bonne chose. Mais quand les règles en place posent, de manière assez évidente, un problème, refuser d'envisager de les changer, ce n'est plus de la neutralité : cela devient une défense militante du statu quo.

Or, dans une société comme la nôtre qui souffre de nombreuses discriminations injustes, défendre le statu quo, c'est soutenir ces discrimination, comme le souligne assez bien l'adage « On ne peut pas être neutre dans un train en marche » (et comme Tranxen en parlait très bien dans cette vidéo, qui bien qu'antérieure s'applique très bien à l'affaire actuelle). La façon dont ce sondage s'est déroulé (et ce qui a suivi, et qui suit encore) fait présentement de Wikipédia (quelles que soient ses qualités par ailleurs et bien que la plupart des contributeurs et contributrices ne fassent probablement pas partie du problème) un instrument transphobe.


Nous en revenons donc à la problématique que je soulevais au début de cet article : Wikipédia étant unique, il n'est présentement pas possible de déménager vers un second projet qui n'aurait pas ce souci. Bien sûr, puisque tout son contenu est libre, il reste une solution : celle de faire comme d'habitude avec les projets libres pour lesquels il y a un souci, forker. Dupliquer le contenu actuel ailleurs, et relancer le projet sous une autre forme, en adaptant les règles pour un meilleur fonctionnement.

Sauf que dans la situation actuelle, la chose serait assez délicate, parce que Wikipédia est ce qu'elle est notamment en raison de sa notoriété, et du grand nombre de contributrices et contributeurs : même en reprenant le contenu actuel comme base (ce qui serait rapidement dépassé, en raison des modifications permanentes), il y a assez peu de chances que le second projet accroche et devienne aussi dynamique que le premier.

Et puis surtout… refaire la même chose à côté, ça n'est jamais le plus efficace. Quand le problème est structurel… il vaut mieux chercher à changer la structure.


Nous avons par exemple le cas dont j'ai déjà parlé de YouTube : son problème n'est pas tant dans le fait que ce soit YouTube, mais dans ses caractéristiques : étant donné la quantité de vidéos qui y sont mises en ligne en permanence, par exemple, les dérives de la modération automatisée sont difficilement évitables, ce qui est assez vite problématiques quelles que soient les règles que l'on cherche à appliquer. Pour avoir quelque chose qui marche mieux, il était nécessaire de penser le modèle différemment, ce qui a été fait pour PeerTube.

La même chose vaut pour Twitter : certes, le rachat par Elon Musk a considérablement aggravé l'état de la plateforme, mais toutes les conditions pour cette dérive étaient déjà en place dès le départ dans la structure même de l'outil, et les gens qui s'imaginent que migrer vers BlueSky, qui est conçu de la même manière problématique, va arranger quoi que ce soit apparaissent comme assez naïfs(4). Un réseau fonctionnant sur un modèle différent, comme celui de Mastodon, présente une alternative plus intéressante.

Avec ces deux derniers paragraphes, vous pensez peut-être me voir venir avec de gros sabots : PeerTube et Mastodon sont aussi compatibles entre eux et forment un unique ensemble, le Fédivers, permettant d'interconnecter pas mal d'autres choses très cool. Ne pourrait-on pas aussi envisager de fédérer Wikipédia ? Sauf que si la question est intéressante, ce n'est pas exactement là que je comptais vous emmener. Car avant même le Fédivers, il y avait quelque chose de déjà assez cool (même si parfois un peu trop abusivement utilisé) : le Web.


Si on décrit ça comme une « toile » à la base, c'est parce que le système de liens hypertextes permet de relier les différents sites entre eux, vous permettant en un clic d'aller d'un point à un autre, comme d'ailleurs vous avez pu le constater ci-dessus. Par le même mécanisme par lequel nous naviguons de page en page sur Wikipédia, qui pourrait donc servir à autre chose qu'à rester encore plus sur Wikipédia.

Et cela nous amène à la question de la place que Wikipédia réserve au reste d'Internet. Le fonctionnement de la plateforme nécessite l'usage de sources extérieures, c'est ce qui est utilisé pour garantir la validité des informations présentées. Sauf que, soyons honnêtes… qui consulte vraiment les sources de Wikipédia ? On est une poignée à dire que c'est le plus important dans une page, mais la forme même des pages décourage d'aller les consulter.

Une page Wikipédia typique, c'est une flopée de texte construit, qui incite donc à lire directement, avec des liens dans le corps du texte qui ne renvoient que vers d'autres pages Wikipédia, tandis que les sources ne sont précisées qu'en notes de bas de pages et en petits caractères, nécessitant d'interrompre sa lecture pour aller en prendre connaissance, et en ayant de toute façon besoin d'aller regarder dans le détail du texte pour savoir à quoi elles font référence exactement.

Même si ce n'est (probablement) pas l'intention de départ, la forme actuelle de Wikipédia se fait au détriment des sources, qui sont absolument tout sauf mises en avant. Ce qui est aussi un problème.


On pourrait d'ailleurs également questionner le choix des sources : pour l'essentiel, Wikipédia prend en compte les articles scientifiques et les articles de presse, ce qui est en soi source de biais, car énormément de choses qui mériteraient un traitement encyclopédique ne sont l'objet ni des uns, ni des autres, et donc se retrouvent rejetés car insuffisamment sourcés.

Cela concerne notamment toute une série d'articles sur le logiciel libre, qui font actuellement l'objet d'une série de demandes de suppressions parce qu'insuffisamment sourcés, ce qui évidemment questionne beaucoup quand le fonctionnement de Wikipédia est précisément rendu possible à la base grâce au logiciel libre(5).

À l'inverse, il suffit dans certains cas (je pense notamment à la vague de harcèlement subie par l'historienne Marie Peltier) qu'un travail de journaliste bâclé se contente de reprendre le contenu d'une tribune à charge sans aucune vérification ni mise en contexte pour que les informations pas toujours correctes qu'on y trouve gagnent une valeur encyclopédique, même si cela reste heureusement plutôt rare.


Mais plus généralement, j'en viens à me dire qu'il est intéressant de questionner l'idée même qu'un seul site regroupe toutes les informations sur tous les sujets. Est-ce réellement une situation souhaitable que, si je veux comprendre quelque chose à une théorie scientifique qui m'intrigue, vérifier la date de naissance d'une personne ou lire un résumé de la saison que j'ai loupée dans une série, j'aille dans les trois cas sur le même site ?

Il y a pourtant des sites spécialisés dont la forme et la pertinence font que Wikipédia ne pourra jamais rivaliser : si je veux préparer un itinéraire, OpenStreetMap est beaucoup plus indiqué. Ce site reste d'ailleurs lui-même collaboratif et basé sur du logiciel libre, comme d'ailleurs d'autres sites spécialisés comme OpenFoodFacts ou, dans un genre un peu plus spécifique, Poképédia.

On peut également mentionner ce projet-frère de Wikipédia qu'est le Wiktionnaire. Mis à disposition par la même association, utilisant le même logiciel et fonctionnant d'une manière assez similaire(6), le Wiktionnaire diffère en revanche de Wikipédia par un aspect assez crucial : il est spécialisé. Son rôle est celui d'un dictionnaire, c'est-à-dire de documenter l'usage des mots et de permettre d'en retrouver le sens et l'origine. Cette simple différence d'approche change beaucoup, notamment parce que les sources sont d'un coup beaucoup mieux mises en avant, notamment par des citations donnant des exemples d'utilisation des mots.

Bien sûr, Wikipédia a d'excellentes qualités, mais il me semble qu'on pourrait gagner pas mal à en changer le modèle (puisque Gee mentionne les tableaux dans cette B.D. : ce sont effectivement des outils très utiles, mais qui sont généralement assez mal intégrés dans le format habituel des pages, rendant leur utilisation parfois peu pratique : c'est encore un point où éviter de tout regrouper au même endroit pourrait faciliter les choses).

Finalement, la réponse aux problématiques actuellement posées par Wikipédia ou qui se posent sur elle est peut-être qu'il faudrait scinder Wikipédia en pas mal de morceaux. Il y a un certain nombre d'articles très chouettes, très lisibles, et qui méritent d'être mis en avant (et qui pourraient d'ailleurs l'être tout aussi bien ailleurs), mais il y a aussi pas mal de cas où on pourrait faire largement mieux, et où varier les formats pourrait grandement aider.

Et je pense que tout le monde gagnerait à ce qu'on s'oriente plutôt vers quelque chose d'un peu plus ouvert et réparti, avec un format de page de base qui commence par donner des liens vers les sites externes fournissant les données brutes (un lien vers les bonnes coordonnées sur OpenStreetMap pour chaque ville, par exemple, ou pour les films, jeux et séries un lien vers la communauté de fans qui en collectera toutes les informations de manière spécifique), et ensuite seulement un petit résumé des éléments importants, conçu pour donner le minimum vital aux gens qui n'ont pas le temps de creuser.


Quand les choses tournent mal, il est souvent intéressant de s'interroger sur la structure qui rend ces dérives possibles, et d'essayer de l'améliorer.


(Étant donné que je n'ai toujours pas eu le courage de m'en occuper, le système de commentaires de ce blog est toujours cassé, mais n'hésitez surtout pas à m'envoyer vos retours par d'autres moyens, notamment par le Fédivers.)


(Suite au décès inopiné de mon précédent serveur, je profite de mettre en place une nouvelle machine pour essayer de refaire un outil de blog digne de ce nom. J'en profiterai d'ailleurs aussi pour repasser un peu sur certains articles, qui commencent à être particulièrement datés. En attendant, le système de commentaires de ce blog n'est plus fonctionnel, et a donc été désactivé. Désolé ! Vous pouvez néanmoins me contacter si besoin par mail (« mon login at ma machine, comme les gens normaux »), ou d'ailleurs par n'importe quel autre moyen. En espérant remettre les choses en place assez vite, tout plein de datalove sur vous !)