Donc si jamais, c'est là (mais je crois que j'ai déjà dû mettre le lien dans un #vulgadredi ou deux) : https://fadrienn.irlnc.org/articles/sciences/comptons_sur_nos_doigts/
Mais je vais tâcher de voir si je retrouve quelque chose à ce sujet, et si oui, je te pinguerai. Aucune garantie de résultat, par contre ^^"
(Tiens, si ça intéresse du monde ici, j'avais un vieil article de blog qui expliquait comment compter sur ses doigts jusqu'à soixante ou jusqu'à 1023 et quelques notions qu'il y a à savoir à propos de ça, mais je pense que ce n'est peut-être pas pertinent pour du niveau collège ^^)
#IA Beaucoup de collègues pensent que LA source des #stéréotypes des grands modèles de langues (ou IA génératives) à la #gpt c'est les données d'entrainement... Certes, elles jouent un rôle, mais il y a d'autres sources de biais stéréotypés. L'une d'elles est assez inattendue : l'évaluation.
En gros, on utilise de très gros jeux de données, souvent de type QCM, pour évaluer les modèles (voire les entraîner), qu'on appelle des #benchmarks. Mes étudiant·e·s sont allés regarder ces benchmarks de plus près et iels ont trouvé pas mal de pbs : des biais explicites (ça avait déjà été mentionné par d'autres), mais également des biais implicites et des erreurs factuelles. Si cela vous intéresse, nous avons écrit sur le sujet un papier en français pour la conférence TALN, que vous trouverez ici : https://inria.hal.science/hal-05618509/file/Benchmarks_trad_TALN-VF.pdf
Ceci dit, unpopular opinion, mais Ocarina of Time est (rétrospectivement en tout cas, c'est vrai qu'il y a eu des moments marquants à l'époque) pas mal, mais sans plus. Comme pour FF7, je ne vois pas tellement pourquoi on en fait autant sur celui-là en particulier. Mais bon, si je classe toute la saga par ordre de préférence, je dirais qu'il n'y a à peu près que Majora's Mask (que je n'ai découvert qu'il y a quelques années) et Twilight Princess comme opus 3D bien classés, globalement je préfère largement les autres.
On peut aussi, légitimement, se questionner sur l'intérêt de mettre des sous spécifiquement sur la résolution des problèmes d'Erdös, qui sont des problèmes de maths intéressants mais à ma connaissance sans spécialement d'applications ailleurs, donc les résoudre par ricocher en travaillant sur autre chose paraît plus probable (cas de plusieurs d'entre eux qui avaient été résolus dans d'autres branches des maths sans que le lien ne soit fait).
Par contre, oui, il y a probablement moyen d'arriver à quelque chose qui fasse des maths (ou en tout cas de la recherche de preuves et de contre-exemples) plus efficacement qu'un LLM, vu qu'une preuve en maths c'est me semble-t-il quelque chose de pas mal algorithmique pour lequel la langue naturelle n'est pas forcément l'outil le plus adapté. Mais je laisse des gens avec plus de connaissances du domaine que moi confirmer ou infirmer :-)
Sauf que plus ça va, plus les positions qu'ils s'est mis à défendre me semblent à côté de la plaque et mal argumentées, donc je vais peut-être réfléchir à aller voir ailleurs. Par contre, ça me semble confirmer un truc : l'adhésion aux LLM n'est souvent pas isolée, ça permet de mettre en lumière d'autres soucis ailleurs, ici dans le regard porté à la recherche scientifique “humaine”.
Si c'est collectivement pertinent de faire des efforts pour avoir un système de recherche qui fonctionne à peu près, c'est d'abord et surtout parce que la recherche permet d'identifier des problèmes que rencontre notre société et d'apporter des éléments de réponse dont la prise en compte permet d'améliorer les choses. La recherche scientifique, comme pas mal d'autres choses, c'est éminemment politique, ce n'est d'ailleurs pas pour rien que les positions antidémocratiques sont souvent associées à un refus de prise en compte de pas mal de réalités.
Dans ce contexte-là, même en supposant un monde où les LLM sont plus efficaces que les humains pour obtenir des résultats fiables, miser sur l'efficacité en faisant l'impasse sur les questions politiques que ça pose, c'est déjà louper totalement le point de la recherche elle-même.
D'une part, la simple existence de médailles Fields et autres prix Nobel est déjà, en soi, un signe que le modèle de fonctionnement de notre système de recherche n'est pas sain, parce qu'on essaye de forcer un aspect méritocratique à quelque chose qui est un travail collaboratif où le succès dépend surtout des moyens et tombe beaucoup sur les gens de façon aléatoire (sur ce sujet-là, j'ai la flemme de chercher le lien ce soir mais voyez la vidéo d'Hygiène Mentale sur la régression à la moyenne, elle est sur Skeptikon).
Rien qu'associer des résultats à une personne en particulier, ça peut aider à situer le contexte de leur obtention, mais ça contribue beaucoup à perdre de vue la façon dont la science se fait réellement, j'en ai causé dans quelques threads récents.
Et encore une fois, sans spécialement mentionner les effets environnementaux et compagnie, il questionne l'intérêt de continuer à faire faire de la recherche par des humains sans s'intéresser au coût de la faire faire autrement, c'est quand même un brin navrant.
Ceci dit, je le rejoins sur une partie de ce qu'il dit : cet exemple peut servir à mettre en lumière le fait qu'on devrait un peu changer de point de vue sur la recherche et sur le statut des gens qui ont trouvé des découvertes majeures, mais vu à quel point il insiste sur le fait que les gens qu'il cite ont eu la médaille Fields, je ne crois pas qu'on interprète ça de la même façon.
Alors, d'un côté je suis d'accord avec ces objections mais j'ai du mal à voir en quoi ça répond vraiment à l'objection, et d'autre part le dernier point me semble quand même un brin contradictoire avec le fait qu'au début, pour essayer de montrer que ce n'étaient pas n'importe quels problèmes qui avaient été résolus, il insistait sur le fait que c'étaient des problèmes sur lesquels énormément de mathématiciens avaient réfléchi en vain… ce qui veut dire qu'on a quand même quelques données sur les échecs, donc, à moins que je n'aie loupé une marche ?
(Et, encore une fois, justement : c'est parce qu'on sait qu'il y a eu énormément de tentatives que le fait qu'on ait fini par trouver n'est pas si surprenant et qu'on peut douter un peu de l'intérêt de glorifier ce qui a eu du bol, que ce soit un LLM ou un être humain, justement.)
Il parle d'une preuve trouvée par les gens d'OpenAI et fait remarquer lui-même que le truc est totalement automatisé et que donc OpenAI a littéralement pu demander des tonnes d'autres exemples et faire de la pub' au seul cas qui a marché (précisant qu'on ne saura pas parce qu'OpenAI n'est pas un modèle de transparence), puis conclue… que ça lui paraîtrait surprenant que ce soit ce qui s'est passé, parce que, quand même, celui qui a marché est plus dur que les autres et qu'on a vu des gens réussir à en trouver d'autres, donc s'ils avaient juste fait ça ils auraient dû avoir d'autres résultats positifs.
En tout cas, moi, ça me conforte dans mon idée que l'enthousiasme vis-à-vis des compétences des LLM est incompatible avec le fait d'avoir quelques notions de base de statistiques.
Déjà j'ai quand même un peu envie de rappeler que les mêmes LLM continuent de se viander sur des problèmes de maths de niveau primaire dans le même temps ; et puis bon, sur la vitesse de progression, j'peux pas m'empêcher de penser au sujet des deux derniers vulgadredis, hein, trois ans c'est grosso-modo le temps qu'il a fallu entre Sputnik et Gagarine, par exemple. Avec me semble-t-il la même cause dans les deux cas : un sujet à la mode, donc beaucoup de moyens humains et financiers.
Par exemple, il indique qu'il trouve très caractéristique que ce soient surtout des utilisateurs de LLMs qui sont tombés sur des résolutions de problèmes et pas des ingés de boîtes produisant ces LLM, mais ça ne le fait absolument pas s'interroger sur le rôle des statistiques dans tout ça, le fait que les utilisateurs sont quand même plus nombreux que les ingés et que donc ben quand un truc avait juste une probabilité faible de se produire sans rien signifier de particulier, ben c'est normal qu'elle arrive là où il y a le plus grand nombre d'essais.
@martin je me permets de répondre premier degré : en plus chaque fois qu'on se moque de fachos car ils sont ridicules, incultes ou bêtes y'a des gens qui ont été ridiculisés, n'ont jamais eu accès à la culture et sont tenus pour bêtes qui se sentent attaqués avec et se disent que clairement ils sont pas les bienvenus dans le camp d'en face 😒
Les fascistes d’il y a un siècle aussi ils étaient ridicules, incultes, souvent bêtes, et c’est pas ça qui les a empêchés de prendre le pouvoir et de commettre des atrocités. Je suis pas certain que c’est ça qu’on devrait leur reprocher en premier.
🧶