Tiens, les bots qui constituent les corpus d'entraînement pour les LLM sont revenus attaquer la Couronne de Cuivre.
Près de quatre millions de requêtes en une journée, visiblement. La bonne nouvelle, c'est que le piège qu'on a mis en place la dernière fois semble plutôt pas mal fonctionner.
Près de quatre millions de requêtes en une journée, visiblement. La bonne nouvelle, c'est que le piège qu'on a mis en place la dernière fois semble plutôt pas mal fonctionner.
- replies
- 1
- announces
- 2
- likes
- 2
Pour info, le piège mis en place pour détourner l’attention des bots des LLM sur La Couronne de Cuivre est basé sur le même modèle que celui de ./play.it, décrit par ici : https://notes.vv221.fr/blackhole.xhtml
En fait ça s’est même passé dans l’autre sens : on a d’abord mis en place une première version sur La Couronne de Cuivre, puis une version légèrement modifiée sur le serveur de ./play.it, et enfin le guide a été rédigé pour rendre compte de tout ça. En espérant que ça inspire d’autres résistants face à l’invasion des LLM, et que ça fournisse à ceux-ci une bonne manière de protéger leurs sites Web tout en sabotant l’apprentissage des LLM.
Les contraintes sont un peu différentes entre les deux serveurs protégés de cette manière. En particulier, pour le forum de La Couronne de Cuivre on ne pouvait pas vraiment se permettre de commencer par bloquer tous les GAFAM, vu qu’on cherche à pouvoir être découverts via les moteurs de recherche utilisés par le grand public. On a donc une approche différente des blocages entre les deux serveurs, mais ça reste le même système de base qui est en place des deux côtés.
En fait ça s’est même passé dans l’autre sens : on a d’abord mis en place une première version sur La Couronne de Cuivre, puis une version légèrement modifiée sur le serveur de ./play.it, et enfin le guide a été rédigé pour rendre compte de tout ça. En espérant que ça inspire d’autres résistants face à l’invasion des LLM, et que ça fournisse à ceux-ci une bonne manière de protéger leurs sites Web tout en sabotant l’apprentissage des LLM.
Les contraintes sont un peu différentes entre les deux serveurs protégés de cette manière. En particulier, pour le forum de La Couronne de Cuivre on ne pouvait pas vraiment se permettre de commencer par bloquer tous les GAFAM, vu qu’on cherche à pouvoir être découverts via les moteurs de recherche utilisés par le grand public. On a donc une approche différente des blocages entre les deux serveurs, mais ça reste le même système de base qui est en place des deux côtés.