Dans les discussions à propos de l’IA, et ses implications, je retrouve un biais cognitif, déjà souligné à propos de Finkielkraut : il y aurait d’un côté des activités humaines, et de l’autre des objets techniques, des inventions, des innovations, qui en seraient comme séparées. Cela conduit à des choix et des questionnements du type : faut-il avoir peur de l’IA ? Doit-on créer des labels « Handmade » (vu dans une bd l’autre jour) pour signaler les produits faits « sans IA » ?
Il y aurait donc des objets, des créations, « purement » humaine et d’autres avec IA. C’est évidemment complètement ridicule. C’est comme si l’on devait estampiller les ouvrages écrits « sans stylos », ou « sans imprimerie ». Le biais cognitif que je vois à l’oeuvre s’appuie sur un modèle mental d’un humain complètement séparé des objets techniques, comme une sorte d’humain « naturel » qui utiliserait des outils « non-naturels » / artificiels. Ce modèle, renforcé par le langage, est très intuitif. Mais il est faux, il me semble : l’homme est un animal technique, au sens anthropologique du terme, c’est-à-dire que notre rapport au monde est toujours assorti d’une intermédiation. C’est presque symboliquement évident, tant la notion d’humanité, est intrinsèquement liée à la création d’outils. Un silex taillé, c’est la marque forte de l’Humain.
Notre rapport au monde passe par / s’appuie sur / a besoin / est renforcé par / existe via des objets techniques.
Que la nature disruptive des IA force à se poser des questions, c’est une évidence. Ne serait-ce que par une forme de conservatisme de bon aloi, de prudence, pour ne pas épouser éperdument, par technophilie et fascination, tous les usages permis par la nouveauté. Mais cette prudence ne doit pas nous faire régresser à une sorte d’idées abstraite d’homme non-technique. En quoi penser mieux avec Montaigne, grâce à la trace et à la réplication de sa pensée permise par l’écriture et l’imprimerie, serait fondamentalement différent de penser mieux grâce au partage mondial de la connaissance, et à des modèles intelligents ? Bien sûr, l’amplitude, la nature, les possibilités des outils sont différents. Mais cela reste des outils techniques / technologiques.
En tant qu’animal technique, je vois aussi bien l’intérêt d’un marteau, d’un livre, d’une voiture, d’une charrue, d’un engrais, d’un verre, que de l’IA. On peut se tuer en voiture. On peut rendre les gens fous avec un livre. Penser les bons usages de la technologie est notre devoir, pas imaginer un monde sans elle. L’effroi et la fascination ne sont pas des réactions constructives et réflexives, mais instinctives.
A titre personnel, dans mon travail, j’explore la manière dont je pourrais me faire remplacer intégralement par l’IA. On verra bien ce qui résistera à ce remplacement.
Les voitures ont remplacé les calèches. Je ne rêve pas d’un monde de calèche. Les livres ont remplacé la capacité de mémoriser. Je ne rêve pas d’un monde sans livres. L’IA va remplacer plein de choses. J’ai hâte de voir quoi, et je me réjouis des expérimentations, des créations nouvelles, des découvertes, que cela va permettre.
Étiquette : IA
-
Animal technique
-

Prise de hauteur ?
En lisant ce matin un article sur X (« Build a personal AI Agent that posts on X exactly like you and lands in the algorithm »), je me suis (re)fait la remarque que l’utilisation de nouveaux outils, notamment ceux qui sont très disruptifs (qui apportent un changement de paradigme, pourrait-on dire), nous confronte à une réinvention de notre activité. Comme le soulignait Michel Serres (« Les nouvelles technologies, révolution culturelle et cognitive« ), à chaque nouvelle révolution, l’humain perd quelque chose, et récupère des capacités supplémentaires. Nous sommes, à chaque fois, diminués et augmentés. Transformés, quoi. Par exemple : l’arrivée de l’imprimerie a fait perdre la mémoire aux humains (qui se rappelle encore et est capable de transmettre des livres entiers ?), mais a permis une extraordinaire diffusion des connaissances et génération de nouvelles idées.
IA : qu’est-ce que ça change ?
Bien loin de moi l’idée d’être capable de dire ce que l’IA nous fait perdre et gagner, car il me semble que la vague est au tout début. Je ne suis pas devin, et comme le dit le proverbe, les prévisions sont difficiles, surtout en ce qui concerne l’avenir. Mais on peut déjà voir quelques éléments. Toute recherche, analyse, synthèse de data ou de connaissances, toute production de recommandations, de textes, de code, d’images, bientôt de films, est déjà dans le champ des capacités des IA (et probablement bien d’autres choses encore que je ne connais pas). Comment cela pourrait-il ne pas bouleverser une grande partie des professions dites « intellectuelles » ?
Nous sommes à peu près sûrs d’avoir déjà perdu le monopole de la parole, et aussi de l’apprentissage non-réflexif. Que gagnons-nous au passage ? Je crois un temps et une attention supplémentaire à accorder à la réflexion, la prise de recul : si je passe moins de temps à récolter des infos, à les synthétiser, à les croiser, etc, je gagne un temps certain pour penser leur utilisation, la stratégie qui va avec. Bref, c’est une remontée en concept (que nous avions déjà vue en parlant de conception & créativité) : je dois synthétiser les infos / données sur tel sujet. Ok, mais pourquoi faire ? à quoi cela va servir ? avec quel autre domaine de connaissances pourrais-je les croiser puisque ça ne me coûte plus que quelques minutes ? Puisque des agents peuvent travailler pour moi, quelles tâches puis-je leur confier ?Cas concret
Un exemple, pris dans l’article cité en tête d’article : si des agents peuvent écrire, synthétiser, poster sur les réseaux à la place, analyser l’impact des posts, apprendre de ces feedbacks, cela libère d’une partie du boulot et permet d’être plus précis sur la voix et le style que l’on veut porter. Pourquoi est-ce que j’écris ces articles ? Dans quel but ? Quel est le style, la nouveauté que je souhaite apporter ? Qu’est-ce qui permettra d’utiliser l’iA et les agents pour augmenter ma capacité d’atteinte des mes objectifs (que du coup je vais devoir clarifier pour les partager avec les agents) ? Il me semble que cela nous oblige à être plus intelligents.
Ce matin je me suis dit, à l’instar de l’auteur de l’article, que je pourrais enregistrer mes idées à voix haute sur l’iphone en marchant, partager ces fichiers à un agent X / Grok qui les analyserait sur la base d’un doc de synthèse produit en lisant / analysant mon blog et mon fil X (qui serait une version co-construite de mon « style »), et que l’IA pourrait me générer avec ce « vocal » + fichier de style, une ébauche rapide de billet pour mon blog, mais enrichie de citations, de questions denses sur lesquelles il débouche, de pistes de lectures. Comme Grok vient de mettre en place des connecteurs Google Drive, ça me parait être un plan à tester pour voir ce que ça change et comment ça me permet d’être plus pertinent et efficace.
Et voilà l’exemple d’augmentation : réfléchissant à cela, je me suis re-penché sur une présentation que j’avais vue d’un général à propos du « style ». Qu’est-ce qui définit un style ? Quelles sont les caractéristiques d’un « style » ? Il y était question de « modèles » (personnages inspirant avec les raisons pour lesquelles on les trouve inspirants) et de « modalités d’interaction » (caractéristiques pertinentes pour décrire notre style d’interaction), et de plusieurs autres choses. On peut laisser tout cela à notre intuition, dans la zone semi-consciente, ou travailler dessus pour gagner en cohérence et en lisibilité. Voilà ce que va me forcer à faire l’IA, dans ce cas très concret. C’est déjà pas mal. Je vous tiens au courant, bien sûr. -

BLOMIX
Je viens de terminer la « migration » du petit jeu BLOX que j’avais prototypé avec Grok il y a un peu plus d’un an. Vous pouvez le télécharger (si vous êtes sur iOS) sur l’Apple Store, en cherchant BLOMIX (il est gratuit bien sûr).
Règles
L’univers de BLOMIX c’est celui du Tetris, des Columns et autres CandyCrush : un jeu de match-5, où il s’agit, dans une grille de jeu, de former des chaînes de 5 « blox » (blocks) de couleurs pour les faire disparaître. Tous les 10 blox lancés, une ligne de blox aléatoires vient perturber vos efforts pour bien ranger les choses par couleur. Et vous avez, en plus, une chance sur 8 de vous récupérer une « brix » (bricks) qui est une sorte de caillasse avec un numéro dessus et qui est plus dure à faire disparaître. Quand la grille est pleine de blox et de brix, vous avez perdu. Le score dépend bien sûr du nombre de chaînes que vous avez pu réaliser, de leur taille, des enchaînements, du nombre de fois où vous avez pu revider des colonnes, etc.
Modes de jeu
Il y a deux modes pour ce jeu, avec deux classements différents :
- un mode solo, plutôt zen, où on a le temps que l’on veut pour placer le prochain blox. Le classement pour ce mode de jeu est simplement le classement des meilleurs scores
- une mode « Player vs Player » où, tous les 50 points marqués, on envoie une ligne de blox à l’autre joueur, un peu à l’instar des parties de Tetris PvsP sur GameBoy (c’était l’inspiration). Le classement pour ce mode est une sorte de système Elo, comme aux échecs, qui ajuste votre classement de départ (800) au fur et à mesure des matchs. Plus l’écart de points entre les joueurs est important, plus la variation de points sera forte.
Design d’expérience : paramètres
J’ai eu à coeur de créer un jeu avec une ambiance très immersive malgré sa simplicité, et j’ai donc pris du temps pour chercher des sons sympas. Vous verrez que chaque évènement du jeu est associé à un son particulier. Par ailleurs, j’avais conçu une palette de couleur que je trouvais agréable et lisible. Les premiers retours des utilisateurs étaient formels : les couleurs manquaient de lisibilité (ce qui est assez logique, car personne ne perçoit les couleurs de la même manière). J’ai donc ajouté plusieurs palettes de couleur et la possibilité de créer, dans le jeu, la sienne propre. De même, on peut équilibrer les sons entre eux, et choisir parmi 4 polices différentes en termes de style & lisibilité. Cela permet de facilement créer une ambiance visuelle à son goût.
Process
Je ne peux pas parler de ce petit jeu sans donner un éclairage sur le processus de création. Grâce à Max, j’ai découvert la puissance de Cursor.com (que j’ai fait travaillé avec Grok à certains moments pour ne pas bouffer tous mes tokens trop rapidement). C’est un outil qui utilise des LLM pour écrire du code, et pour mon projet dans la suite de dev d’Apple (Xcode), il sait aller travailler tout seul dans les fichiers, modifier / ajouter / supprimer du code, créer des fichiers, tester la logique, etc. Du coup l’expérience est vraiment agréable pour un non-codeur : on se concentre sur les fonctionnalités voulues dans l’app, et Cursor se démerde (en gros). Il ne reste plus qu’à compiler et à tester. Les outils d’iA sont vraiment en train de révolutionner beaucoup de choses, et c’est particulièrement vrai dans le domaine du code. J’avais une grande frustration lors de nos premiers jeux avec Max : je ne pouvais pas l’aider pour le code, qu’il maîtrise, et pas moi. C’est désormais une époque révolue, puisqu’un « novice » comme moi peut créer de toutes pièces une application déployée sur l’App Store. On ne réalise pas bien toutes les conséquences, à mon avis.
Ressources
Comme souvent, je me suis servi des incroyables ressources mises à disposition sur le web. J’espère n’oublier personne dans cette section de remerciements, car c’est vraiment un bonheur d’avoir autant de choses disponibles, utilisables et de qualité. Donc, dans le désordre, un très grand merci à toutes ces personnes et entreprises qui ont mis des ressources (payantes ou gratuites) à disposition des utilisateurs.
- Code : Grok.com & Cursor.com, Github.com, et un grand merci à Max pour son aide pour la mise en place du projet et décoinçages ponctuels
- Polices : sur le remarquable Google Fonts. Merci à :
- Petr van Blokland pour Bitcount Grid Single
- Google pour Google Sans
- Toshi Omagari, Jennifer Daniel pour DynaPuff
- JM Solé pour Alfa Slab One
- Sons : Freesound.org, vocalremover.org/pitch, pitchchanger.io. Sur Freesound.org un grand merci pour leurs sons à HelloIJustWantSomeSounds, Cat-Fox_alex, NoiseCollector, rhodesmas, Anomaex, HenryRichard, Moutain_Man, Rvgerxini, Squirrel_404, collwyn, ConManVD, cherrysylv
- Musique d’ambiance : « Puzzle Game 2 » par Eric Matyas Soundimage.org
- Palette de couleur : Coolors.com — Tropical Sunset Vibes légèrement augmentée
- beta-testing: merci à Gontman, flyingbearcub, stephies, paul_cglt, Napoleon1212, PilotePépère106, Lapluben
Pour finir, un petit aperçu du jeu en action.
-

Dualisme ?
Je ne résiste pas au plaisir de partager à nouveau une vidéo de Monsieur Phi, car je la trouve remarquable, essentielle pour comprendre les débats pas toujours explicites qui animent le monde de l’IA, et riches en citations et références que je souhaite réutiliser (notamment l’ouvrage de La Mettrie, L’homme Machine, 1748).
-

Vision aveugle
« Vision aveugle » (Blindsight, en anglais), est un roman de science-fiction de Peter Watts, auteur canadien. Il est scientifique de formation, et publie sur son site depuis longtemps une partie de ses nouvelles en licence Creative Commons.
C’est un roman étrange, et à vrai dire j’ai été un peu déçu. L’histoire, pourtant, avait tout pour me passionner : un groupe de 4 astronautes est envoyé en mission pour aller voir ce qu’est l’étrange objet qui envoie des signaux depuis une « comète trans-neptunienne de la ceinture de Kuiper ». C’est le thème ultra vu et revu de la « rencontre du 3ème type » avec les extra-terrestres. Tout y est assez bien décrit, le roman déborde d’imagination et il y a pleins de passages super, mais c’est très (trop) cérébral, les réflexions (passionnantes au demeurant) sur la conscience, l’IA, la biologie et plein d’autres sujets prennent trop de place par rapport à l’action et à l’histoire.
C’est le roman d’un scientifique, super cultivé (la biblio à la fin le confirme, on dirait une bibliographie de thèse de recherche), avec des thèmes passionnants, mais pour moi pas un romancier pur et dur. Les personnages sont tous complètement déjantés, et il est dur de s’y projeter. Dommage, car l’idée de fond du roman (que je ne divulgache pas) est vraiment une idée géniale, un peu maltraitée par trop de sérieux et de rigueur, et pas assez de sens narratif. La « Hard science fiction » ne doit pas devenir de la science tout court. -

La parole aux machines
Thibaut Giraud (alias Monsieur Phi) vient de publier un ouvrage passionnant et très solide sur les LLM : sous-titré « Philosophie des grands modèles de langage », il revient sur les premiers pas des LLM (Large Language Models), sur la manière dont cela fonctionne, pour terminer l’ouvrage par une série de questions toutes plus passionnantes les unes que les autres, et qui sont pour le moment sans réponses totalement certaines (les LLM ont-ils une conscience ? les LLM peuvent-ils nous nuire ?).
Je ne vais pas détailler dans cette recension le livre par le menu, d’une part parce que ça n’aurait pas grand intérêt (allez l’acheter, je vous le recommande), et d’autre part parce qu’une partie de son contenu est en partie accessible en ligne (à plein d’endroits pour la description de ce que sont les LLM et sur la chaine Youtube de Monsieur Phi, pour les aspects développés dans la deuxième partie du livre, dont les vidéos sont toujours très bien faites (je la suis depuis déjà plus de 7 ans). Je linkerai ici celles qui renvoient à certains passage du livre. Je partage simplement quelques points que je retiens personnellement, et qui ont alimenté ma réflexion et soulevé des questions.Vrai connaisseur
Thibaut Giraud, docteur en philosophie, spécialiste de la logique et de la philosophie du langage, est quelqu’un de vraiment très pédagogue, et qui met les mains dans le cambouis. Les LLM, ils ne les regardent pas du haut d’une tour conceptuelle flottant dans l’éther philosophique : non, il s’en sert, l’utilise, la teste, y réfléchit, et s’appuie sur les travaux des chercheurs pour continuer à y réfléchir. Cela permet de se rendre compte, comme sur beaucoup de sujets, à quel point les journalistes invitent en général non pas les experts des sujets, mais ceux qui sont prêt à baratiner pour leur servir ce qu’ils veulent entendre. Thibaut Giraud, c’est le moins que l’on puisse dire, règle leur compte, à juste titre, à des guignols comme Luc Julia ou Raphaël Enthoven, qui sont invités partout, pour dire des choses fausses à propos des LLM, ne prouvant rien d’autre que leur incapacité crasse à simplement confronter leurs idées à la réalité empirique. Si vous voulez voir un mise à mort philosophique, c’est intéressant. Raphaël Enthoven raconte n’importe quoi. Luc Julia aussi. Merci à Thibaut Giraud de montrer leur nudité.
Les machines ont pris la parole
Le livre s’ouvre sur ce qui devrait tous nous étonner, radicalement : les LLM signent une rupture réelle dans l’histoire de l’humanité. Depuis leur arrivée, et l’accélération du développement de leurs compétences, les humains ont perdus le monopole du langage. Cette caractéristique qui nous permettait de séparer les humains du reste de l’univers est tombé. Tout texte, désormais, est possiblement le fruit du travail d’une machine, et dans la plupart des cas il est presqu’impossible au commun des mortels de faire la différence entre une production humaine et celle d’un LLM.
Le doute s’immisce… Un doute étrange et profondément nouveau. Songez-y : il aurait été absurde de le formuler il y a seulement dix ans. Nostalgie d’une époque où l’écriture était encore le privilège de l’humanité… C’est fini. (…) (les doutes) continueront de peser sur tout ce qui s’écrit, et de plus en plus au fur et à mesure qu’augmentera la qualité des textes générés. Ne serait-ce qu’en cela, il me semble que notre rapport au langage a été profondément et irrémédiablement changé : sa maîtrise n’est plus le critère de distinction par excellence de l’être humain. Désormais, les machines aussi parlent. Pour autant, pensent-elles ?
Une bonne partie partie du livre est consacré à répondre à cette question, loin d’être triviale, et auquel le bon sens n’apporte en général qu’une réponse préfabriquée visant plus à se rassurer qu’à sérieusement considérer cette problématique, d’où le grand intérêt du livre.Changement de paradigme
Ce qui rend contrintuitifs beaucoup de débats à propos de l’IA et des LLM, c’est que la paradigme informatique à l’oeuvre n’est plus le même que celui que nous avons intériorisé pendant les trente ou quarante dernières années. Nous sommes sortis sur paradigme purement « programmé » (une suite d’instructions dit à la machine ce qu’elle doit faire), à un paradigme « d’apprentissage » (un réseau de neurones formels, pré-entrainé, apprend automatiquement, sur la base d’énormes quantités de données, à produire les « bonnes » réponses). Dans le cas d’un programme classique, on sait décrire précisément ce que fait le code (même s’il le fait dans des échelles de temps et de données sans commune mesure avec ce que nous pouvons imaginer). Dans le cas d’une IA, et plus spécifiquement d’un LLM, nous ne savons pas, devant le fonctionnement du modèle, dire précisément ce qu’il fait. Les milliards de paramètres du réseau de neurones ne nous permettent pas vraiment d’être très clair sur la manière dont le modèle donne la bonne réponse.
On redécouvre dans ce domaine la notion d’émergence, ou d’ordre spontané : un ensemble même minimal de règles peut donner lieu des résultats complexes, imprévisibles. Les neurones donnent bien naissance à la « conscience », n’est-il pas naturel qu’un réseau de neurones informatique, surtout de cette taille là, puisse générer des choses inattendues et non prévisibles ?Les machines sont-elles conscientes ?
Poser la question, et elle est pertinente, montre à quel point cette révolution technologique est radicale : on est en pleine science fiction. S’appuyant sur beaucoup de travaux de chercheurs (notamment certains de ceux qui travaillent chez OpenAI ou Anthropic), l’auteur montre que sur des LLM simplifiés, on a pu mettre en place des « sondes » qui permettent d’accéder à l’état de certaines couches de neurones du réseau. La conclusion est pour le moins troublante (détail dans cette vidéo).
C’est un résultat fascinant : avec ces sondes, il semble que l’on mette le doigt sur une véritable représentation interne qui a émergé au cours de l’entraînement pour faciliter le travail de prédiction. La boîte noire du réseau de neurones n’est plus si noire. Et les chercheurs sont allés plus loin pour identifier le rôle que joue cette représentation interne : que se passe-t-il quand on la manipule ? (…) Grâce aux sondes qu’ils ont entraînées, les chercheurs savent maintenant ce qui, dans l’état interne du modèle, représente l’information, selon laquelle il y a un pion blanc sur la case f8 par exemple. Ils peuvent dès lors manipuler cet état interne pour qu’il représente plutôt la présence d’un pion noir sur cette case. Ils ont en quelque sorte changé, non pas l’état du plateau selon l’historique de coups, mais ce que le modèle a « dans la tête », sa représentation du plateau, quand il y a réfléchit. Désormais, il « voit » un pion noir en f8. (…) De façon générale, après manipulation de la représentation du modèle, les prédictions restent des coups légaux selon la représentation modifiée dans plus de 99,9% des cas.
Pour aller plus loin des chercheurs ont publié un papier intitulé « La conscience dans l’intelligence artificielle : l’éclairage des sciences de la conscience » (Butlin et al. 2023). Ils prennent un certain nombre de modèles scientifiques de la conscience, et des caractéristiques de la conscience, et regardent si les modèles LLM répondent à certains de ces critères. La conclusion est sans appel : nos connaissances sur ce qu’est la conscience ne nous permettent pas vraiment de répondre à la question.
En somme, ce rapport sur la conscience artificielle semble avant tout mettre en lumière un profond déficit de connaissance : même en se basant sur nos meilleurs théories scientifiques de la conscience, celles-ci ne nous en apprennent tout simplement pas assez pour déterminer si un système est ou n’est pas conscient. Et ce n’est pas seulement une incertitude liée au fait que nous ne savons pas quelle est la bonne théorie parmi les six proposées : aucune ne permet de trancher de façon claire. Nous sommes face à une ignorance fondamentale qui devrait nous inciter à la prudence sur ces questions d’attribution de conscience. (…) Nous sommes capables de construire des machines simulant la conscience, mais pas de répondre à la question de savoir si elles sont effectivement conscientes. Et nous sommes partis pour construire de plus en plus de ces machines quoi qu’il en soit. C’est perturbant, mais c’est ainsi. En attendant d’y voir clair, commençons par ne pas ignorer notre ignorance.Autonomie et alignement
Dans cette logique, Thibaut Giraud termine le livre en discutant les concepts d’autonomie et d’alignement, montrant un certains nombre d’exemples et de cas limites, où l’on parvient à mettre en évidence des comportements étranges et non alignés des LLM (capacités à mentir, ou à se comporter différemment de ce quel les développeurs avaient mis comme intention dans le modèle). Le fait de faire expliciter les CoT (Chain of thoughts, les maillons du raisonnement) permet en partie de limiter ces phénomènes, mais ça n’est pas si simple, et par ailleurs, ces éléments feront partie de la matière d’entraînement des LLM, donc potentiellement ils pourraient les contourner. L’auteur renvoie à la Déclaration sur le risque de l’IA (avec en auteur entres autres Yoshua Bengio). Cela rejoint les prises de position d’Elon Musk sur l’IA, et son engagement dans une IA open source, dont le but est de chercher le maximum de vérité. Car oui, ces « choses » ne semblent qu’à leur début, avec une puissance énorme, et un contrôle par les humains plutôt mal assuré. Prudence et utilisation vont de pair, à mon sens. Ce n’est pas en mettant la tête dans le sable que l’on pourra jouer avec cette réalité.
Ouvrage passionnant
Je vous recommande chaudement ce livre admirable de clarté, et de profondeur. Tout y est bien mis en perspective, concret quand il le faut, conceptuel quand il le faut, sourcé toujours, et souvent drôle. Vous y découvrirez encore plein d’autres choses passionnantes, comme les expériences de pensée de la chambre chinoise, ou du cerveau colossal (d’ailleurs aussi présent dans Le problème à trois corps).
A lire, pour ne pas se contenter des avis superficiels conduisant au rejet suffisant, ou à l’adhésion béate.