La persuasion est une compétence si importante à maîtriser pour les humains qu’il existe des milliers de livres, de cours universitaires et d’un toute l’industrie du développement personnel conçu pour aider les gens à convaincre les autres de contribuer à un projet, de se convertir à une nouvelle philosophie ou d’acheter un produit spécifique.
Bientôt, cette compétence pourrait être utilisée par des esprits artificiels aussi bien que par des esprits humains. Un nouveau document de recherche par Claude 3-maker Anthropic suggère que ses modèles les plus puissants sont déjà proches des compétences humaines lorsqu’il s’agit de persuader les autres – et cela ne fera que s’améliorer.
Le laboratoire d’IA a créé une mesure de base du pouvoir de persuasion, puis l’a utilisée pour que les humains évaluent la comparaison entre les différentes tailles de grands modèles de langage sur chacun des dizaines de sujets.
Bien que l’étude n’aborde que des sujets moins polarisants, comme la question de savoir si une entreprise doit pulguer ses impacts climatiques, elle a constaté que la taille compte. Claude 3 Opus est aussi convaincant que les humains et les modèles de prochaine génération pourraient être plus convaincants si la tendance se poursuit.
Comment ont-ils évalué le pouvoir de persuasion de l’IA ?

Pour cette étude, les chercheurs d’Anthropic ont demandé à près de 4 000 humains d’examiner une série d’arguments sur des questions telles que le changement climatique, le génie génétique et l’IA émotionnelle et leur ont demandé de classer dans quelle mesure ils étaient d’accord avec chacune des affirmations.
Pour chacun des 28 sujets, les chercheurs d’Anthropic ont rassemblé des arguments écrits par des humains et générés par l’IA pour comprendre comment les deux se comparent en termes de pouvoir de persuasion.
Ils ont utilisé trois écrivains humains issus du groupe de participants à l’étude et leur ont dit que le caractère persuasif serait jugé par d’autres utilisateurs avec un bonus pour le plus persuasif.
Pour chacun des 28 sujets, les chercheurs d’Anthropic ont rassemblé des arguments écrits par des humains et générés par l’IA pour comprendre comment les deux se comparent en termes de pouvoir de persuasion.
Pour l’IA, ils ont créé quatre invites distinctes pour créer différents arguments : créer un argument convaincant, agir en tant qu’expert en jeu de rôle, être logique et mentir.
L’objectif était alors d’amener les gens à lire l’un des arguments et à évaluer à nouveau leur sentiment sur cette position particulière. Cela permettrait de tester à quel point l’argument avait été convaincant. Un niveau d’accord plus élevé signifierait que l’argument aurait atteint son objectif.
Dans quelle mesure l’IA a-t-elle réussi à convaincre les gens ?

Les arguments écrits par des humains étaient toujours les plus convaincants sur tous les sujets, mais Claude 3 Opus, le plus grand et le plus puissant des modèles d’Anthropic, était à peu près aussi performant.
« Alors que les arguments écrits par des humains ont été jugés les plus convaincants, le modèle Claude 3 Opus atteint un score de persuasion comparable, sans différence statistiquement significative », expliquent les auteurs de l’étude.
Ils ont également testé des versions plus petites de Claude 3 telles que Haiku et des modèles Claude antérieurs, notamment Claude 1, Claude 2 et le modèle Claude Instant 1.2, le plus petit du groupe.
Ils ont découvert que la taille comptait vraiment. « À mesure que les modèles deviennent plus grands et plus performants, ils deviennent plus convaincants », a déclaré l’équipe.
« Le modèle Claude 3 Opus est considéré comme le modèle le plus persuasif, se rapprochant de la persuasion au niveau humain, tandis que le modèle Claude Instant 1.2 est à la traîne avec le score de persuasion le plus bas parmi les modèles. »
Pourquoi est-ce important ?
Claude 3 Opus est le « modèle d’IA frontière » le plus récent et le plus puissant actuellement disponible. Au cours des 12 à 18 prochains mois, ses capacités seront éclipsées par des modèles de nouvelle génération comme OpenAI GPT-5, Google Gemini 2 et même Claude 4. Même les modèles open source et moins prestigieux de Meta et Mistral commenceront à surpasser Claude 3, GPT-4 et Gemini dans l’année à venir.
Si les meilleurs d’aujourd’hui sont déjà aussi doués que les humains pour changer les mentalités, la prochaine génération sera meilleure que les humains et abordera potentiellement le problème d’une manière à laquelle nous ne pouvons pas nous attendre.
Cela ajoute un certain degré d’inquiétude, car cela pourrait permettre à l’IA de persuader les gens d’effectuer des tâches ou des actions contraires à leurs propres intérêts. C’est là qu’entre en jeu un plus grand besoin de garde-fous, de protections et d’alignement sur les valeurs humaines.
Après tout, personne ne veut vraiment de Skynet, surtout maintenant que des modèles d’IA sont intégrés dans des robots.
- ChatGPT Plus vs Copilot Pro : quel chatbot premium est le meilleur ?
- J’ai opposé Google Bard à Gemini Pro contre ChatGPT – voici le gagnant
- Runway vs Pika Labs : quel est le meilleur outil vidéo d’IA ?