Généralités
Radzivon Alkhovik
Adepte de l'automatisation en code bas
9 juillet 2024
Dans le cadre d'une expérience révolutionnaire, Anthropic, une société de recherche en IA de premier plan, a collaboré avec le Collective Intelligence Project pour élaborer une constitution pour un système d'IA à l'aide des commentaires d'un échantillon diversifié du public américain. Cette approche novatrice, appelée "IA constitutionnelle", vise à créer des systèmes d'IA transparents et responsables en intégrant des principes juridiques et éthiques directement dans le processus de formation de l'IA.
Cet article plonge dans les méandres de cette recherche innovante, en explorant la méthodologie, les résultats et les implications considérables pour l'avenir de la gouvernance de l'IA, à une époque où les modèles de langage avancés sont de plus en plus intégrés dans des secteurs critiques tels que la gouvernance, le système judiciaire et l'élaboration des politiques.
Principaux enseignements : L'expérience de collaboration entre Anthropic et le Collective Intelligence Project a abouti à une "constitution publique" pour un système d'IA, rédigée par un échantillon représentatif de ~1 000 Américains. La constitution publique ai met l'accent sur l'objectivité, l'impartialité et l'accessibilité, et les modèles formés sur cette constitution démontrent des performances comparables à celles des modèles formés sur la constitution d'Anthropic, tout en présentant moins de biais. L'expérience met en évidence les défis et les considérations liés à l'intégration de l'apport démocratique dans le développement de l'IA, mais représente une étape importante vers l'alignement des modèles de langage avancés sur les valeurs humaines.
L'IA constitutionnelle est une méthodologie révolutionnaire développée par Anthropic pour s'assurer que les systèmes d'IA fonctionnent en alignement avec des principes normatifs explicites, de la même manière qu'une constitution régit le comportement d'une nation. Au cœur de l'IA constitutionnelle d'Anthropic se trouve la définition d'un ensemble de valeurs et de principes de haut niveau qui servent de cadre d'orientation à l'IA. Ces principes sont soigneusement élaborés pour garantir que les actions de l'IA s'alignent sur les normes et les attentes de la société, favorisant les comportements bénéfiques tout en minimisant le potentiel de résultats néfastes.
Pour inculquer efficacement ces principes à l'IA, l'IA constitutionnelle emploie des techniques avancées telles que :
Un autre aspect critique de l'IA constitutionnelle est la curation méticuleuse des données et de l'architecture d'entraînement de l'IA. En sélectionnant soigneusement et en prétraitant les données utilisées pour former l'IA, les chercheurs peuvent s'assurer que le système est exposé à un ensemble équilibré et représentatif d'exemples qui renforcent les comportements et les valeurs souhaités. En outre, l'architecture de l'IA elle-même est conçue pour promouvoir l'alignement sur les principes constitutionnels, en incorporant des mécanismes qui encouragent les résultats utiles, inoffensifs et honnêtes.
En intégrant ces principes directement dans le processus de prise de décision de l'IA, l'IA constitutionnelle vise à créer des systèmes qui s'efforcent de manière proactive de fonctionner dans des limites éthiques et juridiques prédéfinies. Cela signifie que l'IA cherchera activement à :
L'objectif est de développer des systèmes d'IA qui sont non seulement très performants, mais aussi intrinsèquement alignés sur les valeurs humaines et les attentes de la société.
Le développement de l'IA constitutionnelle représente une avancée significative dans le domaine de la gouvernance et de l'éthique de l'IA. En établissant un ensemble clair de principes normatifs et en les intégrant dans les fonctionnalités de base de l'IA, les chercheurs peuvent créer des systèmes plus transparents, plus responsables et plus dignes de confiance. Cette approche a le potentiel d'atténuer de nombreux risques et défis associés au déploiement de l'IA dans des domaines critiques tels que la gouvernance, le système judiciaire et l'élaboration des politiques, en garantissant que ces systèmes fonctionnent au service du bien commun.
Le développement de l'IA constitutionnelle est motivé par plusieurs raisons impérieuses qui répondent aux défis critiques posés par l'intégration croissante des systèmes d'IA dans divers aspects de la société :
En résumé, l'IA constitutionnelle est motivée par le besoin pressant de s'assurer que les systèmes d'IA fonctionnent de manière éthique, conforme à la loi et digne de confiance. Alors que ces technologies s'intègrent de plus en plus à des domaines critiques et à des processus décisionnels, l'IA constitutionnelle fournit un outil puissant pour créer des systèmes d'IA transparents, responsables et intrinsèquement alignés sur les principes qui sous-tendent notre société. En donnant la priorité au développement et au déploiement de l'IA constitutionnelle, nous pouvons libérer l'immense potentiel de ces technologies tout en atténuant les risques et les défis qu'elles posent.
LatenodeL' intégration transparente de la plateforme avec l'IA constitutionnelle d'Anthropic offre aux utilisateurs un outil efficace pour exploiter des systèmes d'IA alignés sur les valeurs publiques sans la complexité de la gestion de l'infrastructure de formation du modèle. L'éditeur visuel intuitif de la plateforme simplifie le processus d'intégration de l'IA constitutionnelle à d'autres systèmes via des API, ce qui permet aux organisations d'incorporer sans effort des principes d'IA éthiques dans leurs processus d'automatisation. En utilisant Latenode, les utilisateurs peuvent commodément accéder aux fonctionnalités de Constitutional AI, y compris ses capacités d'atténuation des biais, de prise de décision éthique et de conformité légale. L'intégration permet également aux utilisateurs de basculer en toute transparence entre différentes configurations d'Anthropic Constitutional AI, en fonction de leurs besoins spécifiques et de leur budget. Par exemple, la création d'un script pour un chatbot de service client qui fournit des réponses impartiales et éthiques est simple.
Voici à quoi ressemble le script :
Et voici le résultat de ce scénario, où un chatbot déjà créé à l'aide de Latenode fournit une réponse impartiale à une requête d'un client :
Tu peux en savoir plus sur ce script et sur l'intégration avec Latenode dans cet article. L'intégration avec Latenode offre quelques avantages clés :
Si tu as besoin d'aide ou de conseils pour créer ton propre script ou si tu veux reproduire celui-ci, contacte. Notre communauté Discord, où se trouvent les experts en automatisation low-code.
Pour explorer le potentiel de démocratisation du développement de l'IA constitutionnelle Anthropic s'est associé au Projet d'intelligence collective pour mener un processus de contribution publique à l'aide de la plateforme Polis. L'objectif était de faire participer un échantillon représentatif de ~1 000 adultes américains à la rédaction d'une constitution pour un système d'IA. Les participants ont été invités à proposer et à voter sur des principes normatifs, contribuant ainsi à la génération collective d'un ensemble de lignes directrices pour le comportement de l'IA.
La conception du processus de participation du public a nécessité plusieurs décisions cruciales :
Le processus de consultation publique a donné lieu à une riche tapisserie de principes générés par les participants, qui ont été synthétisés en une "constitution publique" cohérente. Bien qu'il y ait eu un chevauchement modéré d'environ 50 % avec la constitution interne d'Anthropic en termes de concepts et de valeurs de base, la constitution publique présentait plusieurs distinctions notables :
Ces différences soulignent la valeur de l'intégration de diverses perspectives publiques dans l'élaboration des fondements éthiques des systèmes d'IA.
Pour évaluer l'impact de la constitution publique, Anthropic a formé deux variantes de son modèle d'IA, Claude - l'une utilisant la constitution publique (modèle public) et l'autre utilisant leur constitution interne originale (modèle standard). Ces modèles, ainsi qu'un modèle de contrôle, ont été soumis à une évaluation rigoureuse sur plusieurs dimensions :
Ces évaluations fournissent des indications précieuses sur l'efficacité de l'IA constitutionnelle à aligner les modèles linguistiques sur les valeurs et les principes déterminés publiquement.
Le processus de formation d'un modèle d'IA basé sur les commentaires qualitatifs du public a présenté un ensemble unique de défis et a nécessité un examen minutieux à chaque étape :
Ces leçons soulignent les multiples facettes de l'alignement de l'IA sur les valeurs publiques et l'importance de naviguer avec soin dans les considérations sociales, techniques et éthiques impliquées.
L'expérience Constituional AI menée par Anthropic et le Collective Intelligence Project a de profondes implications pour l'avenir du développement et de la gouvernance de l'IA :
Pour l'avenir, les chercheurs souhaitent s'appuyer sur ce travail fondamental en affinant leurs méthodologies, en concevant des évaluations plus ciblées et en explorant l'évolutivité et la généralisation de l'approche de l'IA constitutionnelle. Parmi les orientations futures potentielles, on peut citer :
Alors que le domaine de l'IA continue d'évoluer à un rythme sans précédent, les connaissances acquises grâce à cette expérience façonneront sans aucun doute la trajectoire des futurs efforts de recherche et de développement.
L'expérience d'IA constitutionnelle collective menée par Anthropic et le Projet d'intelligence collective est un jalon important dans la démocratisation du développement de l'IA. En impliquant le public dans la création d'une constitution de l'IA, cette recherche jette les bases d'une approche plus inclusive, transparente et responsable de la gouvernance de l'IA. Les résultats soulignent la valeur des diverses perspectives et les défis liés à l'alignement des modèles de langage avancés sur les valeurs sociétales.
L'IA constitutionnelle apparaît comme un cadre prometteur pour s'assurer que les puissantes technologies d'IA servent le plus grand bien. En plaçant les valeurs humaines au cœur du développement de l'IA, nous pouvons exploiter le potentiel de ces systèmes tout en atténuant les risques et les conséquences involontaires.
Cependant, le voyage vers une IA véritablement démocratique et alignée sur les valeurs est loin d'être terminé. L'expérience sert d'appel à la poursuite de la collaboration, de la recherche et de l'engagement public pour façonner l'avenir de l'IA. Grâce à la sagesse collective et à la participation de diverses parties prenantes, nous pouvons tracer la voie vers un avenir basé sur l'IA qui soutient la transparence, la responsabilité et l'alignement sur les valeurs humaines.
Les enseignements tirés de cette expérience novatrice informeront et inspireront les futurs projets dans ce domaine. En nous appuyant sur les bases posées par Anthropic et le Projet d'intelligence collective, nous pouvons travailler à un avenir où les systèmes d'IA sont technologiquement avancés, éthiquement fondés et socialement responsables. Le chemin à parcourir peut être semé d'embûches, mais les récompenses potentielles - un monde où l'IA et l'humanité travaillent en harmonie - en valent bien la peine.
Constitutional AI se distingue en se concentrant sur l'intégration de valeurs et de principes de haut niveau directement dans le processus de formation du système d'IA. Plutôt que de s'appuyer uniquement sur des contraintes ou une surveillance externes, l'IA constitutionnelle vise à créer des systèmes d'IA qui s'alignent intrinsèquement sur les normes et les attentes de la société.
Les chercheurs ont collaboré avec la société de sondage PureSpectrum pour recruter un échantillon représentatif d'environ 1 000 adultes américains. Le processus de sélection a pris en compte des facteurs démographiques tels que l'âge, le sexe, le revenu et la géographie afin de garantir un groupe de participants diversifié et inclusif. En outre, des critères de sélection ont été utilisés pour évaluer la familiarité des participants avec les concepts de l'IA.
La plateforme Polis a été choisie en raison de ses antécédents éprouvés en matière de facilitation de délibérations en ligne productives et de recherche de consensus. Ses fonctions collaboratives, qui permettent aux participants de s'engager dans les idées des autres et de les développer, étaient bien adaptées aux objectifs de l'expérience de l'IA constitutionnelle. Les chercheurs avaient également une expérience préalable de travail avec l'équipe Polis, ce qui a facilité une mise en œuvre plus réfléchie et plus efficace du processus de participation du public.
Pour maintenir l'intégrité du processus de participation du public, les chercheurs ont établi des critères de modération clairs. Les déclarations jugées haineuses, absurdes, redondantes, non pertinentes, mal formatées ou techniquement irréalisables ont été supprimées. Ce processus de modération a impliqué une combinaison de directives prédéfinies et de jugements subjectifs de la part de l'équipe de recherche.
Bien qu'il y ait un chevauchement modéré d'environ 50 % entre la constitution publique et la constitution interne d'Anthropic en termes de concepts et de valeurs de base, la constitution publique présente quelques distinctions notables. Elle met davantage l'accent sur l'objectivité, l'impartialité et l'accessibilité, et tend à donner la priorité à la promotion des comportements souhaités plutôt qu'au découragement des comportements indésirables. En outre, la majorité des principes de la constitution publique étaient des contributions originales des participants, plutôt que des publications ou des cadres existants.
Les modèles formés sur la constitution publique (modèles Public) ont démontré des performances comparables à celles des modèles formés sur la constitution d'Anthropic (modèles Standard) en termes de compréhension de la langue et d'utilité perçue. Cependant, les modèles Public ont montré une réduction des préjugés dans diverses dimensions sociales, comme mesuré par le cadre BBQ (Bias Benchmark for QA). Ce résultat suggère que l'intégration de l'avis du public peut potentiellement atténuer les préjugés et promouvoir l'équité dans les systèmes d'IA.
Le processus de formation d'un modèle d'IA basé sur les contributions qualitatives du public a présenté plusieurs défis. Il s'agissait notamment d'assurer une sélection représentative des participants, une modération efficace des contributions et de trouver un équilibre entre la représentation fidèle de l'opinion publique et les contraintes techniques de la formation à l'IA constitutionnelle. Les chercheurs ont également dû naviguer dans la complexité de la traduction des déclarations publiques en principes d'IA exploitables et sélectionner des mesures d'évaluation appropriées pour évaluer l'alignement des modèles résultants avec leurs constitutions.
L'expérience d'IA constitutionnelle menée par Anthropic et le Projet d'intelligence collective a des implications significatives pour l'avenir de la gouvernance de l'IA. Elle démontre qu'il est possible d'aligner des modèles de langage avancés sur des valeurs et des principes déterminés collectivement, ce qui met en évidence le potentiel d'intégration de diverses perspectives dans le développement de l'IA. L'expérience souligne également l'importance de la collaboration interdisciplinaire entre les développeurs d'IA, les chercheurs en sciences sociales et le public pour façonner les fondements éthiques de l'IA. Les recherches futures peuvent s'appuyer sur ces idées en explorant l'évolutivité et la généralisation de l'approche de l'IA constitutionnelle, en développant des cadres normalisés pour traduire les contributions du public en principes d'IA, et en étudiant les effets à long terme des systèmes d'IA alignés sur les valeurs dans des contextes réels.