News le 6 avril, OpenAI a publié un article mercredi, heure locale des États-Unis, détaillant ses méthodes pour assurer la sécurité de l'IA, notamment en effectuant des évaluations de sécurité, en améliorant les garanties après la publication, en protégeant les enfants et en respectant la vie privée. L’entreprise a déclaré qu’il était essentiel de garantir que les systèmes d’IA soient construits, déployés et utilisés en toute sécurité pour réaliser sa mission.
Voici le texte intégral de l'article d'OpenAI :
OpenAI s'engage à garantir une sécurité renforcée de l'IA qui profite au plus grand nombre. Nous savons que nos outils d’IA apportent aujourd’hui beaucoup d’aide aux gens. Des utilisateurs du monde entier nous ont signalé que ChatGPT les aidait à améliorer leur productivité, à renforcer leur créativité et à offrir une expérience d'apprentissage sur mesure. Mais nous reconnaissons également que, comme pour toute technologie, ces outils comportent de réels risques. C'est pourquoi nous travaillons dur pour garantir la sécurité à tous les niveaux du système.
Créer un système d'intelligence artificielle plus sûr
Avant de lancer tout nouveau système d'intelligence artificielle, nous effectuerons des tests rigoureux, solliciterons l'avis d'experts externes et améliorerons les performances du modèle grâce à des techniques telles que l'apprentissage par renforcement avec retour humain. Dans le même temps, nous avons également mis en place de vastes systèmes de sécurité et de surveillance.
Prenons l'exemple de notre dernier modèle GPT-4. Après avoir terminé la formation, nous avons effectué des tests à l'échelle de l'entreprise pendant 6 mois maximum pour nous assurer qu'il était plus sécurisé et plus fiable avant sa sortie publique.
Nous pensons que les systèmes d'intelligence artificielle puissants doivent faire l'objet d'évaluations de sécurité rigoureuses. Une réglementation est nécessaire pour garantir une adoption généralisée de cette pratique. C’est pourquoi nous nous engageons activement avec les gouvernements pour discuter de la meilleure forme de réglementation.
Apprenez de l'utilisation réelle et améliorez les garanties
Nous faisons de notre mieux pour prévenir les risques prévisibles avant le déploiement du système, mais l'apprentissage en laboratoire est toujours limité. Nous effectuons des recherches et des tests approfondis, mais nous ne pouvons pas prédire comment les gens pourraient utiliser notre technologie ou en faire un mauvais usage. Par conséquent, nous pensons que l’apprentissage de l’utilisation réelle est un élément essentiel dans la création et la publication de systèmes d’IA de plus en plus sécurisés.
Nous publions soigneusement et progressivement de nouveaux systèmes d'IA, avec des garanties substantielles en place, et continuons à nous améliorer en fonction des leçons que nous apprenons.
Nous fournissons les modèles les plus puissants dans nos propres services et API afin que les développeurs puissent intégrer la technologie directement dans leurs applications. Cela nous permet de surveiller et de prendre des mesures en cas d'abus et d'élaborer des réponses. De cette façon, nous pouvons prendre des mesures pratiques au lieu de simplement imaginer comment y faire face en théorie.
L'expérience de l'utilisation réelle nous a également amené à développer des politiques de plus en plus granulaires pour lutter contre les comportements qui présentent des risques réels pour les personnes, tout en permettant à notre technologie d'être utilisée de manière plus bénéfique.
Nous pensons que la société a besoin de plus de temps pour s'adapter à une intelligence artificielle de plus en plus puissante et que toutes les personnes concernées devraient avoir leur mot à dire dans le développement futur de l'intelligence artificielle. Le déploiement itératif aide les différentes parties prenantes à engager plus efficacement des conversations sur les technologies d’IA, et il est essentiel d’avoir une expérience directe de l’utilisation de ces outils.
Protéger les enfants
L'un des axes de notre travail en matière de sécurité est la protection des enfants. Nous exigeons que les personnes utilisant nos outils d'intelligence artificielle soient âgées de 18 ans ou plus, ou de 13 ans ou plus avec le consentement de leurs parents. Actuellement, nous travaillons sur la fonctionnalité de vérification.
Nous n'autorisons pas l'utilisation de notre technologie pour générer du contenu haineux, harcelant, violent ou adulte. Le dernier GPT-4 est 82 % moins susceptible de répondre aux demandes de contenu restreint que le GPT-3.5. Nous disposons de systèmes robustes pour surveiller les abus. GPT-4 est désormais disponible pour les abonnés de ChatGPT Plus, et nous espérons permettre à davantage de personnes d'en faire l'expérience au fil du temps.
Nous avons pris des mesures importantes pour minimiser le potentiel de nos modèles de produire du contenu préjudiciable aux enfants. Par exemple, lorsqu'un utilisateur tente de télécharger du matériel abusif sans danger pour les enfants sur notre outil de génération d'images, nous le bloquons et signalons le problème au Centre national pour les enfants disparus et exploités.
En plus de la protection de sécurité par défaut, nous travaillons avec des organisations de développement telles que l'organisation à but non lucratif Khan Academy pour adapter les mesures de sécurité à leurs besoins. Khan Academy a développé un assistant d'intelligence artificielle qui peut servir de tuteur virtuel pour les étudiants et d'assistant de classe pour les enseignants. Nous travaillons également sur des fonctionnalités qui permettent aux développeurs de définir des normes plus strictes pour la sortie des modèles afin de mieux prendre en charge les développeurs et les utilisateurs qui ont besoin de telles fonctionnalités.
Respectez la confidentialité
Nos grands modèles linguistiques sont formés sur un vaste corpus de texte, y compris du contenu accessible au public, du contenu sous licence et du contenu généré par des réviseurs humains. Nous n'utilisons pas ces données pour vendre nos services ou notre publicité, ni pour créer des profils. Nous utilisons simplement ces données pour améliorer la capacité de nos modèles à aider les gens, par exemple en rendant ChatGPT plus intelligent en ayant davantage de conversations avec les gens.
Bien qu'une grande partie de nos données de formation incluent des informations personnelles disponibles sur le Web public, nous souhaitons que nos modèles apprennent à connaître le monde dans son ensemble, et non les individus. Par conséquent, nous nous engageons à supprimer les informations personnelles des ensembles de données de formation lorsque cela est possible, à affiner les modèles pour refuser les demandes de requête d'informations personnelles et à répondre aux demandes des individus visant à supprimer leurs informations personnelles de nos systèmes. Ces mesures minimisent la probabilité que notre modèle génère des réponses contenant des informations personnelles.
Amélioration de la précision factuelle
Les grands modèles linguistiques d'aujourd'hui peuvent prédire les prochains mots susceptibles d'être utilisés en fonction des modèles précédents et du texte saisi par l'utilisateur. Mais dans certains cas, le mot suivant le plus probable peut en réalité être factuellement incorrect.
L'amélioration de l'exactitude factuelle est l'un des objectifs d'OpenAI et de nombreux autres organismes de recherche en IA, et nous progressons. Nous avons amélioré l'exactitude factuelle de GPT-4 en tirant parti des commentaires des utilisateurs sur les résultats de ChatGPT qui ont été signalés comme incorrects en tant que source de données principale. Par rapport au GPT-3.5, le GPT-4 est plus susceptible de produire un contenu factuel, avec une amélioration de 40 %.
Nous nous efforçons d'être aussi transparents que possible lorsque les utilisateurs s'inscrivent pour utiliser l'outil afin d'éviter d'éventuelles réponses incorrectes de ChatGPT. Cependant, nous avons reconnu qu’il reste encore du travail à faire pour réduire davantage le risque de malentendu et sensibiliser le public aux limites actuelles de ces outils d’IA.
Recherche et engagement continus
Nous pensons qu'un moyen pratique de résoudre le problème de la sécurité de l'IA consiste à investir plus de temps et de ressources dans des techniques efficaces d'atténuation et d'étalonnage et à cibler les situations du monde réel où elles peuvent être utilisées à mauvais escient pour tester.
Il est important de noter que nous pensons que l’amélioration de la sécurité et des capacités de l’IA doit se faire simultanément. Notre meilleur travail de sécurité à ce jour a été réalisé en travaillant avec nos modèles les plus performants, car ils suivent mieux les instructions de l'utilisateur et sont plus faciles à exploiter ou à « guider ».
Nous créerons et déploierons des modèles plus performants avec une prudence croissante, et continuerons à renforcer les précautions de sécurité à mesure que les systèmes d'IA évoluent.
Bien que nous ayons attendu plus de 6 mois pour déployer GPT-4 afin de mieux comprendre ses capacités, ses avantages et ses risques, l'amélioration de la sécurité des systèmes d'IA peut parfois prendre plus de temps. Par conséquent, les décideurs politiques et les développeurs d’IA doivent veiller à ce que le développement et le déploiement de l’IA soient efficacement réglementés à l’échelle mondiale afin que personne ne prenne de raccourcis pour garder une longueur d’avance. Il s’agit d’un défi difficile qui nécessite une innovation technologique et institutionnelle, mais nous sommes désireux d’y contribuer.
Résoudre les problèmes de sécurité de l’IA nécessitera également un débat, une expérimentation et un engagement approfondis, notamment en fixant des limites au comportement des systèmes d’IA. Nous avons encouragé et continuerons de promouvoir la collaboration et le dialogue ouvert entre les parties prenantes afin de créer un écosystème d’IA plus sûr. (Xiao Xiao)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!