L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.-IA-php.cn

Table des matières

Ou Transformer

Résultats expérimentaux

One More Thing

Maison

Périphériques technologiques

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

王林

Apr 10, 2023 am 08:51 AM

base de données ai sota

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Je dois dire que les scientifiques sont récemment obsédés par l'idée de donner des cours de mathématiques sur l'IA.

Non, l'équipe Facebook s'est également jointe à la fête et a proposé un nouveau modèle capable d'automatiser complètement la démonstration de théorèmes et qui est nettement meilleur que SOTA.

Vous devez savoir qu'à mesure que les théorèmes mathématiques deviennent plus complexes, il deviendra de plus en plus difficile de prouver les théorèmes uniquement par la puissance humaine.

Par conséquent, utiliser des ordinateurs pour démontrer des théorèmes mathématiques est devenu un axe de recherche.

OpenAI a également proposé précédemment un modèle GPT-f spécialisé dans cette direction, qui peut démontrer 56% des problèmes de Metamath.

La dernière méthode proposée cette fois peut augmenter ce nombre à 82,6%.

Dans le même temps, les chercheurs affirment que cette méthode prend moins de temps et peut réduire la consommation informatique à un dixième de celle d'origine par rapport au GPT-f.

Peut-on dire que cette fois l'IA réussira son combat contre les mathématiques ?

Ou Transformer

La méthode proposée dans cet article est un programme de formation en ligne basé sur Transformer.

peut être grossièrement divisé en trois étapes :

Première, pré-formation dans la bibliothèque de preuves mathématiques ;

Deuxièmement, affiner le modèle de politique sur l'ensemble de données supervisé ;

Troisième, en ligne ; Modèle de stratégie de formation et modèle de jugement.

Plus précisément, il utilise un algorithme de recherche pour permettre au modèle d'apprendre de la bibliothèque de preuves mathématiques existante, puis de le promouvoir pour prouver davantage de problèmes.

Il existe trois types de bibliothèques de preuves mathématiques, à savoir Metamath, Lean et un environnement de preuve auto-développé.

Pour faire simple, ces bibliothèques de preuves convertissent le langage mathématique ordinaire en une forme similaire à un langage de programmation.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

La bibliothèque principale de Metamath est set.mm, qui contient environ 38 000 preuves basées sur la théorie des ensembles ZFC.

Lean est mieux connu comme l'algorithme d'IA de Microsoft qui peut participer aux compétitions de l'OMI. La bibliothèque Lean est conçue pour enseigner à l'algorithme du même nom toutes les connaissances mathématiques du premier cycle et lui permettre d'apprendre à prouver ces théorèmes.

L'objectif principal de cette recherche est de construire un prouveur capable de générer automatiquement une série de stratégies appropriées pour prouver des problèmes.

À cette fin, les chercheurs ont proposé un algorithme de recherche de preuve d'hypergraphe hors équilibre basé sur MCTS.

MCTS est traduit par Monte Carlo Tree Search, qui est souvent utilisé pour résoudre les problèmes d'arbre de jeu. Il est bien connu grâce à AlphaGo.

Son processus de fonctionnement consiste à trouver des actions prometteuses en échantillonnant aléatoirement dans l'espace de recherche, puis à élargir l'arbre de recherche en fonction de cette action.

L'idée adoptée dans cette étude est similaire à celle-ci.

Le processus de preuve de recherche commence à partir de l'objectif g, recherche des méthodes vers le bas et se développe progressivement vers un hypergraphe.

Lorsqu'un ensemble vide apparaît sous une branche, cela signifie qu'une preuve optimale a été trouvée.

Enfin, pendant le processus de rétropropagation, enregistrez les valeurs des nœuds et le nombre total d'opérations du supertree.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Dans ce lien, les chercheurs ont supposé un modèle de stratégie et un modèle de jugement.

Le modèle de politique permet un échantillonnage par le modèle de jugement, qui peut évaluer la capacité de la stratégie actuelle à trouver des méthodes de preuve.

L'ensemble de l'algorithme de recherche est basé sur les deux modèles ci-dessus comme référence.

Ces deux modèles sont des modèles Transformer et partagent des poids.

Vient ensuite l’étape de formation en ligne.

Dans ce processus, le contrôleur enverra la déclaration à une vérification HTPS asynchrone et collectera les données de formation et de preuve.

Le validateur enverra ensuite les échantillons de formation au formateur distribué et synchronisera périodiquement sa copie du modèle.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Résultats expérimentaux

Lors de la session de test, les chercheurs ont comparé HTPS avec GPT-f.

Ce dernier est un modèle de raisonnement par théorème mathématique précédemment proposé par OpenAI, également basé sur Transformer.

Les résultats montrent que le modèle après formation en ligne peut prouver 82% des problèmes dans Metamath, dépassant de loin le record précédent de 56,5% de GPT-f.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Dans la bibliothèque Lean, ce modèle peut prouver 43 % des théorèmes, soit 38 % de plus que SOTA. Voici les questions du test IMO prouvées par ce modèle.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Mais ce n’est pas encore parfait.

Par exemple, dans la question suivante, cela n'a pas résolu la question de la manière la plus simple. Les chercheurs ont dit que c'était parce qu'il y avait des erreurs dans les annotations.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

One More Thing

Utilisation d'ordinateurs pour démontrer des problèmes mathématiques, la preuve du théorème des quatre couleurs est l'un des exemples les plus connus.

Le théorème des quatre couleurs est l'un des trois problèmes majeurs des mathématiques modernes. Il stipule que "n'importe quelle carte ne peut utiliser que quatre couleurs pour colorer les pays ayant des frontières communes dans des couleurs différentes".

Étant donné que la démonstration de ce théorème nécessite de nombreux calculs, personne n'a pu le démontrer pleinement dans les 100 ans suivant sa proposition.

Jusqu'en 1976, après 1 200 heures et 10 milliards de jugements sur deux ordinateurs de l'Université de l'Illinois, il était enfin possible de démontrer que n'importe quelle carte n'a besoin que de 4 couleurs pour la marquer, ce qui a également fait sensation dans toute la frontière mathématique.

De plus, à mesure que les problèmes mathématiques deviennent plus complexes, il devient plus difficile d'utiliser la puissance humaine pour vérifier si le théorème est correct.

Récemment, la communauté de l'IA s'est progressivement concentrée sur les problèmes mathématiques.

En 2020, OpenAI a lancé le modèle de raisonnement de théorème mathématique GPT-f, qui peut être utilisé pour la preuve automatique de théorèmes.

Cette méthode peut compléter 56,5 % des preuves de l'ensemble de tests, dépassant de plus de 30 % le modèle SOTA MetaGen-IL de l'époque.

La même année, Microsoft a également publié Lean, qui peut créer des questions de test IMO, ce qui signifie que l'IA peut poser des questions qu'elle n'a jamais vues auparavant.

L'année dernière, après qu'OpenAI ait ajouté un vérificateur à GPT-3, l'effet de la résolution de problèmes mathématiques était nettement meilleur que la méthode de réglage fin précédente, et il pouvait atteindre 90 % du niveau des élèves du primaire.

En janvier de cette année, une étude conjointe du MIT + Harvard + Columbia University + University of Waterloo a montré que le modèle qu'ils proposaient pouvait faire des mathématiques avancées.

En bref, les scientifiques travaillent dur pour faire de l'IA, un sujet partiel, capable à la fois d'arts et de sciences.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Windows 11 KB5062660 24h2 avec fonctionnalités, liens de téléchargement direct pour installateur hors ligne (.mSU)

1 Il y a quelques mois By Jack chen

<🎜> GigantAmax Journey Timed Research Sont-étapes et code

4 Il y a quelques semaines By Jack chen

PHP appelle AI Intelligent Voice Assistant Assistant PHP Interaction System Construction

4 Il y a quelques semaines By

Comment utiliser PHP pour créer des fonctions de partage social PHP Partage d'interface Pratique

4 Il y a quelques semaines By

Comment faire appel d'une violation des lignes directrices communautaires sur Tiktok?

4 Il y a quelques semaines By 下次还敢

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Tutoriel PHP

1545

276

Afficher plus

Related knowledge

Le prix du lien entre la rupture de 24 USD Analyse de la résistance des clés: ChainLink Project Fundamentals and Price Trends Aug 16, 2025 pm 12:15 PM

Contenu: Tendance actuelle des prix et signaux techniques clés pour stimuler la liaison des principaux facteurs de base et les fonds institutionnels à forte entrée Mécanisme de réserve stratégique Renforce le projet de projet d'expansion écologique accélérée: Dominer les actifs réels réels (RWA) 24,64 $, la prochaine cible de Link est le niveau de retracement de Fibonacci 0,786 26,46, ce qui peut défier le sommet de 2024 de 30,93 $ après la percée. Support clé

Qu'est-ce que Render (RNDR Coin)? Quel est le prix? 2025 - prévisions de prix de la pièce des années 2030 Aug 16, 2025 pm 12:30 PM

Qu'est-ce que le rendu? La blockchain remodèle le rendu des écosystèmes de rendu graphique est un réseau de rendu GPU décentralisé construit sur la technologie blockchain, déterminé à briser le modèle de concentration des ressources dans le domaine du rendu graphique traditionnel. Il relie efficacement les parties de l'offre et de la demande de l'offre et de la demande mondiales de calcul de l'informatique par le biais de mécanismes de contrat intelligents: créateurs de contenu (tels que les sociétés de production de film, les équipes de développement de jeux, les laboratoires AI, etc.): ils peuvent soumettre des tâches de rendu complexes sur la plate-forme et payer pour eux avec des jetons RNDR; Les fournisseurs de puissance informatique (individus ou institutions avec des GPU inactifs): ils contribuent à la puissance de calcul via l'accès au réseau et reçoivent des récompenses RNDR à jeton après avoir terminé les tâches. Ce modèle résout efficacement plusieurs goulots d'étranglement dans les processus de rendu traditionnels: Optimisation des coûts: Tire d'alimentation mondiale des fonds de calcul distribué

Qu'est-ce que le jeton exactement? Quelle est la différence entre le jeton et la pièce Aug 16, 2025 pm 12:33 PM

Coin est un actif natif de sa propre blockchain, comme BTC et ETH, utilisé pour payer des frais et inciter les réseaux; Les jetons sont créés sur la base de blockchains existants (tels que Ethereum) via des contrats intelligents, représentant des actifs, des autorisations ou des services, et en s'appuyant sur la chaîne d'accueil pour fonctionner, tels que l'université et le lien, et les frais de transaction doivent être payés avec ETH.

L'élan du marché taureau altcoin se renforce, le bitcoin stagne Aug 16, 2025 pm 12:48 PM

Le marché de la cryptographie a connu une touche subtile cette semaine. Le Bitcoin est tombé dans la consolidation d'environ 119 000 $, avec la volatilité rétrécissant, tandis que la plupart des Altcoins traditionnels ont montré une forte dynamique de rebond. Cette différenciation a attiré une large attention: cela indique-t-il que les fonds passent du bitcoin aux altcoins et que le marché de la rotation des altcoin a été tranquille? Bien que Bitcoin contrôle toujours fermement la domination du marché, l'indice Altsason a discrètement rebondi, libérant des changements potentiels. Les altcoins ont généralement augmenté et le bitcoin s'est accumulé latéralement et a récemment connu des changements importants dans la structure du marché. La domination du marché du bitcoin est tombée à 58,54%, en baisse de 5,32% en 24, tandis que l'éther

Qu'est-ce que le jeton Aug 16, 2025 pm 12:39 PM

Les jetons sont des actifs numériques sur des blockchains qui représentent des capitaux propres ou de la valeur. Ils peuvent être divisés en paiement, pratiques, titres, stablescoins et NFT, etc., pour le stockage de la valeur, l'échange, la gouvernance, les récompenses, l'accès et les garanties. Ils sont émis sur des chaînes telles que Ethereum par le biais de contrats intelligents et sont créés sur les normes ERC-20. Ils peuvent être échangés sur des échanges centralisés ou décentralisés et stockés dans un stockage chaud (tel que la métamasque) ou un stockage à froid (comme le grand livre), mais des risques en face tels que les fluctuations des prix, la supervision, la technologie, les projets, la liquidité et la sécurité, et doivent être traités avec prudence.

Comprendre le rôle des jetons dans la finance décentralisée Aug 16, 2025 pm 12:12 PM

Les jetons sont des actifs numériques basés sur la blockchain et jouent un rôle fondamental dans Defi, y compris la gouvernance, l'utilité, les stablescoins, les titres et les jetons LP, etc., et sont largement utilisés dans les transactions décentralisées, les prêts, la culture du revenu et la NFT. Ils peuvent fonctionner de manière transparente et efficace grâce à des contrats intelligents. Dans le même temps, vous devez prêter attention à des risques tels que des contrats intelligents, des pertes impermanentes et des fluctuations de prix, et choisir des actifs de gestion de stockage et de sécurité appropriés.

Les noms de monnaie les plus complets de l'ensemble du réseau que les novices doivent savoir - doivent lire par Xiaobai Aug 16, 2025 pm 12:21 PM

La réponse est que vous devez maîtriser les termes de base lorsque vous entrez dans le cercle de devises pour la première fois. L'article présente des échanges traditionnels tels que Binance, Ouyi et Huobi en 2025, et explique la différence entre les échanges centralisés et décentralisés. Ensuite, il explique systématiquement les concepts de base tels que la blockchain, la crypto-monnaie, le bitcoin, l'éthereum, les altcoins, les stablescoins, ainsi que les connaissances de la sécurité des comptes telles que les clés publiques, les clés privées, les mnémoniques et les termes du marché tels que les marchés taureaux, Contrats, Dapps et frais de gaz, pour aider les novices à bien comprendre le cercle des pièces.

Comment les débutants réalisent leur premier bénéfice grâce au trading au comptant à Binance Aug 18, 2025 pm 09:09 PM

Dans Binance Spot Trading, les novices peuvent réaliser leur premier profit en achetant à bas prix et en vendant à des prix élevés. Ils doivent maîtriser les opérations de base telles que les paires de trading, le but de stop-profit et le stop-loss, et de mettre en place des positions en lots. Combinés à l'analyse technique et à l'observation du marché, ils peuvent tester les eaux avec de petites quantités de fonds régulièrement, se concentrer sur le contrôle des risques et financer la sécurité, éviter les positions complètes et les opérations de suivi, calculer clairement les bénéfices et les pertes par le biais de la tarification de l'USDT, et accumuler progressivement de l'expérience pour réaliser des bénéfices continus.

See all articles