목차
또는 Transformer
실험 결과
한 가지 더
기술 주변기기 일체 포함 AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

Apr 10, 2023 am 08:51 AM
데이터 베이스 ai sota

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

최근 과학자들이 AI 수학 수업에 열중하고 있다고 말씀드리고 싶습니다.

아니요, Facebook 팀도 이 재미에 동참하여 정리 시연을 완전히 자동화할 수 있고 SOTA보다 훨씬 뛰어난 새로운 모델을 제안했습니다.

수학적 정리가 더욱 복잡해질수록 인간의 노력만으로는 정리를 증명하는 것이 더욱 어려워진다는 것을 알아야 합니다.

따라서 컴퓨터를 사용하여 수학적 정리를 입증하는 것이 연구의 초점이 되었습니다.

OpenAI는 이전에도 이 방향에 특화된 GPT-f 모델을 제안했는데, 이는 Metamath의 문제점 중 56%를 보여줄 수 있습니다.

이번에 제안된 최신 방법은 이 수치를 82.6%까지 늘릴 수 있습니다.

동시에 연구원들은 이 방법이 GPT-f에 비해 시간이 덜 걸리고 컴퓨팅 소비를 원래의 10분의 1로 줄일 수 있다고 말합니다.

이번에는 AI가 수학과의 싸움에서 성공할 것이라고 말할 수 있을까요?

또는 Transformer

이 기사에서 제안하는 방법은 Transformer를 기반으로 한 온라인 교육 프로그램입니다.

는 대략 세 단계로 나눌 수 있습니다.

첫 번째, 수학적 증명 라이브러리에서 사전 훈련

두 번째, 감독되는 데이터 세트에 대한 정책 모델 미세 조정

세 번째 훈련 전략 모델과 판단 모델.

구체적으로는 검색 알고리즘을 사용하여 모델이 기존 수학적 증명 라이브러리에서 학습할 수 있도록 한 다음 이를 승격하여 더 많은 문제를 증명합니다.

수학 증명 라이브러리에는 Metamath, Lean 및 자체 개발 증명 환경의 세 가지 유형이 있습니다.

간단히 말하면 이러한 증명 라이브러리는 일반적인 수학 언어를 프로그래밍 언어와 유사한 형태로 변환합니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

Metamath의 메인 라이브러리는 set.mm이며, ZFC 집합 이론을 기반으로 한 약 38,000개의 증명을 포함하고 있습니다.

Lean은 IMO 대회에 참가할 수 있는 Microsoft의 AI 알고리즘으로 더 잘 알려져 있습니다. Lean 라이브러리는 동일한 이름의 알고리즘을 통해 모든 학부 수학 지식을 가르치고 이러한 정리를 증명하는 방법을 학습하도록 설계되었습니다.

이 연구의 주요 목표는 문제를 증명하기 위한 일련의 적합한 전략을 자동으로 생성할 수 있는 증명자를 구축하는 것입니다.

이를 위해 연구진은 MCTS 기반의 비평형 하이퍼그래프 증명 탐색 알고리즘을 제안했습니다.

MCTS는 몬테카를로 트리 검색(Monte Carlo Tree Search)으로 번역되며, 게임 트리 문제를 해결하는 데 자주 사용됩니다. 알파고 때문에 잘 알려져 있습니다.

작업 프로세스는 검색 공간에서 무작위로 샘플링하여 유망한 작업을 찾은 다음 이 작업을 기반으로 검색 트리를 확장하는 것입니다.

이번 연구에서 채택한 아이디어도 이와 비슷합니다.

탐색 증명 과정은 목표 g부터 시작하여 아래쪽으로 방법을 검색하고 점차 하이퍼그래프로 발전합니다.

브랜치 아래에 빈 세트가 나타나면 최적의 증명을 찾았다는 의미입니다.

마지막으로 역전파 과정에서 슈퍼트리의 노드 값과 총 작업 횟수를 기록합니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

이 링크에서 연구자들은 전략 모델과 판단 모델을 가정했습니다.

정책 모델에서는 현재 전략의 증명 방법 찾기 능력을 평가할 수 있는 판단 모델에 의한 샘플링을 허용합니다.

전체 검색 알고리즘은 위의 두 모델을 참고로 기반으로 합니다.

이 두 모델은 트랜스포머 모델이며 무게를 공유합니다.

다음은 온라인 교육 단계입니다.

이 과정에서 컨트롤러는 비동기식 HTPS 검증에 명령문을 보내고 훈련 및 증명 데이터를 수집합니다.

그런 다음 유효성 검사기는 훈련 샘플을 분산 트레이너에게 보내고 주기적으로 모델 복사본을 동기화합니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

실험 결과

테스트 세션에서 연구원들은 HTPS와 GPT-f를 비교했습니다.

후자는 이전에 OpenAI에서 제안한 수학적 정리 추론 모델이며 역시 Transformer를 기반으로 합니다.

결과에 따르면 온라인 교육 후 모델은 Metamath의 문제 중 82%를 증명할 수 있으며, 이는 GPT-f의 이전 기록인 56.5%를 훨씬 뛰어넘는 수치입니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

Lean 라이브러리에서 이 모델은 43%의 정리를 증명할 수 있으며 이는 SOTA보다 38% 더 높습니다. 다음은 이 모델이 증명한 IMO 테스트 문제입니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

하지만 아직 완벽하진 않아요.

예를 들어 다음 질문에서는 가장 간단한 방법으로 문제를 해결하지 못했습니다. 연구원들은 이것이 주석의 오류 때문이라고 말했습니다.

AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.

한 가지 더

컴퓨터를 사용하여 수학적 문제를 증명하는 4색 정리의 증명은 가장 잘 알려진 예 중 하나입니다.

4색 정리는 현대 수학의 세 가지 주요 문제 중 하나입니다. "모든 지도는 공통 국경이 있는 국가를 서로 다른 색상으로 색칠하기 위해 4가지 색상만 사용할 수 있습니다."

이 정리를 증명하려면 많은 계산이 필요하기 때문에 제안된 지 100년 이내에 누구도 이를 완전히 증명할 수 없었습니다.

1976년까지 일리노이 대학에서 두 대의 컴퓨터를 사용하여 1,200시간과 100억 번의 판단을 거친 후 마침내 모든 지도에 4가지 색상만 있으면 표시할 수 있다는 사실이 입증되었으며 이는 수학 전체에 센세이션을 일으켰습니다.

또한, 수학 문제가 더욱 복잡해짐에 따라 정리가 올바른지 확인하기 위해 인간의 힘을 사용하는 것이 더욱 어려워집니다.

최근 AI 커뮤니티에서는 점차 수학 문제에 집중하고 있습니다.

2020년 OpenAI는 자동 정리 증명에 사용할 수 있는 수학적 정리 추론 모델 GPT-f를 출시했습니다.

이 방법은 테스트 세트의 증명 중 56.5%를 완료할 수 있으며, 이는 당시 SOTA 모델인 MetaGen-IL을 30% 이상 초과합니다.

같은 해 마이크로소프트는 IMO 시험 문제를 만들 수 있는 린(Lean)도 출시했는데, 이는 AI가 이전에 본 적 없는 문제를 만들 수 있다는 뜻이다.

지난해 OpenAI가 GPT-3에 검증기를 추가한 후 수학 문제의 성능이 기존 미세 조정 방식보다 훨씬 좋아져 초등학생 수준의 90%에 도달할 수 있었습니다.

올해 1월 MIT+하버드+콜럼비아대학교+워털루대학교의 공동 연구에서 그들이 제안한 모델이 높은 수학을 할 수 있다는 것을 보여주었습니다.

한마디로, 과학자들은 부분교과인 AI를 예술과 과학을 모두 겸비할 수 있도록 만들기 위해 열심히 노력하고 있습니다.

위 내용은 AI는 수학 데이터베이스 문제의 82%를 증명할 수 있으며, 새로운 SOTA가 달성되었으며 여전히 Transformer를 기반으로 합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

August Cryptocurrency Exchange 할인 평가 : 새로운 사용자 보상 및 처리 수수료 감소 August Cryptocurrency Exchange 할인 평가 : 새로운 사용자 보상 및 처리 수수료 감소 Aug 08, 2025 pm 11:15 PM

목차 : August Binance (Binance) 교환 할인 : August Bybit Exchange 할인 : 8 월 MEXC Matcha Exchange 할인 : August Bitfinex (Green Leaf) 교환 할인 : Cryptocurrency Exchange 순위이 기사는 2025 년 8 월에 주요 암호 화폐 거래소의 최신 제안을 편집 할 수 있으며 한 기사는 최상의 혜택을 누릴 수 있습니다. 통화 서클의 많은 초보자가 알지 못하는 것은 대부분의 거래소에 숨겨진 애플리케이션이 제공되었다는 것입니다.

Memefi (Memefi Currency)의 미래 가격은 얼마입니까? 2025, 2026, 2027-2030의 가격 예측 Memefi (Memefi Currency)의 미래 가격은 얼마입니까? 2025, 2026, 2027-2030의 가격 예측 Aug 08, 2025 pm 11:09 PM

디렉토리의 Memefi 통화는 무엇입니까? Memefi 게임 플레이 소개 Memefi (Memefi) 가격 예측 Memefi (Memefi) 가격 예측 : EMA 클러스터 및 Bollinger 밴드 압제 획기적인 Memefi (Memefi) 가격 예측 : RSI 및 Direction Trend Memefi (Memefi) 2025 년까지 2026 년 Memefi (Memefi)의 가격 예측 (Memefi). (Memefi) 2028 Memefi (Memefi)의 가격 예측 2

Huobi HTX의 새로운 자산 1 주일 (7.28-8.4) : 멀티 트랙 공명 밈 및 AI 개념은 시장을 이끌고 있습니다. Huobi HTX의 새로운 자산 1 주일 (7.28-8.4) : 멀티 트랙 공명 밈 및 AI 개념은 시장을 이끌고 있습니다. Aug 08, 2025 pm 11:03 PM

목차 Meme의 인기가 남아 있습니다 : 포도 나무와 당나귀는 계속 상승합니다. 기술적 이야기 가열 : AI 및 개인 정보 보호 컴퓨팅은 체인, RWA 및 지역 내러티브에서 인기가 있습니다. Omni의 신흥 스타 Huobi HTX Wealth Effect는 계속 발표되고 있습니다. 7 월 28 일부터 8 월 4 일까지 Huobi HTX와 관련하여 Global Crypto Market은 휘발성 패턴을 유지했으며 핫스팟 회전 속도가 가속화되었습니다. 이번 주 Huobi HTX가 시작한 자산 중 Meme, AI, 개인 정보 보호 컴퓨팅, 크로스 체인 및 RWA가 함께 발전했으며 시장 부 효과가 계속 나타납니다. 이것은 또한 Huobi HTX가 새로운 자산의 집단적 증가를 달성하여 최첨단 프로젝트 광업 및 생태 학적 레이아웃에서 미래 지향적 인 특성을 더욱 확인하고 사용자가 새로운 시장주기를 파악할 수 있도록 강력한 지원을 제공하는 7 월 이후 5 주 연속 주입니다. Huobi (HTX

비트 코인 (BTC)이란 무엇입니까? 비트 코인이 무엇인지에 대한 간단한 소개 비트 코인 (BTC)이란 무엇입니까? 비트 코인이 무엇인지에 대한 간단한 소개 Aug 07, 2025 pm 10:48 PM

비트 코인 (BTC)은 암호화 원칙을 기반으로 생성 된 디지털 자산입니다. 은행이나 정부와 같은 특정 중앙 기관에 의존하지 않습니다. 이 개념은 2008 년 "Bitcoin : A P2P 전자 현금 시스템"이라는 제목의 논문에서 "Satoshi Nakamoto"라는 개인 또는 그룹에 의해 처음 제안되었습니다.

비트 코인 (BTC) 단기 이익 해결 '냉각'및 가격은 115,000 달러에 단단히 유지됩니다. 비트 코인 (BTC) 단기 이익 해결 '냉각'및 가격은 115,000 달러에 단단히 유지됩니다. Aug 08, 2025 pm 11:00 PM

목차 시장은 비트 코인 가격이 사상 최고치에서 떨어졌지만 2025 비트 코인 전망의 나머지 부분에 대해 "상대 평형 상태"에있다. Glassnode는 현재 시장이 "상대 평형 위치"에 들어갔다고 지적했다. 온쇄 데이터 플랫폼 GlassNode의 분석에 따르면, 비트 코인 가격은 현지 최저 $ 112,000 이후 점차적으로 반등함에 따라 수익성있는 주에서 단기 소지자 (STH)의 판매 압력이 약화되고 있습니다. Glassnode는 수요일에 발표 된 시장 보고서에서 단기 소지자 (155 일 미만의 통화를 보유한 투자자를 언급 함)는 상당히 "냉각"했다고 밝혔다. 데이터는 최근 매수 및 수익성있는 투자자의 판매 비율을 측정하는 "지출 생산 이익 마진"(SPR)이 감소했음을 보여줍니다.

천재 Stablecoin 청구서 분석에 대한 포괄적 인 이해 천재 Stablecoin 청구서 분석에 대한 포괄적 인 이해 Aug 08, 2025 pm 10:51 PM

2025 년 7 월 18 일, 미국 대통령은 "미국 안정적인 코인 국가 혁신법을 안내하고 설립하는"(이하 "천재 법"이라고 함)에 서명하여 디지털 자산 규제 분야의 역사적 단계를 나타 냈습니다. 이 법안은 미국의 첫 연방 수준의 Stablecoin 특별 법률로서 "지불 기반 Stablecoins"에 대한 포괄적이고 명확한 법적 및 규제 프레임 워크를 설정하는 것을 목표로합니다.

간결한 (증명 동전) 가격 예측 : 2025, 2026, 2027-2030 간결한 (증명 동전) 가격 예측 : 2025, 2026, 2027-2030 Aug 11, 2025 am 10:12 AM

디렉토리 간결한 벤처 캐피탈은 간결한 벤처 캐피탈 (증명) 란 무엇입니까 (증명)? 간결한 (증명) 작업 원칙 SP1ZKVM 및 잠수정 네트워크 opsuccinct 기술 크로스 체인 검증 증명 토큰 경제 토큰 세부 사항 2025, 2026, 2027-2030 간결 (증명) 가격 예측 간결 (증명) 가격 예측 (증명) 가격 예측 : 거래량 확장 및 상장 모멘텀 2025-20

온라인 404의 문제를 해결하는 방법 온라인 404의 문제를 해결하는 방법 Aug 12, 2025 pm 09:21 PM

인터넷을 해결하는 방법 404 오류 : URL이 올바른지 확인하십시오. 페이지를 새로 고칩니다. 클리어 브라우저 캐시 : 크롬 : 오른쪽 상단에있는 3 개의 점 & gt; 더 많은 도구 & gt; 명확한 브라우징 데이터 & gt; "캐시 된 사진 및 파일"을 확인하십시오. & gt; CLEAR DATA FIREFOX : 오른쪽 상단에있는 3 개의 수평선 & gt; 옵션 & gt; 프라이버시 및 보안 & gt; 명확한 역사 & gt; "캐시"를 확인하십시오. & gt; 사파리 확인 : 요리

See all articles