기술 주변기기 일체 포함 인과 적 언어 모델링을 넘어서

인과 적 언어 모델링을 넘어서

Feb 25, 2025 pm 06:28 PM

Neurips 2024 스포트라이트 : 선택적 언어 모델링 (SLM)으로 사전 조정을 최적화합니다. 최근에, 나는 Neurips 2024의 매혹적인 종이를 발표했다. 이 논문은 놀랍도록 단순하면서도 영향력있는 질문을 다룹니다. 언어 모델 사전 레이팅 중에

의 모든 토큰에 필요한 다음 점토 예측이 필요합니까? 표준 접근법에는 대규모 웹 스프레이링 데이터 세트가 포함되며 인과 적 언어 모델링 (CLM)을 보편적으로 적용합니다. 이 논문은 그 가정에 도전하여 일부 토큰이 학습 과정보다는 도움보다는 방해를 제안합니다. 저자는 "유용한"토큰에 대한 교육에 초점을 맞추면 데이터 효율성과 다운 스트림 작업 성능이 크게 향상됨을 보여줍니다. 이 게시물은 핵심 아이디어와 주요 실험 결과를 요약합니다. 문제 : 소음과 비효율적 인 학습 대형 웹 코퍼는 필연적으로 소음이 포함되어 있습니다. 문서 수준 필터링은 도움이되지만 노이즈는 종종 개별 문서 내에 있습니다. 이 시끄러운 토큰은 계산 자원을 폐기하고 잠재적으로 모델을 혼동합니다.

저자는 토큰 수준의 학습 역학을 분석하여 교차 엔트로피 손실 궤적을 기반으로 토큰을 분류했습니다. l → L (낮은 ~ 낮음) : 신속하게 배웠으며 최소한의 추가 혜택을 제공합니다. h → L (높음에서 낮음) :

처음에는 어렵지만 결국 배웠습니다. 귀중한 학습 기회를 대표합니다.

지속적으로 어렵습니다. l → h (낮은 ~ 높음) : 처음 배웠지 만 나중에 컨텍스트 변화 나 소음으로 인해 문제가됩니다. 그들의 분석은 소량의 토큰만이 의미있는 학습 신호를 제공한다는 것을 보여줍니다. 솔루션 : 선택적 언어 모델링 (SLM)

제안 된 솔루션 인 SLM (Selective Language Modeling)은보다 목표로하는 접근 방식을 제공합니다.

참조 모델 (RM) 교육 : 데이터의 고품질 하위 집합은 미리 훈련 된 기본 모델을 미세 조정하여 참조 모델 (RM)을 ​​생성하는 데 사용됩니다. 이 RM은 "유용성"토큰의 벤치 마크 역할을합니다
  • 초과 손실 계산 : 큰 코퍼스의 각 토큰에 대해 RM의 손실과 현재 교육 모델의 손실 ( "초과 손실")의 차이가 계산됩니다. 초과 손실이 높을수록 개선 가능성이 커집니다
  • 선택적 역전 :
  • 전체 포워드 패스는 모든 토큰에 대해 수행되지만 역설은 초과 손실이 가장 높은 토큰의 상단 k%에 대해서만 발생합니다. 이것은 동적으로 가장 귀중한 토큰에 대한 훈련에 중점을 둡니다
  • 실험 결과 : 상당한 이득 SLM은 다양한 실험에서 중요한 이점을 보여줍니다

    Math Domain : openwebmath Beyond Causal Language Modeling, SLM은 표준 CLM과 비교하여 GSM8K 및 수학 벤치 마크에서 최대 10%의 성능을 달성하여 기준 성능에 5-10 배 더 빠르게 도달했습니다. 7B 모델은 훈련 토큰의 3% 만 사용하여 최첨단 모델과 일치했습니다. 1B 모델의 경우 미세 조정 성능을 40% 이상 늘 렸습니다.

    • 일반 도메인 :

      강력한 미리 훈련 된 기본 모델에서도 SLM은 15 개의 벤치 마크에서 약 5.8%의 평균 개선을 산출했습니다. 자체 참조 : RAW 코퍼스에서 빠르게 훈련 된 RM조차도 2-3%의 정확도 부스트와 사용 된 토큰의 30-40% 감소를 제공했습니다.

    • 결론과 미래의 작업

      이 백서는 토큰 수준의 학습 역학에 대한 귀중한 통찰력을 제공하고 언어 모델 사전 레이팅을 최적화하는 매우 효과적인 기술인 SLM을 소개합니다. 향후 연구 방향에는 SLM을 더 큰 모델로 스케일링, API 기반 참조 모델 탐색, 강화 학습 통합, 여러 참조 모델 사용 및 SLM을 안전 및 진실성 고려 사항과 정렬하는 것이 포함됩니다. 이 작업은 효율적이고 효과적인 언어 모델 교육의 중요한 발전을 나타냅니다.

위 내용은 인과 적 언어 모델링을 넘어서의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

OpenAi의 $ 10M AI Consulting Business : 배포가 중심 단계로 나옵니다 OpenAi의 $ 10M AI Consulting Business : 배포가 중심 단계로 나옵니다 Jul 17, 2025 am 11:12 AM

1 천만 달러가 넘는 새로운 AI 컨설팅 서비스에 대한 OpenAi의 출시는 주요 실현을 강조합니다. 2025 년 AI의 실제 가치는 모델에 대한 액세스뿐만 아니라 얼마나 효과적으로 배치 할 수 있는지에 있습니다. 이 접근법은 Palan을 밀접하게 반영합니다

기업이 AI 챗봇을 사용하는 4 가지 방법 기업이 AI 챗봇을 사용하는 4 가지 방법 Jul 17, 2025 am 11:16 AM

우리 회사 인 Jotform에서 우리는 AI 구동 챗봇의 세계에 깊이 빠져 나왔으며 고객과의 상호 작용 방식을 향상시킬 수있는 다양한 놀라운 방법을 발견했습니다. 우리는 원래 그들의 주된 목적이 custome을 처리하는 것이라고 생각했지만

제품을 만드는 방법 사람들은 AI 시대없이 살아갈 수 없습니다. 제품을 만드는 방법 사람들은 AI 시대없이 살아갈 수 없습니다. Jul 17, 2025 am 11:18 AM

그들은 본질적으로 현재의 기술 환경과 과거의 혁신 파도 사이에 인터넷, 빅 데이터, 클라우드 컴퓨팅 및 기타 진보를 가져 왔습니다.

도구에서 팀원에 이르기까지 : AI 요원이 디지털 노동이되는 방법 도구에서 팀원에 이르기까지 : AI 요원이 디지털 노동이되는 방법 Jul 19, 2025 am 11:19 AM

에이전트 AITHE 수치의 변형력을 이해하는 것은 볼륨을 말합니다. Grand View Research는 전 세계 AI 에이전트 시장이 2024 년 50 억 달러에서 2030 년까지 500 억 달러로 급증 할 것으로 예상되며, 이는 연간 46%의 성장률을 나타냅니다. 더 많은 의미

프롬프트에서 제품에 이르기까지 : No-Code AI의 사업은 호황을 누리고 있습니다. 프롬프트에서 제품에 이르기까지 : No-Code AI의 사업은 호황을 누리고 있습니다. Jul 26, 2025 am 11:13 AM

인수를 돋보이게 한 것은 단순히 재무 수치 일뿐 만 아니라 회사가 수행 한 비 전통적인 여행이었습니다. Base44는 결코 벤처 캐피탈을 추구하지 않았거나 전통적인 실리콘 밸리 공식을 준수하지 않았습니다. 대신, 그것은 그 재치를 보여주었습니다

인간 심리적 장애 진단 다중 AI 기반 페르소나를 통한 정신 건강 조언 조정 인간 심리적 장애 진단 다중 AI 기반 페르소나를 통한 정신 건강 조언 조정 Jul 19, 2025 am 11:15 AM

그것에 대해 이야기합시다. AI 혁신에 대한이 분석은 다양한 영향력 AI 복잡성을 식별하고 설명하는 것을 포함하여 AI의 최신 Forbes 열 커버리지의 일부입니다 (여기 링크 참조). AI 및 정신 건강 요법 q로서

Waymo Vets는 자율 주행 더미 파는 사람으로 건설 현장을 자동화하고 있습니다. Waymo Vets는 자율 주행 더미 파는 사람으로 건설 현장을 자동화하고 있습니다. Jul 17, 2025 am 11:15 AM

작년에 Boris Sofman은 Waymo의 전 스타 엔지니어 인 Waymo를 떠나 트럭 자동화 전용을 전담했습니다. 그는 전 Waymo 동료 인 Ajay Gummalla 및 Kevin Peterson과 팀을 이루고 Bedrock Robotics를 찾기위한 엔지니어 Tom Eliaz와 협력했습니다. 그들은 굴삭기로 시작하는데, 이는 강력한 발굴 작업에 널리 사용됩니다. 샌프란시스코에 기반을 둔 스타트 업은 자체 건설 기계 라인을 설계 할 계획이 아니라 기존 장비에 카메라, LIDAR, 컴퓨터 및 AI 소프트웨어를 추가하여 고온으로 인해 인간 근로자를 포함하여 24 시간 내내 작업 할 수 있도록 계획하고 있습니다.

인공 친밀감 : Grok의 새로운 봇. 정서적 애착의 무서운 미래 인공 친밀감 : Grok의 새로운 봇. 정서적 애착의 무서운 미래 Jul 17, 2025 am 11:17 AM

AI Companionsgrok의 최신 혁신의 부상은 인공 지능이 정서적 요구를 충족시키는 데 사용되는 방식의 큰 변화를 나타냅니다. arater.ai 및 Microsoft와 같은 다른 플랫폼은 자신의 가상 페르소나를 계속 정제합니다.

See all articles