지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 기술 주변기기 > 일체 포함 > Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.

Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.

尊渡假赌尊渡假赌尊渡假赌

풀어 주다： 2025-03-03 19:05:18

원래의

931명이 탐색했습니다.

Deepseek은 #OpenSourceweek의 2 일째에 여기에 있으며 오늘 그들은 MOE 모델 교육 및 추론을위한 오픈 소스 EP 커뮤니케이션 라이브러리 인 Deepep을 소개했습니다. 지금까지 나는 Deepseek과 Openai, Meta 등의 10 억 달러 규모의 모델에 대한 그들의 답변에 완전히 깊은 인상을 받았습니다. 이제 그들은 AGI를 탐험 할 때 빌딩 블록을 오픈 소싱하고 있습니다. 5 개의 리포지토리 (이미 릴리스 된 2 개)를 통해 AI의 투명성, 커뮤니티 협력 및 발전에 대한 약속을 보여주고 있습니다.

DeepSeek의 1 일차 팀에서 FlashMla를 발표하면 여기에서 읽을 수 있습니다 - DeepSeek #OpenSourceweek 1 일 : FlashMla의 출시.

오늘, 우리는 Deepep에 대해 자세히 이야기 할 것입니다.

릴리스의 주요 하이라이트

효율적이고 최적화 된 전부 커뮤니케이션 NVLINK 및 RDMA 를 통한 인트라 노드 및 인턴 노드 지원 훈련 및 추론을위한 고 처리량 커널 추론 디코딩을위한 저지성 커널 기본 FP8 디스패치 지지대

계산-의사 소통 중첩

에 대한 유연한 GPU 리소스 제어

목차

Moe는 변압기 모델에서 어떻게 작동합니까?
OpenSourcing Deepep은 게임 체인저이며 그것이 제공하는 것인가?

NVLINK 및 RDMA를 사용한 인트라 노드 및 인트라 노드 지원을 효율적이고 최적화 한 전부 커뮤니케이션 및 internode 지원을위한 고도로 렌즈 프리 릴 선사 rdma

Deepep 자신을 시도해보십시오
결론
- Deepep : MOE 및 전문가 병렬성을위한 최적화 된 커뮤니케이션 라이브러리 Deepep은 MOE (Mix-of-Experts) 및 EP (Expert Parallism)를 위해 특별히 설계된 고성능 커뮤니케이션 라이브러리입니다. 이 회사는 매우 효율적인 모든 GPU 커널 (Moe Dispatch and Combine)이라고 불리는 탁월한 처리량과 최소한의 대기 시간을 제공합니다. 또한 Deepep은 FP8을 포함한 저렴한 계산을 지원하여 딥 러닝 워크로드의 유연성을 보장합니다. DeepSeek-V3 용지에 도입 된 그룹 제한 게이팅 알고리즘을 보완하기 위해 Deepep은 비대칭 도메인 대역폭 전달을 위해 맞춤형 특수 커널을 제공합니다. 이 커널은 NVLINK 및 RDMA와 같은 다른 하드웨어 도메인간에 데이터 전송을 최적화하여 교육 및 추론 프리 릴 작업 모두에 대한 처리량을 최대화합니다. 또한 라이브러리에는 스트리밍 멀티 프로세서 (SM) 사용을위한 내장 컨트롤이 포함되어 있습니다. 특히 디코딩 중에 초대형 대기 시간을 요구하는 추론 시나리오의 경우 Deepep은 전용 RDMA 전용 커널 세트를 통합하여 통신 지연을 크게 줄입니다. 또한 SM 리소스를 소비하지 않고 계산과의 커뮤니케이션을 중복시키기 위해 혁신적인 후크 기반 접근 방식을 사용하여 최적의 효율성을 확보합니다. 왜 DeepSeek가 그것을 opensourcing 하는가? Deepseek의 기술을 오픈 소스로 결정하는 것은 모든 사람이 최첨단 AI를 이용할 수 있도록하는 것입니다. 혁신을 공유함으로써 의료, 기후 과학 또는 방어에 관계없이 산업 전반의 개발자, 연구원 및 비즈니스에 힘을 발휘하여 경계를 높이고 더욱 고급 솔루션을 구축 할 수 있습니다. Open Access는 협업 속도를 높이고 AI 개발이 선택된 소수로 제한되지 않도록합니다. Deepep은“MOE 모델 교육 및 추론을위한 최초의 오픈 소스 EP 커뮤니케이션 라이브러리”입니다. 그리고 가장 중요한 부분? DeepSeek의 도구는 Github에서 구할 수 있으므로 누구나 기술을 쉽게 탐색하고 기여하며 개선 할 수 있습니다. 이제 전문가 (MOE)의 혼합이 무엇인지 이해합시다 전문가 (Moe)의 혼합물이란 무엇입니까?
  
  모델의 크기는 품질을 결정하는 데 중요한 역할을합니다. 고정 계산 예산을 사용하면 일반적으로 더 많은 단계를 위해 더 작은 모델보다는 더 큰 단계로 더 큰 모델을 훈련시키는 것이 더 효과적입니다. 이곳은 전문가 (MOE) 의 혼합물이 작용하는 곳입니다. 모델은 계산 효율을 최적화하면서 모델을 크게 확장 할 수 있습니다. .
  MOE는 계산 중에 매개 변수의 서브 세트 만 선택적으로 활성화하여 모델 교육 및 추론을 최적화하도록 설계된 신경망 아키텍처입니다. 이를 통해 계산 비용의 비례 적 증가없이 훨씬 더 큰 모델을 사용할 수 있습니다.
  moe는 주로 두 가지 주요 구성 요소 로 구성됩니다
  스파스 MOE 계층 -이들은 전통적인 조밀 한 피드 포워드 네트워크 (FFN) 레이어를 대체합니다. 단일 FFN 대신 MOE 계층은 여러 전문가 (예 : 8 개의 별도 네트워크)로 구성됩니다. 각 전문가는 독립형 신경망, 일반적으로 FFN으로 기능하지만 경우에 따라 이러한 전문가는 더 복잡한 구조물이거나 계층 적 Moes가 될 수 있습니다.
  . 라우터 또는 게이트 네트워크 -이 메커니즘은 어떤 토큰이 어떤 전문가에게 할당되는지를 결정합니다. 예를 들어, 주어진 순서에서, 하나의 토큰은 Expert 2로 향할 수 있고, 다른 토큰은 Expert 1에 의해 처리 될 수 있습니다. MoE의 주요 설계 선택은 전문가들 사이에 토큰이 어떻게 배포 되는가입니다. 라우팅 메커니즘은 나머지 모델과 함께 교육을받는 학습 가능한 매개 변수에 의해 관리됩니다. 변압기 모델에서 MOE는 어떻게 작동합니까? 표준 변압기 모델에서 모든 토큰은 조밀 한 FFN 층을 통해 처리됩니다. 그러나, MOE 모델에서,이 조밀 한 FFN 층은 여러 전문가와 게이팅 메커니즘으로 구성된 MOE 층으로 대체된다. 추론 및 훈련 중에,이 전문가의 하위 집합만이 토큰 당 활성화되어 모델 용량을 유지하면서 전반적인 계산이 줄어 듭니다. Moe 모델의 이점 효율적인 사전 여파
- 더 빠른 추론 - 모델 매개 변수의 일부만이 주어진 시간에 사용되므로 추론은 동등한 총 크기의 밀집된 모델에 비해 상당히 더 효율적입니다.

위 내용은 Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이전 기사：$ 150/1m 토큰으로 GPT-4.5 API : 고가? 다음 기사：Claude 3.7 소네트 코딩 기술 : 실습 demonstation

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

Monster Hunter Wilds : 모든 맨틀 잠금을 해제하는 방법

2025-03-04 02:52:08
Repo : 팀원을 부활시키는 방법

2025-03-04 02:44:08
Monster Hunter Wilds : 상처, 설명

2025-03-04 02:36:09
Monster Hunter Wilds : Rath-from-Above, Go! <ough> 퀘스트 연습

2025-03-04 02:27:08
Longvinter : 완전한 가구 가이드

2025-03-04 02:18:14
Monster Hunter Wilds : Greatsword 무기 가이드를 완성하십시오

2025-03-04 02:05:08
Final Fantasy 14 : Little Ladies 'Day 2025 이벤트 가이드

2025-03-04 01:32:10
몬스터 헌터 와일드 : 완전한 스위치 도끼 무기 가이드

2025-03-04 01:23:08
jQuery XML을 읽는 방법

2025-03-04 01:19:11
jQuery는 스크롤을 바닥으로 감지합니다 - 읽기 t & c

2025-03-04 01:18:08

최신 이슈

function_exists()는 사용자 정의 함수를 결정할 수 없습니다. 기능 테스트() { ...

에서 2024-04-29 11:01:01

0

3

2880

Chrome 모바일 버전을 표시하는 방법 안녕하세요 선생님, Chrome을 모바일 버전으로 어떻게 변경하나요?

에서 2024-04-23 00:22:19

0

11

3063

자식 창이 부모 창을 작동하지만 출력이 응답하지 않습니다. 처음 두 문장은 실행 가능하지만 마지막 문장은 구현할 수 없습니다.

에서 2024-04-19 15:37:47

0

1

2511

상위 창에 출력이 없습니다. document.onclick = function(){ window.opener.document.write('나는 자식 창의 출력입니다.');

에서 2024-04-18 23:52:34

0

1

2453

CSS 마인드맵 코스웨어는 어디에 있나요? 코스웨어

에서 2024-04-16 10:10:18

0

0

2483

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿