지역 사회 배우다 도구 라이브러리 여가

한국어

집 > 기술 주변기기 > 일체 포함 > 쉽고 효율적인 Transformer(NetEase 초대형 모델 온라인 추론 엔진)

쉽고 효율적인 Transformer(NetEase 초대형 모델 온라인 추론 엔진)

王林

풀어 주다： 2024-01-24 10:45:05

앞으로

439명이 탐색했습니다.

Easy and Efficient Transformer（网易超大模型线上推理引擎）

변압기 기반 모델을 위한 NetEase의 오픈 소스 추론 가속화 프레임워크는 중저가 암페어 아키텍처에서 수백억 개의 모델에 대한 단일 카드 고성능 추론을 지원합니다.

프로젝트 배경

Transformer 기반의 대규모 모델은 여러 분야의 다양한 작업에서 그 효율성이 입증되었습니다. 그러나 이를 산업생산에 적용하려면 추론 비용을 줄이기 위해 상당한 노력이 필요하다. 이러한 격차를 메우기 위해 우리는 EET(Easy and Efficient Transformer)라는 확장 가능한 추론 솔루션을 제안합니다. EET는 알고리즘 및 구현 수준에서 일련의 Transformer 추론 최적화를 포함하는 시스템입니다. EET는 Transformer의 계산 및 데이터 프로세스를 최적화함으로써 추론 비용을 크게 줄이고 모델의 효율성과 성능을 향상시킬 수 있습니다. 우리의 실험 결과는 EET가 모델 정확도를 잃지 않고 추론 속도와 리소스 활용도를 크게 향상시켜 산업 생산의 대규모 모델 적용을 위한 간단하고 효과적인 솔루션을 제공할 수 있음을 보여줍니다.

먼저, 긴 입력과 큰 숨겨진 크기에 맞게 고도로 최적화된 커널을 설계했습니다.

또한 대규모 모델을 배포할 때 메모리 공간을 줄이기 위해 유연한 CUDA 메모리 관리자를 제안합니다. 최첨단 Transformer 추론 라이브러리(Faster Transformer v4.0)와 비교하여 EET는 A100 GPU에서 평균 1.40~4.20x 디코딩 레이어 가속을 달성할 수 있습니다.

논문 주소

https://arxiv.org/abs/2104.12470

Github 주소

https://github.com/NetEase-FuXi/EET

위 내용은 쉽고 효율적인 Transformer(NetEase 초대형 모델 온라인 추론 엔진)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨：

학술 논문

원천：163.com

이전 기사：Self-Attention 메커니즘은 어떻게 무작위 샘플링을 사용하여 인공 지능 모델의 훈련 및 일반화 기능을 향상합니까? 다음 기사：언어 모델에서 RLHF 기술의 기원과 적용은 무엇입니까?

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

미래를 창조하세요: 완전 초보자를 위한 Java 프로그래밍

2024-10-13 13:32:21
당신은 혼자가 아닙니다: 지원적인 커뮤니티와 함께 Python을 마스터하세요

2024-10-12 11:58:51
초보자에서 코더까지: Python 프로그래밍의 힘을 활용하세요

2024-10-11 20:06:51
프로그래머처럼 생각하기: Java의 기본 사항 배우기

2024-10-11 18:59:31
Java Made Simple: 초보자를 위한 프로그래밍 능력 가이드

2024-10-11 18:30:51
PHP로 블로그 구축: 초보자에게 친숙한 프로젝트

2024-10-11 15:51:51
시스템 언어 말하기: 한 번에 한 줄씩 C 배우기

2024-10-11 15:42:10
C의 데이터 구조 및 알고리즘: 초보자에게 친숙한 접근 방식

2024-10-11 14:41:20
눈물 없는 코딩: 쉬운 방법으로 C 배우기

2024-10-11 14:08:31
Java를 사용한 데이터 분석: 정보 처리를 위한 초보자 가이드

2024-10-11 13:42:21

최신 이슈

다른 CSS 코드가 무엇이든 관계없이 Flexbox의 텍스트를 수직 중앙에 강제로 배치할 수 있는 방법이 있나요? 제가 개발 중인 웹사이트에 사용되는 더 큰 CSS 코드의 일부인 다음 CSS 코드가 있습니다. .cards-u{display:flex;flex-wrap:wrap;...

에서 2024-04-06 20:41:51

0

1

518

Imagick, Adobe Photoshop 및 Windows 비교 - 해상도 감지(센티미터당 픽셀 또는 인치당 픽셀) 이것은 질문이 아니라 DPI가 다양한 파일 형식으로 저장되는 방식에 대한 이해를 높이고 그것이 작동하는 이유에 대해 논의하려는 시도입니다. 저는 이미지(JPG, ...

에서 2024-04-06 16:01:27

0

1

397

전략을 사용하여 블레이드 템플릿에서 @can을 올바르게 사용하는 방법 설명서에 이것이 내 정책이라고 나와 있으므로 블레이드 템플릿에서 @can()을 생성할 수 없습니다. publicfunctionupdate(User$user,Can...

에서 2024-04-04 13:51:55

0

1

344

Laravel 프로젝트의 "공용 디렉터리 제거"를 중국어로 "공용 디렉터리 제거"로 번역하세요. Laravel 프로젝트를 만들고 있는데 큰 문제가 있습니다. URL에서 /public/ 이름을 제거할 수 없습니다. 공용 디렉토리에서 laravel의 루트 디렉토...

에서 2024-04-03 19:26:05

0

1

355

다수의 반복되는 If 문 검사를 처리하는 효율적인 방법을 찾고 있습니다. 학부 논문을 위해 만든 데이터베이스에 대한 검색 도구를 만들려고 할 때 사용자가 입력한 값을 많이 확인하고 해당 값을 기반으로 적절한 MySQL 쿼리를 생성하고 ...

에서 2024-04-03 19:20:08

0

1

297

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿