masyarakat Belajar Perpustakaan Alatan Masa lapang

Melayu

Rumah > Peranti teknologi > AI > Transformer Mudah dan Cekap (enjin inferens dalam talian model ultra-besar NetEase)

Transformer Mudah dan Cekap (enjin inferens dalam talian model ultra-besar NetEase)

王林

Lepaskan： 2024-01-24 10:45:05

ke hadapan

433 orang telah melayarinya

Easy and Efficient Transformer（网易超大模型线上推理引擎）

Rangka kerja pecutan inferens sumber terbuka NetEase untuk model berasaskan transformer menyokong inferens berprestasi tinggi kad tunggal bagi berpuluh bilion model pada seni bina Ampere pertengahan hingga rendah.

Latar Belakang Projek

Model berskala besar berasaskan transformer telah terbukti berkesan dalam pelbagai tugas dalam banyak bidang. Walau bagaimanapun, penggunaannya dalam pengeluaran perindustrian memerlukan usaha yang besar untuk mengurangkan kos inferens. Untuk mengisi jurang ini, kami mencadangkan penyelesaian inferens berskala: Transformer Mudah dan Cekap (EET). EET ialah sistem yang merangkumi satu siri pengoptimuman penaakulan Transformer pada peringkat algoritma dan pelaksanaan. Dengan mengoptimumkan pengiraan dan proses data Transformer, EET boleh mengurangkan kos inferens dengan ketara dan meningkatkan kecekapan dan prestasi model. Keputusan percubaan kami menunjukkan bahawa EET boleh meningkatkan kelajuan inferens dan penggunaan sumber dengan ketara tanpa kehilangan ketepatan model, menyediakan penyelesaian yang mudah dan berkesan untuk aplikasi model berskala besar dalam pengeluaran perindustrian.

Pertama, kami mereka bentuk kernel yang sangat dioptimumkan untuk input yang panjang dan saiz tersembunyi yang besar.

Selain itu, kami juga mencadangkan pengurus memori CUDA yang fleksibel untuk mengurangkan jejak memori apabila menggunakan model besar. Berbanding dengan perpustakaan inferens Transformer yang tercanggih (Faster Transformer v4.0), EET mampu mencapai purata 1.40-4.20x pecutan lapisan penyahkodan pada GPU A100.

Alamat kertas

https://arxiv.org/abs/2104.12470

Alamat Github

https://github.com/NetEase-FuXi/EET

Atas ialah kandungan terperinci Transformer Mudah dan Cekap (enjin inferens dalam talian model ultra-besar NetEase). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan：

kertas akademik

sumber：163.com

Artikel sebelumnya：Bagaimanakah mekanisme perhatian kendiri menggunakan pensampelan rawak untuk meningkatkan keupayaan latihan dan generalisasi model kecerdasan buatan? Artikel seterusnya：Apakah asal usul dan aplikasi teknologi RLHF dalam model bahasa?

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Cipta Masa Depan: Pengaturcaraan Java untuk Pemula Mutlak

2024-10-13 13:32:21
Anda Tidak Sendiri: Kuasai Python dengan Komuniti Menyokong di Sisi Anda

2024-10-12 11:58:51
Daripada Novis kepada Coder: Manfaatkan Kuasa Pengaturcaraan Python

2024-10-11 20:06:51
Think Like a Programmer: Belajar Asas Java

2024-10-11 18:59:31
Java Made Simple: Panduan Pemula untuk Kuasa Pengaturcaraan

2024-10-11 18:30:51
Bina Blog dengan PHP: Projek Mesra Permulaan

2024-10-11 15:51:51
Cakap Bahasa Sistem: Belajar C, Satu Baris pada Satu Masa

2024-10-11 15:42:10
Struktur Data dan Algoritma dalam C: Pendekatan Mesra Permulaan

2024-10-11 14:41:20
Pengekodan Tanpa Air Mata: Belajar C dengan Cara Mudah

2024-10-11 14:08:31
Analisis Data dengan Java: Panduan Pemula untuk Memproses Maklumat

2024-10-11 13:42:21

Isu terkini

Adakah terdapat cara untuk memaksa teks dalam flexbox dipusatkan secara menegak, tidak kira apa kod CSS lain yang kita ada? Saya mempunyai kod CSS berikut yang merupakan sebahagian daripada kod CSS yang lebih besar...

daripada 2024-04-06 20:41:51

0

1

518

Bandingkan Imagick, Adobe Photoshop dan Windows - Kesan resolusi (piksel per sentimeter atau piksel per inci) Ini bukan soalan tetapi percubaan untuk meningkatkan pemahaman saya tentang cara DPI disim...

daripada 2024-04-06 16:01:27

0

1

397

Cara menggunakan @can dengan betul dalam templat bilah menggunakan strategi Saya tidak dapat mencipta @can() dalam templat bilah kerana dokumentasi mencadangkan ini a...

daripada 2024-04-04 13:51:55

0

1

344

Terjemahkan "Alih keluar direktori awam" dalam projek Laravel ke dalam bahasa Cina sebagai "Alih keluar direktori awam" Saya sedang membuat projek Laravel tetapi saya mempunyai masalah besar, saya tidak boleh m...

daripada 2024-04-03 19:26:05

0

1

355

Mencari cara yang cekap untuk mengendalikan sebilangan besar semakan penyata If berulang Apabila saya cuba mencipta alat carian untuk pangkalan data yang saya buat untuk tesis sar...

daripada 2024-04-03 19:20:08

0

1

297

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan