


NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda
Pada suatu masa dahulu, kecerdasan buatan mengalami kesesakan selama beberapa dekad kerana kuasa pengkomputeran yang tidak mencukupi, dan GPU mencetuskan pembelajaran mendalam. Dalam era ChatGPT, AI sekali lagi menghadapi masalah kuasa pengkomputeran yang tidak mencukupi kerana model besar Adakah NVIDIA mempunyai penyelesaian kali ini?
Pada 22 Mac, persidangan GTC telah diadakan secara rasmi Pada Keynote yang baru diadakan, Ketua Pegawai Eksekutif NVIDIA Jensen Huang telah memindahkan cip yang disediakan untuk ChatGPT.
"Mempercepatkan pengkomputeran bukan mudah. Pada tahun 2012, model penglihatan komputer AlexNet menggunakan GeForce GTX 580 dan boleh memproses 262 PetaFLOPS sesaat. Model ini mencetuskan letupan dalam teknologi AI," Jen -Hsun Huang berkata. "Sepuluh tahun kemudian, Transformer muncul. GPT-3 menggunakan 323 ZettaFLOPS kuasa pengkomputeran, 1 juta kali ganda daripada AlexNet, untuk mencipta ChatGPT, AI yang mengejutkan dunia. Platform pengkomputeran baharu muncul, dan era iPhone AI telah tiba . ”
Ledakan dalam AI telah memacu harga saham Nvidia naik 77% pada masa ini, nilai pasaran Nvidia ialah AS$640 bilion, menjadikannya Intel hampir lima kali. Walau bagaimanapun, keluaran hari ini memberitahu kami bahawa Nvidia masih belum berhenti.
Merancang kuasa pengkomputeran khusus untuk AIGC
Pembangunan AI generatif (AIGC) mengubah keperluan syarikat teknologi untuk kuasa pengkomputeran Nvidia pernah menunjukkan empat jenis pengkomputeran kuasa untuk platform penaakulan Tugas AI, semuanya menggunakan seni bina bersatu.
Antaranya, NVIDIA L4 menyediakan "prestasi video dipacu AI 120 kali lebih tinggi daripada CPU, dan kecekapan tenaga 99%", yang boleh digunakan untuk Penstriman video, pengekodan dan penyahkodan, dan menjana video AI yang lebih berkuasa NVIDIA L40 digunakan khas untuk penjanaan imej 2D/3D.
Untuk ChatGPT, yang memerlukan kuasa pengkomputeran yang besar, NVIDIA telah mengeluarkan NVIDIA H100 NVL, penyelesaian khusus model bahasa besar (LLM) dengan memori 94GB dan Enjin Transformer dipercepatkan, dilengkapi dengan PCIE H100 GPU dengan dwi GPU NVLINK.
"Pada masa ini satu-satunya GPU yang benar-benar boleh mengendalikan ChatGPT ialah NVIDIA HGX A100. Berbanding dengan yang sebelumnya, satu kini dilengkapi dengan empat pasang H100 dan dwi NVLINK Kelajuan pelayan standard boleh menjadi 10 kali lebih pantas, yang boleh mengurangkan kos pemprosesan model bahasa besar mengikut susunan magnitud," kata Huang.
Akhir sekali terdapat NVIDIA Grace Hopper untuk Model Pengesyoran, yang selain dioptimumkan untuk tugas pengesyoran, juga boleh menguasakan rangkaian saraf graf dan pangkalan data vektor.
Biar cip menembusi had fizikal
Pada masa ini, proses pengeluaran semikonduktor telah menghampiri had yang boleh dicapai oleh fizik. Selepas proses 2nm, apakah titik terobosan? NVIDIA memutuskan untuk memulakan dengan peringkat paling primitif pembuatan cip - fotolitografi.
Pada asasnya, ini adalah masalah pengimejan pada had fizik. Di bawah proses lanjutan, banyak ciri pada cip akan lebih kecil daripada panjang gelombang cahaya yang digunakan dalam proses percetakan, dan reka bentuk topeng mesti sentiasa diubah suai, satu langkah yang dipanggil pembetulan jarak optik. Litografi pengiraan mensimulasikan kelakuan cahaya apabila ia berinteraksi dengan photoresist melalui yang asal Kelakuan ini diterangkan mengikut persamaan Maxwell Ini adalah tugas yang paling memerlukan pengiraan dalam bidang reka bentuk dan pembuatan cip.
Jensen Huang mengumumkan teknologi baharu yang dipanggil CuLitho di GTC untuk mempercepatkan reka bentuk dan pembuatan semikonduktor. Perisian menggunakan cip Nvidia untuk mempercepatkan langkah antara reka bentuk cip berasaskan perisian dan fabrikasi fizikal topeng fotolitografi yang digunakan untuk mencetak reka bentuk tersebut pada cip.
CuLitho berjalan pada GPU dan menyampaikan peningkatan prestasi 40x ganda berbanding teknologi litografi semasa, mempercepatkan beban kerja pengkomputeran berskala besar yang kini menggunakan berpuluh bilion jam CPU setiap tahun. "Membina H100 memerlukan 89 topeng. Apabila berjalan pada CPU, satu topeng mengambil masa dua minggu, tetapi jika H100 digunakan untuk berjalan pada CuLitho, ia hanya mengambil masa 8 jam," kata Huang.
Ini bermakna 500 sistem NVIDIA DGX H100 boleh menggantikan kerja 40,000 sistem CPU dan menjalankan semua bahagian proses litografi pengiraan, membantu mengurangkan keperluan kuasa dan kesan potensi kesan alam sekitar.
Kemajuan ini akan menjadikan transistor dan litar cip lebih kecil daripada hari ini, sambil mempercepatkan masa untuk memasarkan cip dan menambah baik pusat data besar-besaran yang beroperasi sepanjang masa untuk memacu pembuatan kecekapan tenaga.
Nvidia berkata ia bekerjasama dengan ASML, Synopsys dan TSMC untuk membawa teknologi itu ke pasaran. Menurut laporan, TSMC akan mula bersedia untuk pengeluaran percubaan teknologi ini pada bulan Jun.
"Industri cip adalah asas bagi hampir setiap industri lain di dunia," kata Huang. "Dengan teknologi litografi pada had fizik, melalui CuLitho dan bekerjasama dengan rakan kongsi kami TSMC, ASML dan Synopsys, fab boleh meningkatkan pengeluaran, mengurangkan jejak karbon mereka, dan meletakkan asas untuk 2nm dan seterusnya." 🎜>Sistem pengkomputeran kuantum dipercepatkan GPU pertama
Pada acara hari ini, NVIDIA turut mengumumkan sistem baharu yang dibina menggunakan Mesin Kuantum untuk mereka yang bekerja pada Penyelidik berteknologi tinggi menyediakan seni bina baharu yang revolusioner untuk prestasi dan rendah. -pendaman pengkomputeran klasik kuantum.
Di tengah-tengah DGX Quantum ialah sistem NVIDIA Grace Hopper yang disambungkan oleh PCIe ke Mesin Kuantum OPX+, membolehkan kependaman sub-mikrosaat antara GPU dan Unit Pemprosesan Kuantum (QPU) .
Tim Costa, pengarah HPC dan kuantum di NVIDIA, berkata: "Pengkomputeran super dipercepatkan kuantum berpotensi untuk membentuk semula sains dan industri, dan NVIDIA DGX Quantum akan membolehkan para penyelidik menembusi sempadan pengkomputeran kuantum-klasik 》
Sebagai tindak balas, NVIDIA menyepadukan GPU seni bina Hopper berprestasi tinggi dengan CPU Grace baharu syarikat ke dalam “Grace Hopper” untuk menyediakan AI dan HPC yang sangat berkuasa. aplikasi. Ia memberikan prestasi sehingga 10x ganda untuk aplikasi yang menjalankan terabait data, memberikan penyelidik kuantum-klasik lebih kuasa untuk menyelesaikan masalah paling kompleks di dunia.
DGX Quantum juga melengkapkan pembangun dengan NVIDIA CUDA Quantum, susunan perisian bersatu yang berkuasa yang kini sumber terbuka. CUDA Quantum ialah platform pengkomputeran kuantum klasik hibrid yang menyepadukan dan memprogramkan QPU, GPU dan CPU dalam satu sistem.
$37,000 sebulan, latih ChatGPT anda sendiri di halaman web
Microsoft membelanjakan ratusan juta dolar untuk membeli puluhan ribu A100 untuk membina superkomputer khusus GPT , anda kini Anda mungkin ingin menyewa GPU yang sama yang digunakan oleh OpenAI dan Microsoft untuk melatih ChatGPT dan Carian Bing untuk melatih model besar anda sendiri.
Awan DGX yang dicadangkan oleh NVIDIA menyediakan kluster pengkomputeran super NVIDIA DGX AI khusus, dipasangkan dengan perisian NVIDIA AI Perkhidmatan ini membolehkan setiap perusahaan mengakses pengkomputeran super AI menggunakan penyemak imbas web yang ringkas. pengkomputeran, menghapuskan kerumitan memperoleh, menggunakan dan mengurus infrastruktur di premis.
Menurut laporan, setiap tika DGX Cloud mempunyai lapan GPU Teras Tensor 80GB H100 atau A100, dengan jumlah memori GPU 640GB setiap nod. Fabrik berprestasi tinggi dan kependaman rendah yang dibina dengan NVIDIA Networking memastikan beban kerja boleh berskala merentas kelompok sistem yang saling berkaitan, membolehkan berbilang kejadian bertindak sebagai satu GPU gergasi untuk memenuhi keperluan prestasi latihan AI lanjutan.
Perusahaan kini boleh menyewa gugusan Awan DGX secara bulanan untuk skala pembangunan beban kerja latihan berbilang nod yang besar tanpa menunggu sumber pengkomputeran dipercepatkan yang sering mendapat permintaan tinggi.
Harga sewa bulanan, menurut Huang Renxun, bermula pada $36,999 setiap kejadian sebulan.
"Kami berada dalam momen kecerdasan buatan iPhone," kata Huang "Permulaan berlumba-lumba untuk mencipta produk dan model perniagaan yang mengganggu, dan penyandang sedang mencari untuk bertindak balas. DGX Cloud memberi pelanggan. akses segera kepada pengkomputeran besar NVIDIA AI dalam awan pada skala global 》
Untuk membantu perusahaan menerima gelombang AI generatif, NVIDIA turut mengumumkan satu siri perkhidmatan awan yang boleh dibina dan dipertingkatkan model bahasa berskala besar tersuai dan model AI generatif.
Kini orang ramai boleh menggunakan perkhidmatan bahasa NVIDIA NeMo dan perkhidmatan imej, video dan 3D NVIDIA Picasso untuk membina proprietari, aplikasi AI generatif khusus domain untuk perbualan pintar dan sokongan Pelanggan, penciptaan kandungan profesional, simulasi digital dan banyak lagi. Secara berasingan, NVIDIA mengumumkan model baharu perkhidmatan awan biologi NVIDIA BioNeMo.
"AI Generatif ialah sejenis komputer baharu yang boleh diprogramkan dengan bahasa semula jadi manusia. Keupayaan ini mempunyai implikasi yang meluas - semua orang boleh memerintah komputer untuk menyelesaikan masalah, yang bukan kes sebelum Soon, ini hanya untuk pengaturcara," kata Huang.
Berdasarkan keluaran hari ini, Nvidia bukan sahaja terus menambah baik reka bentuk perkakasan untuk beban kerja AI syarikat teknologi, tetapi juga mencadangkan model perniagaan baharu. Pada pandangan sesetengah pihak, NVIDIA mahu menjadi "TSMC dalam bidang AI": menyediakan perkhidmatan faundri produktiviti termaju seperti kilang wafer, membantu syarikat lain melatih algoritma AI untuk senario khusus mereka di atasnya.
Menggunakan latihan superkomputer NVIDIA dan secara langsung menghapuskan keperluan orang tengah untuk memperoleh perbezaan harga, adakah ini akan menjadi hala tuju pembangunan AI masa hadapan?
Atas ialah kandungan terperinci NVIDIA mengeluarkan GPU khusus ChatGPT, meningkatkan kelajuan inferens sebanyak 10 kali ganda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Menurut berita dari laman web ini pada 23 Februari, NVIDIA mengemas kini dan melancarkan aplikasi NVIDIA malam tadi, menyediakan pemain dengan pusat kawalan GPU bersatu baharu, membolehkan pemain merakam detik indah melalui alat rakaman berkuasa yang disediakan oleh terapung dalam permainan. tingkap. Dalam kemas kini ini, NVIDIA turut memperkenalkan fungsi RTXHDR Pengenalan rasmi dilampirkan seperti berikut: RTXHDR ialah penapis Freestyle baharu yang diperkasakan AI yang boleh memperkenalkan kesan visual cantik julat dinamik tinggi (HDR) ke dalam permainan yang tidak pada asalnya. menyokong HDR. Apa yang anda perlukan ialah monitor serasi HDR untuk menggunakan ciri ini dengan pelbagai jenis permainan berasaskan DirectX dan Vulkan. Selepas pemain mendayakan fungsi RTXHDR, permainan akan berjalan walaupun ia tidak menyokong HD

Menurut berita dari laman web ini pada 19 Februari, dalam video terbaharu saluran LawisDead Moore, sauh Tom mendedahkan bahawa kad grafik siri Nvidia GeForce RTX50 akan dilengkapi secara asli dengan antara muka bekalan kuasa 16-Pin PCIeGen6. Tom berkata bahawa sebagai tambahan kepada siri GeForceRTX5080 dan GeForceRTX5090 mewah, GeForceRTX5060 julat pertengahan juga akan membolehkan antara muka bekalan kuasa baharu. Dilaporkan bahawa Nvidia telah menetapkan keperluan yang jelas bahawa pada masa hadapan, setiap siri GeForce RTX50 akan dilengkapi dengan antara muka bekalan kuasa 16-Pin PCIeGen6 untuk memudahkan rantaian bekalan. Tangkapan skrin yang dilampirkan pada tapak ini adalah seperti berikut: Tom juga berkata bahawa GeForceRTX5090

Komuniti LLM terbuka ialah era apabila seratus bunga mekar dan bersaing Anda boleh melihat Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 dan banyak lagi. model yang cemerlang. Walau bagaimanapun, berbanding dengan model besar proprietari yang diwakili oleh GPT-4-Turbo, model terbuka masih mempunyai jurang yang ketara dalam banyak bidang. Selain model umum, beberapa model terbuka yang mengkhusus dalam bidang utama telah dibangunkan, seperti DeepSeek-Coder-V2 untuk pengaturcaraan dan matematik, dan InternVL untuk tugasan bahasa visual.

Menurut berita dari laman web ini pada 2 Jun, pada ucaptama Huang Renxun 2024 Taipei Computex yang sedang berlangsung, Huang Renxun memperkenalkan kecerdasan buatan generatif akan mempromosikan pembentukan semula keseluruhan timbunan perisian dan menunjukkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices). . Nvidia percaya bahawa "kilang AI" akan mencetuskan revolusi perindustrian baharu: mengambil industri perisian yang dipelopori oleh Microsoft sebagai contoh, Huang Renxun percaya bahawa kecerdasan buatan generatif akan menggalakkan pembentukan semula timbunan penuhnya. Untuk memudahkan penggunaan perkhidmatan AI oleh perusahaan dari semua saiz, NVIDIA melancarkan perkhidmatan mikro asli awan NIM (Nvidia Inference Microservices) pada Mac tahun ini. NIM+ ialah satu set perkhidmatan mikro asli awan yang dioptimumkan untuk mengurangkan masa ke pasaran

Menurut berita dari laman web ini pada 17 April, TrendForce baru-baru ini mengeluarkan laporan, mempercayai bahawa permintaan untuk produk platform Blackwell baharu Nvidia adalah menaik, dan dijangka memacu jumlah kapasiti pengeluaran pembungkusan CoWoS TSMC meningkat lebih daripada 150% pada 2024. Produk platform baharu NVIDIA Blackwell termasuk GPU siri B dan kad pemecut GB200 yang menyepadukan CPU GraceArm NVIDIA sendiri. TrendForce mengesahkan bahawa rantaian bekalan pada masa ini sangat optimistik tentang GB200, dengan penghantaran dijangka melebihi satu juta unit pada 2025, menyumbang 40-50% daripada GPU mewah Nvidia. Nvidia merancang untuk menyampaikan produk seperti GB200 dan B100 pada separuh kedua tahun ini, tetapi pembungkusan wafer huluan mesti terus menggunakan produk yang lebih kompleks.

Jika 2023 diiktiraf sebagai tahun pertama AI, maka 2024 berkemungkinan menjadi tahun penting untuk mempopularkan model AI yang besar. Pada tahun lalu, sejumlah besar model AI yang besar dan sejumlah besar aplikasi AI telah muncul Pengeluar seperti Meta dan Google juga telah mula melancarkan model besar dalam talian/tempatan mereka sendiri kepada orang ramai, serupa dengan "kecerdasan buatan AI. " itu di luar jangkauan. Konsep itu tiba-tiba datang kepada orang ramai. Pada masa kini, orang ramai semakin terdedah kepada kecerdasan buatan dalam kehidupan mereka Jika anda melihat dengan teliti, anda akan mendapati bahawa hampir semua pelbagai aplikasi AI yang anda boleh akses digunakan pada "awan". Jika anda ingin membina peranti yang boleh menjalankan model besar secara tempatan, maka perkakasan itu adalah AIPC serba baharu berharga lebih daripada 5,000 yuan Untuk orang biasa,

Baru-baru ini, Layer1 blockchain VanarChain telah menarik perhatian pasaran kerana kadar pertumbuhan yang tinggi dan kerjasama dengan NVIDIA gergasi AI. Di sebalik populariti VanarChain, selain melalui pelbagai transformasi jenama, konsep popular seperti permainan utama, metaverse dan AI juga telah memperoleh banyak populariti dan topik projek. Sebelum transformasinya, Vanar, dahulunya TerraVirtua, diasaskan pada 2018 sebagai platform yang menyokong langganan berbayar, menyediakan kandungan realiti maya (VR) dan realiti tambahan (AR), dan menerima pembayaran mata wang kripto. Platform ini dicipta oleh pengasas bersama Gary Bracey dan Jawad Ashraf, dengan Gary Bracey mempunyai pengalaman luas yang terlibat dalam pengeluaran dan pembangunan permainan video.

Menurut berita dari laman web ini pada 22 Februari, secara amnya, NVIDIA dan AMD mempunyai sekatan pada harga saluran, dan beberapa peniaga yang secara peribadi mengurangkan harga dengan ketara juga akan dihukum sebagai contoh, AMD baru-baru ini menghukum peniaga yang menjual kad grafik 6750GRE pada harga di bawah harga minimum Peniaga itu dihukum. Laman web ini mendapati bahawa NVIDIA GeForce RTX 4070 dan 4060 Ti telah jatuh ke tahap paling rendah Versi pengasas mereka, iaitu versi awam kad grafik, pada masa ini boleh menerima kupon 200 yuan di kedai kendalian sendiri JD.com, dengan. harga 4,599 yuan dan 2,999 yuan. Sudah tentu, jika anda mempertimbangkan kedai pihak ketiga, akan ada harga yang lebih rendah. Dari segi parameter, kad grafik RTX4070 mempunyai teras 5888CUDA, menggunakan memori 12GBGDDR6X dan sedikit lebar 192bi
