Tafsiran Kecerdasan Buatan: Peringkat Utama Latihan dan Inferens-masalah biasa-php.cn

Kecerdasan buatan (AI), pembelajaran mesin dan AI generatif telah menjadi bahagian penting dalam kotak alat teknologi perusahaan moden. AI meliputi pelbagai jenis teknologi, termasuk terjemahan bahasa masa nyata, pengecaman muka, pembantu suara, sistem pengesyoran diperibadikan dan pengesanan penipuan. Proses latihan dan inferens AI adalah penting untuk memahami keupayaan model. Latihan melibatkan latihan model menggunakan set data, membolehkan model belajar daripada maklumat yang diproses dan membuat ramalan atau keputusan. Fasa inferens menggunakan model terlatih pada data baharu, membolehkannya melaksanakan tugas seperti pengecaman imej, terjemahan bahasa atau membuat keputusan.

Tafsiran Kecerdasan Buatan: Peringkat Utama Latihan dan Inferens

Kecerdasan buatan, pembelajaran mesin dan lebih baru-baru ini kecerdasan buatan generatif kini merupakan sebahagian daripada kit alat teknologi dan metodologi semua syarikat yang terlibat dalam inovasi digital. Kecerdasan buatan termasuk rangkaian luas teknologi yang mampu melaksanakan tugas yang biasanya memerlukan kecerdasan manusia, seperti terjemahan bahasa masa nyata, pengecaman muka, pembantu suara, sistem pengesyoran diperibadikan atau pengesanan penipuan, serta diagnosis perubatan bantuan komputer untuk mengenal pasti penyakit. daripada imej radiologi.

Mari bincangkan proses latihan dan inferens AI untuk lebih memahami keupayaan model (*). Gambar rajah latihan AI

Nota: Istilah bertanda (*) ditakrifkan dalam bahagian Glosari di penghujung artikel ini.

Latihan Kepintaran Buatan

Ringkasnya, latihan kecerdasan buatan ialah proses membangunkan model pembelajaran mesin berdasarkan sejumlah besar data ujian.

Ia melibatkan pemberian set data (*) kepada model yang membolehkannya belajar dan membuat ramalan (*) atau keputusan (*) berdasarkan maklumat yang diprosesnya. Ini adalah peringkat di mana model memperoleh pengetahuan dan kemahiran yang diperlukan untuk melaksanakan tugas tertentu.

Sama ada mentafsir bahasa semula jadi (*) atau melakukan pengiraan yang rumit, langkah ini adalah asasnya. Malah, ia menentukan ketepatan, kecekapan dan prestasi keseluruhan model dan oleh itu aplikasi yang akan menggunakannya.

Proses latihan model AI melibatkan beberapa langkah.

1. Penyediaan Data

Langkah ini melibatkan pengumpulan, pembersihan dan penyusunan data dalam format yang membolehkan penggunaan yang berkesan. Adalah penting untuk memastikan kualiti dan kebolehpercayaan data input model.

2. Algoritma

Langkah kedua melibatkan pemilihan algoritma (*) atau rangkaian neural (*) yang sesuai yang paling sesuai untuk menyelesaikan masalah yang ingin kita selesaikan.

3. Penapisan

Setelah model dipilih, langkah ketiga ialah penghalusan berulang. Ini melibatkan latihan dan ujian model beberapa kali untuk melaraskan parameternya berdasarkan prestasi, meningkatkan ketepatannya dan mengurangkan ralat.

Imej Rajah Kelas Latihan AI

Latihan Kecerdasan Buatan: Cabaran

Melatih model AI menghadapi cabaran sebenar seperti:

Kualiti Data

hanya kualiti data yang berkualiti

. Set data yang tidak tepat, tidak lengkap atau berat sebelah boleh membawa kepada ramalan yang lemah.

Sumber Teknologi Maklumat

Sumber pengkomputeran yang diperlukan untuk latihan memerlukan kuasa pemprosesan yang tinggi dan jumlah memori yang besar, terutamanya untuk model yang kompleks seperti rangkaian pembelajaran mendalam (*). Fenomena seperti overfitting (*) boleh merendahkan kualiti tugasan ramalan atau pengelasan.

Untuk menggambarkan sumber pengiraan yang diperlukan untuk melatih model AI, pertimbangkan bahawa melatih rangkaian pembelajaran mendalam yang kompleks seperti GPT-3 memerlukan sejumlah besar kuasa pengkomputeran untuk menggabungkan 175 bilion parameternya.

AI Inferens

Dalam peringkat ini, model pembelajaran mesin (*) terlatih digunakan pada data baharu, membolehkannya melaksanakan tugas seperti ramalan, pengelasan, pengesyoran atau membuat keputusan dalam aplikasi dunia sebenar.

Dalam erti kata lain, inferens ialah peringkat yang membolehkan model AI memberikan manfaat yang dimaksudkan, seperti mengenal pasti objek dalam imej, menterjemah bahasa, menyediakan cadangan produk atau membimbing kenderaan pandu sendiri.

Bezakan antara latihan dan inferens

Terdapat dua kriteria utama yang membezakan proses inferens daripada latihan AI:

Kepentingan memproses data dalam masa nyata

Keperluan untuk kecekapan dan kependaman rendah

, secara automatik Memandu atau sistem pengesanan penipuan masa nyata mesti mempunyai model yang boleh mentafsir data baharu dengan cepat dan mengambil tindakan dengan cepat.

Cabaran untuk Diatasi

Fasa inferens perlu menumpukan pada kecekapan sumber, mengekalkan prestasi yang konsisten merentas pelbagai persekitaran dan mengoptimumkan model dari segi kelajuan. Model AI mesti boleh disesuaikan tanpa mengorbankan ketepatan atau kebolehpercayaan. Ini memerlukan teknik seperti pemangkasan model (*) atau kuantisasi (*) untuk mengurangkan beban pengiraan sambil mengelakkan kemerosotan prestasi model. Contoh -contoh konkrit yang menggambarkan aplikasi praktikal kesimpulan adalah seperti berikut:

cybersecurity

on yang dilatih pada dataset besar interaksi e -mel, aplikasi dapat mengenal pasti dan bendera ancaman potensial dalam e -mel yang masuk percubaan pancingan data, dengan itu melindungi pengguna daripada ancaman keselamatan siber.

Kenderaan Autonomi

Begitu juga, bidang kenderaan autonomi juga sangat bergantung pada keupayaan penaakulan kecerdasan buatan. Dalam kes ini, model yang dilatih daripada data pemanduan berjam-jam digunakan dalam masa nyata untuk menavigasi jalan raya, mengenali papan tanda lalu lintas dan membuat keputusan separa saat.

Latihan vs. Inferens: Analisis Perbandingan

Latihan dan inferens ialah dua peringkat kritikal dan pelengkap dalam pembangunan model AI, setiap satu memenuhi keperluan khusus. Fasa latihan membolehkan model memperoleh pengetahuan daripada data sejarah. Langkah ini memerlukan banyak kuasa pengkomputeran untuk melaraskan parameter model untuk mencapai ramalan yang tepat.

Inferens, sebaliknya, menggunakan model terlatih pada data baharu untuk membuat ramalan atau keputusan dalam masa nyata, menyerlahkan kepentingan kecekapan dan kependaman rendah.

Points to Remember

Mengimbangi kerumitan model, latihan komprehensif dan kecekapan inferens adalah penting untuk membangunkan sistem kecerdasan buatan.

Model kompleks boleh memahami dan meramalkan dengan lebih baik, tetapi memerlukan lebih banyak sumber untuk latihan dan inferens.

Pembangun mesti menjana model yang cukup kompleks, cukup tepat dan cekap untuk digunakan dalam masa nyata.

Teknik seperti pemangkasan, kuantisasi dan pembelajaran pemindahan boleh mengoptimumkan model dari segi ketepatan dan kecekapan.

Keperluan Infrastruktur

Keperluan infrastruktur untuk fasa latihan dan inferens mengakibatkan pergantungan berat pada prestasi perkakasan.

Melatih model pembelajaran mendalam adalah sangat intensif dari segi pengiraan dan memerlukan sumber khusus untuk menyediakan kuasa pengkomputeran yang berkuasa. Peringkat ini selalunya memerlukan GPU berprestasi tinggi untuk mengurus set data yang besar, yang bergantung kepada ketepatan dan kecekapan model.

Sebaliknya, fasa inferens memerlukan kurang kuasa pengkomputeran tetapi memerlukan kependaman rendah, prestasi pemprosesan tinggi. Infrastrukturnya memerlukan kecekapan dan responsif untuk membolehkan pemprosesan data masa nyata dekat dengan sumber penjanaan data, seperti kereta pandu sendiri atau pelayan e-mel kami, tetapi juga memperkenalkan contoh baharu dalam diagnostik penjagaan kesihatan.

Kesimpulan

Memahami kehalusan latihan dan inferens AI mendedahkan kerumitan antara memperoleh pengetahuan melalui model AI dan menggunakan pengetahuan itu dalam aplikasi konkrit.

Kecerdasan buatan bukan sahaja perlu berkuasa, tetapi juga boleh disesuaikan. Untuk mencapai matlamat ini, keseimbangan mesti dicapai antara penggunaan sumber latihan yang meluas dan keperluan untuk inferens yang cepat dan cekap. Apabila AI maju dalam bidang seperti penjagaan kesihatan, kewangan dan industri, peringkat latihan dan inferens ini adalah kritikal kerana ia membolehkan penciptaan AI yang digunakan untuk kes perniagaan tertentu.

Satu lagi...

Bagaimana pula dengan jejak karbon?

Untuk memajukan pembelajaran mesin dan kecerdasan buatan, jelas sekali perlu untuk menumpukan pada membangunkan model kecerdasan buatan yang lebih cekap, mengoptimumkan infrastruktur perkakasan dan penggunaan strategi inovatif yang lebih meluas. Pada masa yang sama, mungkin jejak ekologi AI juga mesti dipertimbangkan.

"Kecerdasan buatan masa depan akan memerlukan penemuan tenaga, dan ia akan menggunakan lebih banyak kuasa daripada jangkaan orang ramai

- Sam Altman, Ketua Pegawai Eksekutif OpenAI

DAVOS, Switzerland 16 Januari 2024

Malah, dengan As the impak alam sekitar latihan model AI berada di bawah penelitian, kemampanan menjadi isu penting. Apabila perniagaan dan orang ramai mengguna pakainya, lebih banyak tenaga elektrik dan sejumlah besar air akan diperlukan untuk menjana dan menyejukkan platform peranti gergasi teknologi itu. Sebagai contoh, penyelidik menganggarkan bahawa pembuatan GPT-3 menggunakan 1,287 megawatt jam elektrik dan menghasilkan 552 tan bersamaan karbon dioksida, bersamaan dengan memandu 123 bas petrol selama setahun.

Berusaha untuk mencapai masa depan yang lebih mampan di mana kemajuan teknologi dan tanggungjawab ekologi wujud bersama secara harmoni mungkin menjadi matlamat utama evolusi kecerdasan buatan.

(*) Glosari

Algoritma: Satu set prosedur atau peraturan pengiraan yang ditetapkan dan langkah demi langkah yang direka untuk melaksanakan tugas tertentu atau menyelesaikan masalah tertentu
Set data: Himpunan titik atau rekod data , biasanya menggunakan Borang jadual yang digunakan untuk melatih, menguji atau mengesahkan model pembelajaran mesin, termasuk ciri (pembolehubah bebas) dan label (pembolehubah bersandar atau hasil) dalam pembelajaran diselia.
Keputusan: Dalam pembelajaran mesin, ini merujuk kepada kesimpulan bahawa model dicapai selepas menganalisis data, seperti penapis spam yang memutuskan sama ada e-mel adalah spam (dan memindahkannya ke folder spam) atau tidak (Tinggalkan dalam peti masuk).
Pembelajaran Mendalam: Subset pembelajaran mesin yang melibatkan model yang dipanggil rangkaian saraf berbilang lapisan yang dapat secara automatik mempelajari corak dan perwakilan yang kompleks daripada sejumlah besar data
Data Berlabel: Ini merujuk kepada setiap kejadian sebagai set data dilabelkan dengan hasil atau kategori untuk memberikan panduan yang jelas untuk model pembelajaran mesin semasa latihan.
Pembelajaran Mesin: Satu cabang kecerdasan buatan yang melibatkan algoritma latihan untuk mengenali corak dan membuat keputusan berdasarkan data tanpa perlu diprogramkan secara eksplisit untuk setiap tugas tertentu
Model: Matematik dilatih pada set data dan perwakilan pengiraan mampu meramal dan mengklasifikasikan data baharu yang tidak kelihatan dengan corak pembelajaran dan perhubungan dalam data latihan
Pemangkasan model: teknik dalam pembelajaran bersekutu secara adaptif Pangkas parameter untuk mengurangkan saiz model bagi mengurangkan permintaan pengiraan dan komunikasi pada peranti pelanggan tanpa menjejaskan dengan ketara ketepatan model
Bahasa Semulajadi: Cara manusia berkomunikasi antara satu sama lain, sama ada lisan atau bertulis, merangkumi manusia Kerumitan, nuansa dan peraturan ekspresi bahasa yang wujud
Rangkaian Neural: Model pengkomputeran yang diilhamkan oleh struktur otak manusia, yang terdiri daripada nod atau neuron yang saling berkaitan, yang memproses dan menghantar isyarat untuk menyelesaikan tugas yang kompleks seperti pengecaman corak dan membuat keputusan dengan belajar daripada data
Penyesuaian berlebihan: Apabila model pembelajaran mesin mempelajari data latihan terlalu dekat, menjadikannya tidak dapat membuat generalisasi dan meramal dengan tepat hasil pada data yang tidak kelihatan
Corak: (dalam konteks pembelajaran mesin) perkara yang dipelajari oleh model untuk mengecam corak yang boleh dilihat dalam data yang boleh digunakan untuk membuat ramalan atau keputusan tentang data baharu yang tidak kelihatan
Ramalan: (dalam pembelajaran mesin) menggunakan model terlatih untuk menganggar data baharu berdasarkan corak yang dipelajari semasa fasa latihan , proses mencari hasil yang paling mungkin atau nilai untuk contoh ghaib
Kuantisasi: (dalam pembelajaran mendalam) proses mengurangkan ketepatan pemberat dan pengaktifan dalam model kepada 2, 3 atau 4 digit, menjadikan model Keupayaan untuk berjalan dengan lebih cekap pada masa inferens dengan kehilangan ketepatan yang minimum.
Diselia / Tidak diselia: Perbezaan antara pembelajaran diselia dan pembelajaran tidak diselia ialah dalam latihan pembelajaran diselia terdapat data berlabel (*) yang membimbing model untuk mempelajari pemetaan dari input ke output, manakala pembelajaran tanpa pengawasan melibatkan pencarian dalam data Corak atau struktur tanpa label hasil yang jelas.

Atas ialah kandungan terperinci Tafsiran Kecerdasan Buatan: Peringkat Utama Latihan dan Inferens. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!