Pengurusan model pembelajaran mesin: pemodelan bersepadu-AI-php.cn

Penterjemah |. Cui Hao

Penilai |. senario menyelesaikan masalah perniagaan yang berbeza Dengan aplikasi pembelajaran mesin yang meluas, organisasi terharu apabila memilih kaedah pembelajaran.

Banyak organisasi menggunakan kaedah pembelajaran lanjutan dan klasik dalam aplikasi pembelajaran mesin. Terdapat dikotomi biasa pembelajaran diselia dan tidak diselia, serta varian pembelajaran mesin yang muncul seperti pembelajaran kontrastif, pembelajaran pengukuhan dan pembelajaran penyeliaan kendiri.

Selain itu, terdapat analisis graf, rangkaian saraf dalam, segmentasi, analisis tingkah laku dan teknik lain yang terlibat. Apabila berhadapan dengan masalah perniagaan berskala besar dan kompleks—seperti memperkukuh langkah pencegahan pengubahan wang haram untuk memerangi jenayah kewangan—bagaimanakah organisasi memutuskan kaedah pembelajaran mesin yang hendak digunakan? Pengurusan model pembelajaran mesin: pemodelan bersepadu

Menggunakan model ensemble, masalah ini menjadi kurang penting. Pendekatan pembelajaran mesin ini membolehkan organisasi memanfaatkan pelbagai model dan menggabungkannya dengan ketepatan ramalan untuk mencapai hasil yang optimum.

Pendekatan ini membantu menyediakan konteks penuh untuk data berdimensi tinggi dalam perkhidmatan kewangan, pengesanan penipuan dan keselamatan siber. Organisasi yang menggunakan pemodelan ensemble mengatakan bahawa "pemodelan ensemble menjadikan pembinaan model lebih pelbagai," dan Martin Rehak, Ketua Pegawai Eksekutif Resistant AI, mengakui, "Kami tidak mahu satu model menonjol."

Gunakan model kepelbagaian Membolehkan organisasi menggunakan algoritma yang berbeza untuk menilai pelbagai aspek masalah perniagaan untuk menggunakan kaedah membuat keputusan yang bermaklumat sepenuhnya dan konsisten - yang boleh dijelaskan.

Membuat keputusan model berasaskan konsensus

Prinsip pemodelan bersepadu yang dinyatakan sebelum ini tidak boleh dipertikaikan Para saintis data tidak perlu menghabiskan banyak masa untuk mereka bentuk model yang sempurna untuk kes perniagaan, mereka hanya perlukan untuk menggabungkan model Tidak Sempurna tersebut bergabung untuk menghasilkan kuasa ramalan. "Apabila anda melihat pembelajaran mesin dalam pendekatan ensemble, anda membuat keputusan daripada algoritma kecil," kata Rehak. “Dan, dalam kes kami, algoritma ini digabungkan secara dinamik untuk setiap perdagangan untuk membuat keputusan yang terbaik, mungkin setiap model ini boleh mengkhususkan diri dalam menegak tertentu, cth.

Sebagai contoh, satu model hanya memfokuskan pada saiz transaksi. Model lain memfokuskan pada lokasi transaksi. Model yang berbeza boleh memeriksa peserta tertentu yang terlibat dalam urus niaga. Matlamatnya ialah situasi di mana "tidak ada sebarang lonjakan," jelas Rehak. "Pengedaran model adalah sangat rata, dan bukti yang sepadan dengan model itu agak lemah. Dengan menggabungkan banyak elemen bukti yang lemah, anda boleh membuat keputusan yang lebih kukuh lagi ialah melalui pembelajaran mesin klasik dan model yang lebih mudah , kurang latihan." data (dan anotasi) diperlukan untuk meletakkan model ke dalam pengeluaran. Model sedemikian lebih mudah untuk ditafsirkan daripada rangkaian saraf dalam, yang memerlukan sejumlah besar data latihan.

Pemodelan Kontekstual

Adalah penting untuk membezakan pendekatan pemodelan pengedaran rata yang diterangkan oleh Rehak daripada teknik pemodelan ensembel lain. Contoh pemodelan ensemble yang paling biasa melibatkan pembungkusan atau boosting (yang terakhir mungkin memerlukan Xtreme Gradient Boosting). Random Forest ialah contoh rangsangan berdasarkan gabungan pokok keputusan yang berbeza. Dengan pendekatan ini, "anda membina koleksi satu demi satu berdasarkan versi sebelumnya dalam koleksi," komen Rehak. Walaupun ia adalah cara yang cepat untuk membina model dengan ketepatan ramalan yang tinggi, ia menghadapi risiko overfitting (model menjadi kurang sesuai untuk data pengeluaran kerana set data latihan terlalu kecil).

Pendekatan bersepadu Rehak lebih sesuai untuk kes penggunaan AML kerana ia berdasarkan konteks yang mempengaruhi peristiwa ini. "Jika anda bertanya kepada pakar pengubahan wang haram sama ada transaksi itu berniat jahat, mereka terlebih dahulu melihat sejarah akaun dan bagaimana orang itu berkelakuan pada masa lalu," kata Rehak. Melalui pendekatan beliau, faktor yang berkaitan dengan lokasi geografi, masa dalam sehari, pihak yang berminat dan institusi kewangan diperiksa menggunakan model pembelajaran mesin yang berasingan. Hanya dengan menggabungkan keputusan setiap model ini, sistem AI boleh menentukan sama ada transaksi jenayah telah berlaku, dan positif palsu akan dikurangkan dengan ketara dengan berbuat demikian. "Pembelajaran mesin boleh menjelaskan kebanyakan perkara luar yang sebaliknya akan mengatasi pasukan anti-pengubahan wang haram," kata Rehak.

Sempadan Keputusan

Apabila menyepadukan pemodelan kes guna, adalah perkara biasa untuk menggunakan lebih 60 model untuk memodelkan pelbagai aspek transaksi analitik. Keputusan masa nyata pendekatan bersepadu sangat sesuai untuk senario aplikasi ini. "Salah satu daripada 60 algoritma ini boleh membahagikan segala-galanya kepada segmen dan kemudian memodelkan purata saiz transaksi sesaat," dedah Rehak. "Kami boleh mempunyai beribu-ribu klip yang dikemas kini secara dinamik pada masa yang sama."

Dengan sejumlah besar model yang disepadukan ke dalam ensemble, setiap satu menilai aspek transaksi yang berbeza untuk mendedahkan potensi tingkah laku jenayah, pendekatan yang lebih komprehensif tidak boleh dibuat. “Kami melihat anda dari banyak sudut sehingga menjadi sangat sukar untuk membentuk tingkah laku anda pada masa yang sama membolehkan anda mengelak daripada semua perbuatan jenayah ini,” dedah Rehak “Kerana, untuk tidak dikenal pasti, seorang 'penjenayah' perlu elakkan lebih daripada satu sempadan Keputusan, tetapi sebilangan besar sempadan keputusan dinamik setiap model dalam algoritma ini dipelajari secara bebas, dan kemudian kami menggabungkannya bersama-sama Terdapat banyak aspek bagaimana set ini meningkatkan kebolehtafsiran dan apa yang sepadan dengannya. Pertama, mereka tidak terlalu bergantung pada pembelajaran mesin lanjutan dan hanya memasukkan algoritma yang lebih mudah dan boleh ditafsir (melibatkan pembelajaran mesin tradisional). Model-model ini menjadi asas dalam menilai jenayah transaksi. "Apabila kami mengatakan sesuatu itu penting, kami boleh memberitahu anda mengapa," kata Rehak. "Kami boleh memberitahu anda penunjuk yang menunjukkan perkara ini. Kami boleh menulis laporan untuk setiap penemuan yang menunjukkan bahawa terdapat risiko tinggi jenayah transaksi disebabkan faktor-faktor ini Walaupun setiap algoritma memfokuskan pada ciri, tidak semua algoritma mempunyai berat yang sama." model itu. Secara umumnya, algoritma yang melibatkan analisis graf (yang pandai memeriksa perhubungan) diberi berat yang lebih besar daripada model lain.

Model bukan sahaja boleh menerangkan tingkah laku yang mencurigakan, tetapi juga memberitahu anda sebab penyimpangan berlaku. "Biasanya kami mempunyai empat atau lima algoritma dominan dalam ensemble, bermakna apabila saya percaya ia adalah outlier, yang lain bersetuju kerana algoritma di belakangnya, " kata Rehak. "Selain itu, kami mempunyai empat atau lima pencetus, yang menjamin bahawa keputusan agak berat sebelah terhadap anomali." "Oleh kerana kami tahu set, kami tahu pembahagian mikro, dan kami tahu volumnya, kami boleh memaparkan maklumat itu dengan mudah dengan soalan di sebelah skor, dan volum sangat penting kepada jabatan kewangan syarikat," tambah Rehak.

Corak Bersepadu

Akhirnya, penggunaan pemodelan bersepadu mengatasi mana-mana satu aplikasi, walaupun ia boleh menjadi bantuan besar untuk aktiviti AML. Jika digunakan dengan betul, teknologi ini boleh meningkatkan kebolehtafsiran sambil mengurangkan jumlah data latihan dan anotasi yang diperlukan untuk menyelesaikan masalah kritikal perniagaan.

Pemodelan ensemble memanfaatkan pelbagai teknik sains data untuk menyelesaikan pelbagai masalah perniagaan dan bukannya mengehadkan masalah kepada satu atau dua. Akibatnya, pendekatan penyelesaian masalah bersepadu ini mungkin menjadi anak poster untuk penggunaan AI.

Pengenalan penterjemah

Cui Hao, editor komuniti 51CTO dan arkitek kanan, mempunyai 18 tahun pengalaman pembangunan perisian dan seni bina serta 10 tahun pengalaman seni bina yang diedarkan. Dahulu pakar teknikal di HP. Beliau bersedia berkongsi dan telah menulis banyak artikel teknikal popular dengan lebih daripada 600,000 bacaan. Pengarang "Prinsip dan Amalan Seni Bina Teragih".

Tajuk asal:

Pengurusan Model Pembelajaran Mesin: Permodelan Ensemble

Atas ialah kandungan terperinci Pengurusan model pembelajaran mesin: pemodelan bersepadu. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!