Perlindungan masa nyata terhadap rentetan penyekat muka di web (berdasarkan pembelajaran mesin)-AI-php.cn

Serangan anti-muka, iaitu, sebilangan besar sekatan terapung, tetapi tidak menyekat orang dalam skrin video Ia kelihatan seperti terapung dari belakang orang itu.

Pembelajaran mesin telah popular selama beberapa tahun, tetapi ramai orang tidak tahu bahawa keupayaan ini juga boleh dijalankan dalam penyemak imbas

Artikel ini memperkenalkan proses pengoptimuman praktikal dalam rentetan video, disenaraikan; pada akhir artikel Beberapa senario di mana penyelesaian ini terpakai diterangkan, dengan harapan dapat membuka beberapa idea.

Demo mediapipe (https://google.github.io/mediapipe/) menunjukkan

Web 端实时防挡脸弹幕（基于机器学习）

Prinsip pelaksanaan benteng anti muka arus perdana

Atas permintaan

Muat naik video

Pengiraan latar belakang pelayan mengekstrak kawasan potret dalam skrin video dan menukarnya kepada storan svg

Semasa pelanggan memainkan video, ia memuat turun svg daripada pelayan Digabungkan dengan benteng, benteng tidak dipaparkan dalam kawasan potret

Siaran langsung

Apabila sauh menolak aliran, kawasan potret diekstrak daripada skrin dalam masa nyata (peranti hos) dan ditukar kepada svg
Gabungkan data svg ke dalam strim video (SEI) dan tolak strim ke pelayan
Pada masa yang sama semasa klien bermain video, huraikan svg daripada strim video (SEI)
Gabungkan svg dengan sintesis Skrin pop timbul, kawasan potret tidak memaparkan rentetan

Pelan pelaksanaan artikel ini

Semasa pelanggan memainkan video, maklumat kawasan potret diekstrak daripada skrin dalam masa nyata, dan maklumat kawasan potret dieksport ke dalam gambar dan peluru Sintesis skrin, rentetan tidak akan dipaparkan dalam kawasan potret.

Prinsip Pelaksanaan

Menggunakan perpustakaan sumber terbuka pembelajaran mesin untuk mengekstrak garis besar potret daripada imej video dalam masa nyata, seperti Pembahagian Badan (https://github.com/tensorflow/tfjs -models/blob/ master/body-segmentation/README.md)
Eksport garis besar potret ke dalam gambar, dan tetapkan imej topeng lapisan barrage (https://developer.mozilla.org/ zh-CN/docs/ Web/CSS/mask-image)

Berbanding dengan penyelesaian tradisional (SEI secara langsung masa nyata)

Kelebihan:

Mudah untuk dilaksanakan; hanya satu teg Video diperlukan Parameter, tidak memerlukan penyelarasan berbilang hujung
Tiada penggunaan jalur lebar rangkaian

Kelemahan:

Had prestasi teori adalah lebih rendah daripada penyelesaian tradisional; setara dengan menukar sumber prestasi untuk Sumber rangkaian

Masalah yang dihadapi

JavaScript diketahui mempunyai prestasi yang lemah, menjadikannya tidak sesuai untuk CPU- tugasan intensif. Daripada demo rasmi kepada amalan kejuruteraan, cabaran terbesar ialah prestasi.

Amalan ini akhirnya mengoptimumkan penggunaan CPU kepada kira-kira 5% (2020 M1 Macbook), mencapai keadaan sedia pengeluaran.

Amalkan proses penalaan

Pilih model pembelajaran mesin

BodyPix (https://github.com/tensorflow/tfjs-models/blob/master/body-segmentation / src/body_pix/README.md)

Ketepatan terlalu lemah, mukanya sempit, dan jelas terdapat pertindihan antara rentetan dan tepi muka watak

Web 端实时防挡脸弹幕（基于机器学习）

BlazePose (https://github.com/tensorflow/tfjs-models/blob/master/pose-detection/src/blazepose_mediapipe/README.md)

Ketepatan yang sangat baik dan menyediakan maklumat titik badan, Tetapi prestasinya kurang baik

Web 端实时防挡脸弹幕（基于机器学习）

Contoh struktur data pengembalian

[{score: 0.8,keypoints: [{x: 230, y: 220, score: 0.9, score: 0.99, name: "nose"},{x: 212, y: 190, score: 0.8, score: 0.91, name: "left_eye"},...],keypoints3D: [{x: 0.65, y: 0.11, z: 0.05, score: 0.99, name: "nose"},...],segmentation: {maskValueToLabel: (maskValue: number) => { return 'person' },mask: {toCanvasImageSource(): ...toImageData(): ...toTensor(): ...getUnderlyingType(): ...}}}]

MediaPipe SelfieSegmentation (https://github.com/tensorflow/tfjs-models/blob/ master /body-segmentation/src/selfie_segmentation_mediapipe/README.md)

Ketepatan yang sangat baik (kesan yang sama seperti model BlazePose), penggunaan CPU adalah kira-kira 15% lebih rendah daripada model BlazePose, prestasi lebih baik, tetapi anggota badan tidak disediakan dalam maklumat Point data yang dikembalikan

Contoh struktur data pulangan

{maskValueToLabel: (maskValue: number) => { return 'person' },mask: {toCanvasImageSource(): ...toImageData(): ...toTensor(): ...getUnderlyingType(): ...}}

Pelaksanaan versi pertama

Rujuk kepada pelaksanaan rasmi model MediaPipe SelfieSegmentation (https://github.com/tensorflow/ tfjs-models/blob /master/body-segmentation/README.md#bodysegmentationdrawmask), tanpa pengoptimuman, CPU mengambil kira-kira 70%

const canvas = document.createElement('canvas')canvas.width = videoEl.videoWidthcanvas.height = videoEl.videoHeightasync function detect (): Promise<void> {const segmentation = await segmenter.segmentPeople(videoEl)const foregroundColor = { r: 0, g: 0, b: 0, a: 0 }const backgroundColor = { r: 0, g: 0, b: 0, a: 255 } const mask = await toBinaryMask(segmentation, foregroundColor, backgroundColor) await drawMask(canvas, canvas, mask, 1, 9)// 导出Mask图片，需要的是轮廓，图片质量设为最低handler(canvas.toDataURL('image/png', 0)) window.setTimeout(detect, 33)} detect().catch(console.error)

Kurangkan kekerapan pengekstrakan dan mengimbangi pengalaman prestasi

Selesaikan kesesakan prestasi

Menganalisis graf nyalaan, didapati bahawa kesesakan prestasi berada dalam toBinaryMask dan toDataURL

Web 端实时防挡脸弹幕（基于机器学习） Menulis Semula keBinaryMask🎜 >

Menganalisis kod sumber, digabungkan dengan pencetakan maklumat segmentasi, kami mendapati segmentation.mask .toCanvasImageSource boleh mendapatkan objek ImageBitmap asal, iaitu maklumat yang diekstrak oleh model. Cuba tulis kod anda sendiri untuk menukar ImageBitmap kepada Mask dan bukannya menggunakan pelaksanaan lalai yang disediakan oleh perpustakaan sumber terbuka.

Prinsip Pelaksanaan

window.setTimeout(detect, 66) // 33 => 66

Langkah 2 dan 3 adalah bersamaan dengan mengisi kandungan di luar kawasan potret dengan warna hitam (mengisi terbalik ImageBitmap), untuk bekerjasama dengan css (imej topeng), jika tidak hanya apabila Bendungan hanya kelihatan apabila ia terapung ke kawasan potret (betul-betul bertentangan dengan kesan sasaran).

globalCompositeOperation MDN（https://developer.mozilla.org/zh-CN/docs/Web/API/CanvasRenderingContext2D/globalCompositeOperation）

此时，CPU 占用 33% 左右

多线程优化

我原先认为toDataURL是由浏览器内部实现的，无法再进行优化，现在只有优化toDataURL这个耗时操作了。

虽没有替换实现，但可使用 OffscreenCanvas （https://developer.mozilla.org/zh-CN/docs/Web/API/OffscreenCanvas）+ Worker，将耗时任务转移到 Worker 中去，避免占用主线程，就不会影响用户体验了。

并且ImageBitmap实现了Transferable接口，可被转移所有权，跨 Worker 传递也没有性能损耗（https://hughfenghen.github.io/fe-basic-course/js-concurrent.html#%E4%B8%A4%E4%B8%AA%E6%96%B9%E6%B3%95%E5%AF%B9%E6%AF%94）。

// 前文 detect 的反向填充 ImageBitmap 也可以转移到 Worker 中// 用 OffscreenCanvas 实现， 此处略过 const reader = new FileReaderSync()// OffscreenCanvas 不支持 toDataURL，使用 convertToBlob 代替offsecreenCvsEl.convertToBlob({type: 'image/png',quality: 0}).then((blob) => {const dataURL = reader.readAsDataURL(blob)self.postMessage({msgType: 'mask',val: dataURL})}).catch(console.error)

Web 端实时防挡脸弹幕（基于机器学习）

可以看到两个耗时的操作消失了

此时，CPU 占用 15% 左右

降低分辨率

继续分析，上图重新计算样式（紫色部分）耗时约 3ms

Demo 足够简单很容易推测到是这行代码导致的，发现 imgStr 大概 100kb 左右（视频分辨率 1280x720）。

danmakuContainer.style.webkitMaskImage = `url(${imgStr})

通过canvas缩小图片尺寸（360P甚至更低），再进行推理。

优化后，导出的 imgStr 大概 12kb，重新计算样式耗时约 0.5ms。

此时，CPU 占用 5% 左右

Web 端实时防挡脸弹幕（基于机器学习）

启动条件优化

虽然提取 Mask 整个过程的 CPU 占用已优化到可喜程度。

当在画面没人的时候，或没有弹幕时候，可以停止计算，实现 0 CPU 占用。

无弹幕判断比较简单（比如 10s 内收超过两条弹幕则启动计算），也不在该 SDK 实现范围，略过

判定画面是否有人

第一步中为了高性能，选择的模型只有ImageBitmap，并没有提供肢体点位信息，所以只能使用getImageData返回的像素点值来判断画面是否有人。

画面无人时，CPU 占用接近 0%

发布构建优化

依赖包的提交较大，构建出的 bundle 体积：684.75 KiB / gzip: 125.83 KiB

所以，可以进行异步加载SDK，提升页面加载性能。

分别打包一个 loader，一个主体
由业务方 import loader，首次启用时异步加载主体

这个两步前端工程已经非常成熟了，略过细节。

运行效果

Web 端实时防挡脸弹幕（基于机器学习）

总结

过程

选择高性能模型后，初始状态 CPU 70%
降低 Mask 刷新频率（15FPS），CPU 50%
重写开源库实现（toBinaryMask），CPU 33%
多线程优化，CPU 15%
降低分辨率，CPU 5%
判断画面是否有人，无人时 CPU 接近 0%

CPU 数值指主线程占用

注意事项

兼容性：Chrome 79及以上，不支持 Firefox、Safari。因为使用了OffscreenCanvas
不应创建多个或多次创建segmenter实例（bodySegmentation.createSegmenter），如需复用请保存实例引用，因为：
创建实例时低性能设备会有明显的卡顿现象
会内存泄露；如果无法避免，这是mediapipe 内存泄露解决方法（https://github.com/google/mediapipe/issues/2819#issuecomment-1160335349）

经验

优化完成之后，提取并应用 Mask 关键计算量在 GPU (30%左右)，而不是 CPU
性能优化需要业务场景分析，防挡弹幕场景可以使用低分辨率、低刷新率的 mask-image，能大幅减少计算量
该方案其他应用场景：
替换/模糊人物背景
人像马赛克
人像抠图
卡通头套，虚拟饰品，如猫耳朵、兔耳朵、带花、戴眼镜什么的（换一个模型，略改）
关注Web 神经网络 API （https://mp.weixin.qq.com/s/v7-xwYJqOfFDIAvwIVZVdg）进展，以后实现相关功能也许会更简单

本期作者

Web 端实时防挡脸弹幕（基于机器学习）

刘俊

Jurutera Pembangunan Kanan Bilibili

Atas ialah kandungan terperinci Perlindungan masa nyata terhadap rentetan penyekat muka di web (berdasarkan pembelajaran mesin). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Oguri Cap Build Guide | Musume Derby Pretty

4 minggu yang lalu By Jack chen

Agnes Tachyon Build Guide | Musume Derby Pretty

3 minggu yang lalu By Jack chen

Panduan Membina Rumput Wonder | Uma Musume Pretty Derby

3 minggu yang lalu By Jack chen

Cara Memperbaiki KB5060829 Tidak Memasang & Pepijat Lain Lain

4 minggu yang lalu By DDD

<🎜>: 99 Malam di Hutan - Semua Lencana Dan Cara Membuka Kunci Mereka

2 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Tutorial Java

1795

Tutorial CakePHP

1740

Tutorial Laravel

1593

Tutorial PHP

1475

Jawapan silang kata NYT mini

267

587

Tunjukkan Lagi

Related knowledge

Cara Menggunakan PHP untuk Membina Fungsi Perkongsian Sosial PHP Perkongsian Interface Integration Practice Jul 25, 2025 pm 08:51 PM

Kaedah teras untuk membina fungsi perkongsian sosial dalam PHP adalah untuk menghasilkan pautan perkongsian secara dinamik yang memenuhi keperluan setiap platform. 1. Mula -mula dapatkan halaman semasa atau URL dan maklumat artikel yang ditentukan; 2. Gunakan urlencode untuk menyandikan parameter; 3. Sambutan dan menjana pautan perkongsian mengikut protokol setiap platform; 4. Pautan paparan di hujung depan untuk pengguna mengklik dan berkongsi; 5. Dinamik menghasilkan tag OG pada halaman untuk mengoptimumkan paparan kandungan perkongsian; 6. Pastikan untuk melepaskan input pengguna untuk mencegah serangan XSS. Kaedah ini tidak memerlukan pengesahan yang kompleks, mempunyai kos penyelenggaraan yang rendah, dan sesuai untuk kebanyakan keperluan perkongsian kandungan.

Apakah nombor kod bitcoin? Apa gaya kod bitcoin? Jul 22, 2025 pm 09:51 PM

Sebagai perintis di dunia digital, nama kod unik Bitcoin dan teknologi asas selalu menjadi tumpuan perhatian orang. Kod standardnya adalah BTC, juga dikenali sebagai XBT pada platform tertentu yang memenuhi piawaian antarabangsa. Dari sudut pandangan teknikal, Bitcoin bukanlah satu gaya kod tunggal, tetapi projek perisian sumber terbuka yang besar dan canggih. Kod terasnya terutamanya ditulis dalam C dan menggabungkan kriptografi, sistem yang diedarkan dan prinsip ekonomi, supaya sesiapa sahaja dapat melihat, mengkaji dan menyumbang kodnya.

PHP memanggil AI Pembantu Suara Pintar PHP Pembinaan Sistem Interaksi Suara PHP Jul 25, 2025 pm 08:45 PM

Input suara pengguna ditangkap dan dihantar ke backend PHP melalui API Mediarecorder JavaScript front-end; 2. PHP menjimatkan audio sebagai fail sementara dan memanggil STTAPI (seperti Pengiktirafan Suara Google atau Baidu) untuk mengubahnya menjadi teks; 3. PHP menghantar teks kepada perkhidmatan AI (seperti Openaigpt) untuk mendapatkan jawapan pintar; 4. PHP kemudian memanggil TTSAPI (seperti sintesis Baidu atau Google Voice) untuk menukar balasan ke fail suara; 5. PHP mengalir fail suara kembali ke bahagian depan untuk bermain, menyelesaikan interaksi. Seluruh proses dikuasai oleh PHP untuk memastikan hubungan lancar antara semua pautan.

Pemasangan Pemasangan Telefon bimbit Bian Exchange V2.105.8 Pakej Kemas kini Versi Android Jul 22, 2025 pm 10:06 PM

1. Pastikan kestabilan rangkaian dan ruang penyimpanan peranti yang mencukupi, dan muat turun hanya melalui laman web rasmi; 2. Masukkan laman web rasmi dalam pelayar mudah alih, cari halaman muat turun dan pilih versi Android, dan muat turun fail pemasangan V2.105.8 dengan .apk sebagai akhiran; 3. Selepas muat turun selesai, membolehkan "membenarkan aplikasi dari sumber ini" kebenaran dan klik pada fail untuk melengkapkan pemasangan; 4. Jangan muat turun melalui pautan tidak rasmi, kemas kini versi aplikasi secara teratur, dan perhatikan untuk memeriksa keselamatan persekitaran semasa log masuk; 5. Adalah disyorkan untuk mengumpul halaman muat turun laman web rasmi untuk kemas kini berikutnya, dan menyediakan fungsi keselamatan dalam aplikasinya untuk memastikan keselamatan aset digital.

Bagaimana untuk memuat turun aplikasi Bitcoin rasmi? Panduan Penggunaan Aplikasi Bitcoin Jul 22, 2025 pm 11:54 PM

Bitcoin tidak mempunyai aplikasi rasmi, dan pengguna terutamanya berdagang dan menguruskannya melalui pertukaran pihak ketiga atau aplikasi akaun. 1. Binance mempunyai fungsi yang komprehensif dan sesuai untuk semua jenis peniaga; 2. OKX menyediakan akaun dagangan bersepadu dan akaun web3; 3. Huobi (HTX) stabil dan boleh dipercayai di pasaran Asia; 4. Gate.io terkenal dengan mata wangnya yang kaya; 5. Kucoin mempunyai mata wang yang pelbagai dan komuniti aktif; 6. Bybit terkenal dengan perdagangan derivatifnya. Apabila memuat turun, anda perlu melawat laman web rasmi, mengimbas kod QR, lengkapkan pemasangan mengikut sistem, dan menyediakan langkah-langkah keselamatan seperti pengesahan dua faktor untuk memastikan keselamatan akaun.

Tutorial Muat Turun Muat Turun Versi Terkini Binance Exchange Binance Jul 24, 2025 pm 10:39 PM

Binance adalah platform perdagangan aset digital yang terkenal di dunia. Aplikasi rasminya menyediakan pengguna dengan pengalaman perdagangan mudah alih yang selamat dan mudah. Melalui aplikasi Binance, anda boleh membeli dan menjual kriptografi pada bila -bila masa, di mana sahaja, menguruskan aset digital anda dan dapatkan trend pasaran terkini.

Bagaimanakah lembaran gaya lalai pelayar mempengaruhi rendering? Jul 19, 2025 am 02:08 AM

Gaya lalai penyemak imbas memastikan kebolehbacaan asas dengan menggunakan margin, mengisi, fon, dan gaya elemen secara automatik, tetapi boleh menyebabkan susun atur silang penyemak imbas yang tidak konsisten. 1. Margin lalai dan mengisi perubahan aliran susun atur, seperti jarak tajuk, perenggan dan senarai; 2. Tetapan fon lalai mempengaruhi kebolehbacaan, seperti saiz fon 16px dan font masa times; 3. Unsur -unsur bentuk sangat berbeza dalam pelayar yang berbeza, jadi penampilan perlu ditetapkan semula; 4. Beberapa tag seperti Strong dan EM mempunyai gaya penekanan lalai dan perlu ditulis secara jelas. Penyelesaian termasuk menggunakan normalize.css, gaya tetapan semula, atau margin yang jelas dan mengisi global, sambil menyesuaikan fon dan bentuk bentuk untuk konsistensi.

Berapakah masa pengesahan blockchain? Bagaimana untuk menanyakan status pengesahan transaksi pada blok block? Jul 23, 2025 pm 11:48 PM

Waktu pengesahan blockchain merujuk kepada masa yang diperlukan untuk transaksi yang disiarkan untuk dibungkus oleh blok dan ditulis ke rantai. Kelajuan pengesahan rantai yang berbeza berbeza -beza. 1. Bitcoin menghasilkan blok secara purata dalam 10 minit, dan disyorkan untuk mengesahkan 6 kali untuk memastikan keselamatan; 2. Ethereum menghasilkan blok dalam kira-kira 12 saat, dan 1-3 kali dapat disahkan, dan kebanyakan urus niaga selesai dalam masa 1 minit; 3. Masa blok rantai BSC adalah kira-kira 3 saat, sesuai untuk perdagangan frekuensi tinggi; 4. Masa blok Tide Tide adalah 1-3 saat, sesuai untuk pemindahan masa nyata; 5. Waktu blok poligon adalah kira -kira 2 saat, dengan yuran yang rendah, dan digunakan secara meluas dalam defi dan NFT. Hash Trading (TXID) diperlukan untuk status pertanyaan dan pengesahan. Platform yang disyorkan termasuk: 1. Ouyi OKX, yang menyokong pertanyaan transaksi pelbagai rantai; 2. Binance, sesuai untuk rantai BSC; 3. Huobi Ht

See all articles