Universiti Tsinghua memenangi Anugerah Ujian Kertas + Masa Terbaik, Universiti Shandong menerima penghormatan, dan anugerah SIGIR 2024 diumumkan-AI-php.cn

Universiti Tsinghua mempunyai keputusan yang cemerlang.

Persidangan Persatuan Jentera Pengkomputeran mengenai Pencarian Maklumat (ACM SIGIR) ke-47 akan diadakan di Washington, DC, Amerika Syarikat dari 14 hingga 18 Julai, 2024. Persidangan ini merupakan persidangan akademik tertinggi dalam bidang pencarian maklumat.

Sebentar tadi, persidangan itu mengumumkan Anugerah Kertas Terbaik, Naib Johan Kertas Terbaik, Anugerah Sebutan Kehormat Kertas Terbaik dan Anugerah Ujian Masa.

Antaranya, Universiti Tsinghua, Sekolah Kecerdasan Buatan Hillhouse di Universiti Renmin China, dan pasukan Xiaohongshu memenangi kertas terbaik dari Universiti Glasgow dan Universiti Pisa memenangi naib juara; anugerah sebutan untuk kertas terbaik telah dianugerahkan kepada penyelidik dari Universiti Shandong (Qingdao), Universiti Leiden, dan Anugerah Ujian Masa telah dianugerahkan kepada penyelidik dari Universiti Tsinghua dan Universiti California, Santa Cruz;

Seterusnya, mari kita lihat kandungan khusus kertas pemenang.

Kertas terbaik

Kertas: Scaling Laws For Dense Retrieval
🎚 xin, Weihang Su, Jia Chen, Liu Yiqun
Institusi: Universiti Tsinghua, Sekolah Kecerdasan Buatan Hillhouse, Universiti Renmin China, Xiaohongshu

Pautan kertas: https://dl.acm.org/doi/abs/10.11657

74.3657/74.3657

Mengenai makalah

: Penyelidik telah memerhatikan penskalaan undang-undang merentas pelbagai tugas, terutamanya penjanaan bahasa. Penyelidikan menunjukkan bahawa prestasi model bahasa besar mengikut corak yang boleh diramal merentas model dan saiz set data, yang membantu dalam mereka bentuk strategi latihan dengan berkesan dan cekap, terutamanya apabila latihan berskala besar menjadi semakin intensif sumber. Walau bagaimanapun, dalam mendapatkan semula padat, undang-undang pengembangan belum diterokai sepenuhnya.

Kajian ini meneroka cara penskalaan mempengaruhi prestasi model perolehan padat. Khususnya, pasukan penyelidik melaksanakan model perolehan padat dengan bilangan parameter yang berbeza dan melatih mereka menggunakan jumlah data beranotasi yang berbeza. Kajian ini menggunakan entropi kontras sebagai metrik penilaian Berbanding dengan metrik kedudukan diskret, entropi kontras adalah berterusan dan oleh itu boleh mencerminkan prestasi model dengan tepat.

Hasil eksperimen menunjukkan bahawa prestasi model perolehan padat mengikut penskalaan undang-undang kuasa yang tepat yang berkaitan dengan saiz model dan bilangan anotasi. 清华包揽最佳论文+时间检验奖，山大获荣誉提名，SIGIR 2024奖项出炉

Selain itu, kajian juga menunjukkan bahawa undang-undang pengembangan membantu mengoptimumkan proses latihan, seperti menyelesaikan masalah peruntukan sumber di bawah kekangan bajet.

Kajian ini banyak menyumbang kepada pemahaman kesan penskalaan model perolehan padat dan menyediakan panduan yang bermakna untuk penyelidikan masa depan.

Naib Johan bagi kertas terbaik

清华包揽最佳论文+时间检验奖，山大获荣誉提名，SIGIR 2024奖项出炉

🎜Naib Johan bagi kertas terbaik dalam ACM SIGIR tahun ini telah dianugerahkan kepada kertas "A Reproducibility Study of PLAID". Penulis kertas itu termasuk Sean MacAvaney dari Universiti Glasgow dan Nicola Tonellotto dari Universiti Pisa. 🎜🎜🎜🎜

Alamat kertas: https://arxiv.org/pdf/2404.14989

Abstrak kertas: Algoritma PLAID ColBERTv2 menggunakan perwakilan istilah berkelompok untuk mendapatkan dan secara beransur-ansur memangkas dokumen untuk mendapatkan skor dokumen akhir. Artikel ini menghasilkan semula dan mengisi ruang yang hilang dalam teks asal. Dengan mengkaji parameter yang diperkenalkan oleh PLAID, penyelidik mendapati bahawa sempadan Paretonya dibentuk oleh keseimbangan antara tiga parameter. Penyimpangan daripada tetapan yang disyorkan boleh meningkatkan kependaman dengan ketara tanpa perlu meningkatkan keberkesanannya.

Berdasarkan penemuan ini, kertas kerja ini membandingkan PLAID dengan garis asas penting yang tiada daripada kertas kerja: menyusun semula sistem leksikal. Didapati bahawa menggunakan ColBERTv2 sebagai penyusun semula di atas kumpulan hasil awal BM25 memberikan pertukaran kecekapan-keberkesanan yang lebih baik dalam tetapan kependaman rendah. Kerja ini menyerlahkan kepentingan pemilihan berhati-hati garis dasar yang berkaitan apabila menilai kecekapan enjin mendapatkan semula.

Anugerah Sebutan Kehormat untuk Kertas Terbaik

Anugerah Sebutan Terhormat untuk Kertas Terbaik pada persidangan ini telah dimenangi oleh penyelidik dari Universiti Shandong (Qingdao), Universiti Leiden, dan Universiti Amsterdam. Kertas pemenang ialah "Pendapatan Generatif sebagai Pengambilan Padat Berbilang Vektor".

Pengarang kertas kerja: Wu Shiguang, Wei Wenda, Zhang Mengqi, Chen Zhumin, Ma Jun, Ren Zhaochun, Maarten de Rijke, Ren Pengjie
Alamat arxiv: https://arxiv. /pdf/2404.00684

Abstrak: Kertas kerja ini mengukur perkaitan pertanyaan dokumen dengan menunjukkan bahawa perolehan semula generatif dan perolehan padat berbilang vektor berkongsi rangka kerja yang sama. Secara khusus, mereka mengkaji lapisan perhatian dan kepala ramalan bagi perolehan semula generatif, mendedahkan bahawa pengambilan semula generatif boleh difahami sebagai kes khas bagi perolehan padat berbilang vektor. Kedua-dua kaedah mengira korelasi dengan mengira hasil tambah bagi vektor pertanyaan dan vektor dokumen dengan matriks penjajaran.

Kemudian, para penyelidik meneroka cara menggunakan rangka kerja ini untuk mendapatkan semula generatif, dan mereka menggunakan strategi yang berbeza untuk mengira vektor token dokumen dan matriks penjajaran. Eksperimen dijalankan untuk mengesahkan kesimpulan, menunjukkan bahawa kedua-dua paradigma mempamerkan persamaan dalam pemadanan istilah dalam matriks penjajaran mereka.

Anugerah teruji masa

Anugerah ACM SIGIR Time-tested tahun ini telah dianugerahkan kepada penyelidikan mengenai cadangan yang boleh dijelaskan yang diterbitkan di SIGIR 2014 10 tahun lalu, kertas Explicitable Model adalah "Explicitable Model " berdasarkan Analisis Sentimen peringkat Frasa".

Pengarang kertas kerja: Zhang Yongfeng, Lai Guoquan, Zhang Min, Yi Zhang, Liu Yiqun, Ma Shaoping
Institusi: Universiti Tsinghua Cruz
: https:// www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

Kajian ini mentakrifkan masalah "syor yang boleh ditafsir" buat kali pertama dan mencadangkan sentimen yang sepadan kaedah analisis untuk Untuk menyelesaikan cabaran teknikal ini, ia telah memainkan peranan utama dalam bidang berkaitan.

Abstrak kertas: Algoritma pengesyoran berasaskan penapisan kolaboratif (CF), seperti model faktor pendam (LFM), berprestasi baik dari segi ketepatan ramalan. Walau bagaimanapun, ciri asas menyukarkan untuk menerangkan hasil pengesyoran kepada pengguna.

Mujurlah, memandangkan ulasan pengguna dalam talian terus berkembang, maklumat yang tersedia untuk sistem pengesyor latihan tidak lagi terhad kepada penilaian bintang berangka atau ciri pengguna/item. Dengan mengekstrak pendapat eksplisit pengguna tentang pelbagai aspek produk daripada ulasan, adalah mungkin untuk mendapatkan pemahaman yang lebih terperinci tentang perkara yang penting bagi pengguna, yang seterusnya mendedahkan kemungkinan membuat cadangan yang boleh dijelaskan.

Artikel ini mencadangkan EFM (Model Faktor Eksplisit) untuk menjana cadangan yang boleh ditafsir sambil mengekalkan ketepatan ramalan yang tinggi.

Penyelidik mula-mula mengekstrak ciri produk dan pendapat pengguna yang eksplisit dengan menjalankan analisis sentimen peringkat frasa pada ulasan pengguna, dan kemudian menjana pengesyoran dan bukan pengesyoran berdasarkan ciri produk khusus minat pengguna dan ciri terpendam yang dipelajari. Selain itu, penjelasan tahap ciri intuitif tentang sebab item disyorkan atau tidak disyorkan dihasilkan daripada model.

Hasil percubaan luar talian pada berbilang set data dunia nyata menunjukkan bahawa rangka kerja yang dicadangkan dalam kajian ini mengatasi prestasi algoritma garis dasar yang bersaing pada kedua-dua ramalan penarafan dan tugas pengesyoran K atas. Percubaan dalam talian menunjukkan bahawa penjelasan terperinci menjadikan pengesyoran dan bukan pengesyoran lebih mempengaruhi gelagat pembelian pengguna.

Anugerah Cendekiawan Muda

Anugerah Cendekiawan Muda ACM SIGIR bertujuan untuk mengiktiraf penyelidik yang telah memainkan peranan penting dalam penyelidikan pencarian maklumat, pembinaan komuniti cendekiawan, dan promosi ekuiti akademik dianugerahkan ijazah kedoktoran 7 penyelidik muda dalam tempoh 20 tahun. Ai Qingyao, seorang penolong profesor dari Jabatan Sains Komputer Universiti Tsinghua, dan Wang Xiang, seorang profesor dan penyelia kedoktoran dari Sekolah Keselamatan Ruang Siber dan Sekolah Data Besar Universiti Sains dan Teknologi China, memenangi SIGIR 2024 Young Anugerah Ulama.

Ai Qingyao

Ai Qingyao ialah penolong profesor di Jabatan Sains Komputer di Universiti Tsinghua, bidang penyelidikan utamanya memfokuskan pada perolehan maklumat, pembelajaran mesin dan bahasa semula jadi. Hala tuju penyelidikan utama ialah penyelidikan dan reka bentuk sistem perolehan maklumat pintar, termasuk pembelajaran perwakilan maklumat, teori pengoptimuman kedudukan, dan aplikasi model bahasa besar dalam carian dan pengesyoran Internet dan keadilan pintar.

Wang Xiang

Wang Xiang ialah seorang profesor dan penyelia kedoktoran di Sekolah Keselamatan Ruang Siber dan Sekolah Data Besar, Universiti Sains dan Teknologi China. Minat penyelidikan Profesor Wang Xiang termasuk perolehan maklumat, perlombongan data dan kecerdasan buatan yang boleh dipercayai dan boleh dijelaskan, terutamanya sistem pengesyor, pembelajaran graf dan analisis media sosial.

Atas ialah kandungan terperinci Universiti Tsinghua memenangi Anugerah Ujian Kertas + Masa Terbaik, Universiti Shandong menerima penghormatan, dan anugerah SIGIR 2024 diumumkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!