清華大学がBest Paper + Time Test Awardを受賞、山東大学が佳作を受賞、SIGIR 2024賞が発表-AI-php.cn

清華大学は素晴らしい成績を収めています。

第47回Association for Computing Machinery Conference on Information Retrieval (ACM SIGIR)は、2024年7月14日から18日まで米国ワシントンDCで開催されます。この会議は情報検索分野におけるトップの学術会議です。

たった今、カンファレンスで最優秀論文賞、最優秀論文準賞、最優秀論文佳作賞、タイムテスト賞が発表されました。

その中で、清華大学、中国人民大学ヒルハウス人工知能学院、小紅書チームが最優秀論文を受賞し、グラスゴー大学とピサ大学の研究者が名誉ある準優勝を獲得しました。最優秀論文に対するメンション賞は山東大学（青島）、ライデン大学、アムステルダム大学の研究者に授与され、タイム・テスト賞は清華大学とカリフォルニア大学サンタクルーズ校の研究者に授与された。

次に、受賞論文の具体的な内容を見てみましょう。

最優秀論文

論文: 密な検索のためのスケーリング則
論文著者: Fang Yan、Jingtao Zhan、Ai Qingyao、Mao Ji axin、Weihang Su、Jia Chen、 Liu Yiqun
機関: 清華大学、ヒルハウス人工知能学院、中国人民大学、Xiaohongshu
紙のリンク: https://dl.acm.org/doi/abs/10.1145/3626772.3657743

論文について: 研究者たちは、幅広いタスク、特に言語生成にわたってスケーリング則を観察してきました。調査によると、大規模な言語モデルのパフォーマンスは、モデルとデータセットのサイズ全体にわたって予測可能なパターンに従います。これは、特に大規模なトレーニングがますますリソースを消費するようになる中で、トレーニング戦略を効果的かつ効率的に設計するのに役立ちます。しかし、密な検索では、拡張則は十分に検討されていません。

この研究では、スケーリングが密な検索モデルのパフォーマンスにどのような影響を与えるかを調査します。具体的には、研究チームは、さまざまな数のパラメータを使用して高密度検索モデルを実装し、さまざまな量の注釈付きデータを使用してモデルをトレーニングしました。この研究では、評価指標として対照エントロピーを使用します。離散的なランキング指標と比較して、対照エントロピーは連続的であるため、モデルのパフォーマンスを正確に反映できます。

実験結果は、密な検索モデルのパフォーマンスが、モデルのサイズとアノテーションの数に関連する正確なべき乗則スケーリングに従うことを示しています。

さらに、この研究では、拡張則が予算制約下でのリソース割り当ての問題を解決するなど、トレーニングプロセスの最適化に役立つことも示しています。

この研究は、高密度検索モデルのスケーリング効果の理解に大きく貢献し、将来の研究に有意義な指針を提供します。

最優秀論文の次点

今年のACM SIGIRの最優秀論文の次点は、論文「A Reproducibility Study of PLAID」に授与されました。この論文の著者には、グラスゴー大学のショーン・マカバニー氏とピサ大学のニコラ・トネロット氏が含まれています。

清华包揽最佳论文+时间检验奖，山大获荣誉提名，SIGIR 2024奖项出炉

論文アドレス: https://arxiv.org/pdf/2404.14989

論文要約: ColBERTv2 の PLAID アルゴリズムは、クラスター化された用語表現を使用して文書を取得し、段階的にプルーニングして、最終的な文書スコアを取得します。この記事は、原文の欠落部分を再現し、埋めています。研究者らは、PLAID によって導入されたパラメーターを研究することにより、そのパレートフロンティアが 3 つのパラメーター間のバランスによって形成されていることを発見しました。推奨設定から逸脱すると、必ずしも有効性が向上するわけではなく、遅延が大幅に増加する可能性があります。

この発見に基づいて、この論文では PLAID を、論文に欠けている重要なベースラインである語彙システムの並べ替えと比較します。 ColBERTv2 を初期 BM25 結果プールに加えてリオーダラーとして適用すると、低遅延設定で効率と効果のトレードオフが向上することがわかりました。この研究は、検索エンジンの効率を評価する際に、関連するベースラインを慎重に選択することの重要性を強調しています。

最優秀論文の佳作賞

この会議の最優秀論文の佳作賞は、山東大学（青島）、ライデン大学、アムステルダム大学の研究者によって受賞されました。受賞論文は「Generative Retrieval as Multi-Vector Dense Retrieval」です。

論文の著者: Wu Shiguang、Wei Wenda、Zhang Mengqi、Chen Zhumin、Ma Jun、Ren Zhaochun、Maarten de Rijke、Ren Pengjie
論文のアドレス: https://arxiv.org /pdf/2404.00684

要約: この論文は、生成検索とマルチベクトル密検索が同じフレームワークを共有することを実証することにより、ドキュメントクエリの関連性を測定します。具体的には、彼らは生成検索のアテンション層と予測ヘッドを研究し、生成検索がマルチベクトル密検索の特殊なケースとして理解できることを明らかにしました。どちらの方法も、クエリベクトルとドキュメントベクトルとアライメント行列の積の合計を計算することによって相関を計算します。

その後、研究者らはこのフレームワークを生成検索に適用する方法を検討し、ドキュメントトークンベクトルとアライメント行列を計算するためにさまざまな戦略を採用しました。結論を検証するために実験が行われ、両方のパラダイムがアライメント行列の用語一致において共通点を示すことが示されました。

実績ある賞

今年の ACM SIGIR 実績ある賞は、10 年前の SIGIR 2014 で発表された説明可能な推奨に関する研究に授与されました。その論文は「説明可能な推奨のための明示的因子モデル」です「フレーズレベルの感情分析に基づく」。

論文の著者: Zhang Yongfeng、Lai Guoquan、Zhang Min、Yi Zhang、Liu Yiqun、Ma Shaoping
機関: 清華大学、カリフォルニア大学サンタクルーズ校
論文リンク: https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf

この研究は、「解釈可能な推奨」の問題を初めて定義し、対応する感情を提案しますこの技術的課題を解決するために、関連分野で主導的な役割を果たしています。

論文要約: 潜在因子モデル (LFM) などの協調フィルタリング (CF) に基づく推奨アルゴリズムは、予測精度の点で優れたパフォーマンスを発揮します。しかし、その根本的な特性により、レコメンド結果をユーザーに説明することが困難になります。

幸いなことに、オンラインユーザーレビューが増加し続けるにつれて、レコメンダーシステムのトレーニングに利用できる情報は、数値による星による評価やユーザー/アイテムの特性に限定されなくなりました。レビューから製品のさまざまな側面に関するユーザーの明確な意見を抽出することで、ユーザーが何を気にしているのかをより詳細に理解することができ、説明可能な推奨事項を作成できる可能性がさらに明らかになります。

この記事では、高い予測精度を維持しながら解釈可能な推奨事項を生成するための EFM (Explicit Factor Model) を提案します。

研究者は、まずユーザーレビューに対してフレーズレベルのセンチメント分析を行うことで明示的な製品の特徴とユーザーの意見を抽出し、次にユーザーの興味のある特定の製品の特徴と学習した潜在的な特徴に基づいて推奨事項と非推奨事項を生成します。さらに、アイテムが推奨される理由、または推奨されない理由についての直感的な機能レベルの説明がモデルから生成されます。

複数の実世界のデータセットでのオフライン実験結果は、この研究で提案されたフレームワークが、評価予測タスクと上位 K 推奨タスクの両方で競合するベースラインアルゴリズムよりも優れていることを示しています。オンライン実験では、詳細な説明により、推奨または非推奨がユーザーの購買行動に大きな影響を与えることが示されています。

Young Scholar Award

ACM SIGIR Young Scholar Award は、情報検索研究、学者コミュニティの構築、学術的公平性の促進において重要な役割を果たした研究者を表彰することを目的としています。博士号を授与される 7 20年以内に若手研究者。清華大学コンピューターサイエンス学部助教授のAi Qingyao氏と、中国科学技術大学サイバースペースセキュリティ学部およびビッグデータ学部の教授兼博士指導教員であるWang Xiang氏が、SIGIR 2024 Youngを受賞しました。学者賞。

Ai Qingyao

Ai Qingyao は、清華大学コンピューターサイエンス学部の助教授であり、主な研究分野は情報検索、機械学習、自然言語処理の研究に焦点を当てています。主な研究方向は、情報表現学習、ランキング最適化理論、インターネット検索と推奨、スマートジャスティスにおける大規模言語モデルの応用など、インテリジェントな情報検索システムの研究と設計です。

Wang Xiang

Wang Xiang は、中国科学技術大学サイバースペースセキュリティおよびビッグデータスクールの教授および博士指導者です。ワン・シャン教授の研究対象には、情報検索、データマイニング、信頼性と説明可能な人工知能、特に推奨システム、グラフ学習、ソーシャルメディア分析が含まれます。

以上が清華大学がBest Paper + Time Test Awardを受賞、山東大学が佳作を受賞、SIGIR 2024賞が発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。