5月30日,國際人工智慧頂會CVPR2024舉辦的第3屆野外像素級影片理解挑戰賽(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文簡稱PVUW)公佈賽事結果,美圖影像研究院(MTLab)再獲殊榮,斬獲視訊語義分割(VSS)、複雜場景視訊目標分割(MOSE)雙賽道亞軍,視訊全景分割挑戰賽(VPS)賽道季軍,這也是美圖影像研究院(MTLab)第3次在CVPR大會上摘得獎項,共獲得了1金3銀3銅的傑出成績。
作為全球範圍內計算機視覺領域的頂尖盛會,CVPR憑藉其深遠影響力吸引了眾多頂尖學府、科研機構的踴躍參與,成為全球AI領域前沿科研成果展示的舞台,備受學術界和產業界的矚目。 同時, 頂級PVUW 賽事專注於視頻理解領域,由牛津大學、復旦大學、浙江大學、北京航天航空大學、北京交通大學、Amazon、Meta 等 業內及產業界的 者共同發起,憑藉其前沿性和挑戰性,本屆競賽吸引了包括中國科學院大學、中國科學院自動化研究所、哈爾濱工業大學、美圖公司、三星、中興通訊等海內外知名 高校、科研院所及領先 企業參加。本屆PVUW 競賽共包含4 個賽道,除視訊語義分割挑戰賽(VSSChallenge)、視訊全景分割挑戰賽(VPSChallenge)外,新增複雜場景視訊目標分割挑戰賽(MOSEChallenge)和基於動作描述的指向性視訊分割挑戰賽(MeViSChallenge)2 個超高難度賽道,其中,複雜場景視訊目標分割挑戰賽(MOSEChallenge)收集了目前最大規模的複雜場景視訊目標分割資料集ComplexVideoObjectSegmentation (MOSE) ,包括目標的消失和重現、不顯眼的小物體、嚴重的遮蔽以及擁擠的環境等。旨在於協助應對影片理解領域目前面臨的如背景複雜性、目標遮蔽和消失重現、描述動作的文字理解等挑戰,提升對複雜場景及現實場景的理解能力。美圖影像研究院(MTLab)此次參賽取得的驕人成績背後,是在視頻領域長期佈局與持續探索的成果佐證,同時也已將這一尖端技術應用於美圖公司旗下美圖秀秀、美顏相機、Wink、美圖設計室等產品中,為使用者帶來「影片人像精修」、「AI商品影片」、「智慧摳圖」等實用功能與創意玩法,透過創新研發成果為廣大用戶提供優質影像與設計服務。隨著新興視訊形態的蓬勃發展,視訊產業進一步向多元化發展,美圖影像研究院(MTLab)也持續加大在視訊領域的研發投入,目前專業視訊人像精修工具Wink榮膺視訊編輯工具賽道第二名,開拍成為口播創作工具賽道
領導者 。作為美圖的核心研發中樞,美圖影像研究院(MTLab)未來也將繼續專注於AI領域前沿技術研發,推動AI技術的落地應用,透過技術創新與升級為用戶和客戶打造更優的AI工作流。以上是美圖影像研究院(MT Lab)獲頒3項國際人工智慧頂會大獎的詳細內容。更多資訊請關注PHP中文網其他相關文章!