美圖影像研究院（MT Lab）獲頒3項國際人工智慧頂會大獎-人工智慧-PHP中文網

5月30日，國際人工智慧頂會CVPR2024舉辦的第3屆野外像素級影片理解挑戰賽（The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文簡稱PVUW）公佈賽事結果，美圖影像研究院（MTLab）再獲殊榮，斬獲視訊語義分割（VSS）、複雜場景視訊目標分割（MOSE）雙賽道亞軍，視訊全景分割挑戰賽（VPS）賽道季軍，這也是美圖影像研究院（MTLab）第3次在CVPR大會上摘得獎項，共獲得了1金3銀3銅的傑出成績。

美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

作為全球範圍內計算機視覺領域的頂尖盛會，CVPR憑藉其深遠影響力吸引了眾多頂尖學府、科研機構的踴躍參與，成為全球AI領域前沿科研成果展示的舞台，備受學術界和產業界的矚目。

美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖

同時，頂級PVUW 賽事專注於視頻理解領域，由牛津大學、復旦大學、浙江大學、北京航天航空大學、北京交通大學、Amazon、Meta 等業內及產業界的者共同發起，憑藉其前沿性和挑戰性，本屆競賽吸引了包括中國科學院大學、中國科學院自動化研究所、哈爾濱工業大學、美圖公司、三星、中興通訊等海內外知名 高校、科研院所及領先 企業參加。本屆PVUW 競賽共包含4 個賽道，除視訊語義分割挑戰賽（VSSChallenge）、視訊全景分割挑戰賽（VPSChallenge）外，新增複雜場景視訊目標分割挑戰賽（MOSEChallenge）和基於動作描述的指向性視訊分割挑戰賽（MeViSChallenge）2 個超高難度賽道，其中，複雜場景視訊目標分割挑戰賽（MOSEChallenge）收集了目前最大規模的複雜場景視訊目標分割資料集ComplexVideoObjectSegmentation (MOSE) ，包括目標的消失和重現、不顯眼的小物體、嚴重的遮蔽以及擁擠的環境等。旨在於協助應對影片理解領域目前面臨的如背景複雜性、目標遮蔽和消失重現、描述動作的文字理解等挑戰，提升對複雜場景及現實場景的理解能力。

美图影像研究院（MT Lab）斩获3项国际人工智能顶会大奖美圖影像研究院（MTLab）此次參賽取得的驕人成績背後，是在視頻領域長期佈局與持續探索的成果佐證，同時也已將這一尖端技術應用於美圖公司旗下美圖秀秀、美顏相機、Wink、美圖設計室等產品中，為使用者帶來「影片人像精修」、「AI商品影片」、「智慧摳圖」等實用功能與創意玩法，透過創新研發成果為廣大用戶提供優質影像與設計服務。隨著新興視訊形態的蓬勃發展，視訊產業進一步向多元化發展，美圖影像研究院（MTLab）也持續加大在視訊領域的研發投入，目前專業視訊人像精修工具Wink榮膺視訊編輯工具賽道第二名，開拍成為口播創作工具賽道