又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒-人工智慧-PHP中文網

目前最強國產Sora！清華團隊突破16秒長視頻，懂多鏡頭語言，會模擬物理規律》" >《目前最強國產Sora！清華團隊突破16秒長視頻，懂多鏡頭語言，會模擬物理規律》

專訪生數科技唐家渝：清華系團隊拿到近億融資，用Transformer來做多模態大模型》" >《專訪生數科技唐家渝：清華系團隊拿到近億融資，用Transformer來做多模態大模型》

首頁

科技週邊

人工智慧

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 05, 2024 pm 03:46 PM

產業 vidu 生數科技

AI 視訊圈正「互扯頭花」。

國外的 Luma、Runway，國內的快手可靈、字節即夢、智譜清影…… 你方唱罷我登場。無一例外，它們對標的都是那個傳說中的 Sora。

其實，說起 Sora 全球挑戰者，生數科技的 Vidu 少不了。

早在三個月前，國內外視頻生成領域還一片“沉寂”之時，生數科技突然曝出自家最新視頻大模型Vidu 的宣傳視頻，憑藉其生動逼真、不輸Sora 的效果，驚艷了一眾網友。

就在今天，Vidu 正式上線。無須申請，只要有個信箱，就能上手體驗。（Vidu官網連結：www.vidu.studio）

例如，皮卡丘和哆啦A 夢玩「貼臉殺」：

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

《暮光之城》男女主秀恩愛：

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

它甚至解決了AI 不會寫字的問題：

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

此外，Vidu 的生成效率也賊拉猛，實現了業界最快的推理速度，僅需30 秒就能生成一段4 秒鏡頭。

接下來，我們就奉上最新的一手評測，看看這款「國產 Sora」的實力究竟如何。

上手實測：鏡頭語言大膽，畫面不會崩壞！

這次，Vidu 亮出了絕活。

不僅延續了今年4 月份展示的高動態性、高逼真度、高一致性等優勢，還新增了動漫風格、文字與特效畫面生成、角色一致性等特色能力。

主打一個：別人有的功能，我要有，別人沒有的功能，我也要有。

喔莫，它竟然認字識數

現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 有現階段，Vidu 是現階段，Vidu兩大核心功能：文生影片和圖生影片。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

提供 4s 和 8s 兩種長度選擇，解析度最高可達 1080P。風格上，提供寫實和動畫兩大選擇。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

先看看圖生影片。

讓歷史重新鮮活起來，是當下最流行的玩法。這是法國畫家伊莉莎白・路易絲・維瑞的名作《畫家與女兒像》。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

我們輸入提示字：畫家與女兒像，母女緊緊抱在一起。

產生的高清版本讓人眼前一亮，人物動作幅度很大，連眼神都有變化，但效果挺自然。

再試試看達文西的《抱銀鼬的女子》。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

提示詞：抱銀鼬的女子麵露微笑。

長達8 秒的影片裡，女子和寵物動作幅度較大，特別是女子的手部撫摸動作，還有身體、臉部變化，但都沒有影響畫面的自然、流暢。

大幅度、精準的動作有助於更好地表現影片情節和人物情緒。不過，動作幅度一旦變大，畫面容易崩壞。因此，有些模型為保證流暢性，會犧牲動幅，而 Vidu 比較好地解決了這個問題。

模擬真實物理世界的運動，還真不錯。例如，復刻類似庫伯力克《2001 太空漫遊》的情景！

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

除了圖生視頻，還有文生視頻。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

^{提示詞中對兩朵花中的花中綻放的放角慢花。}

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

^{提示語：這次只她一人，獨自坐在櫻花深處的鞦韆架上，穿著粉紅的春衫，輕微蕩著鞦韆，幅度很小，像坐搖椅一般，微垂著頭，有點百無聊賴的樣子，緩緩伸足一點一點踢著地上的青草。那櫻花片片飄落在她身上頭上，她也不以手去拂，漸漸積得多了，和她衣裙的顏色相融，遠遠望去彷彿她整個人都是由櫻花砌成似的。}

Vidu 語意理解能力不錯，還可以理解提示中一次包含多個鏡頭的片段要求。

比如，畫面中既有海邊小屋的特寫，還有運鏡轉向海面遠眺的遠景，透過鏡頭切換，賦予畫面一種鮮明的敘事感。

^{提示語：在一個古色古香的海邊小屋裡，陽光沐浴著房間，鏡頭緩慢過渡到一個陽台，俯瞰著寧靜的大海，最後鏡頭定格在漂浮著大海、帆船和倒影般的雲彩。}

對於第一人稱、延時攝影等鏡頭語言，Vidu 也能準確理解和表達，使用者只需細化提示詞，即可大幅提升影片的可控性。

^{提示下與第一人稱視角，一起漫步在我的女友手中，一起帶著女友，手旁的手扶著女友。}

Vidu 是一款能夠準確理解並產生一些詞彙的視訊產生器，例如數字。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

^{提示時：一個為一個生日蠟燭，為「上面插著33個蠟燭，233個蠟燭」。}

蛋糕上換成「Happy Birthday」的字樣，它也能hold住。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

^{提示下符號：}

動畫風格嘎嘎好用

我們選擇動畫模型，直接輸入提示詞即可輸出動畫風格影片。

例如，提示詞：動畫風格，小女孩站在廚房裡切菜。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒說實話，這畫風有宮崎駿老爺的味道。 Vidu 讀懂了提示詞，小女孩切菜動作一氣呵成，就是手指和刀具在不經意間仍有變形。

提示詞：動畫風格，一個戴著耳機的小女孩在跳舞。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒 Vidu 的想像力還挺豐富，自個兒把背景設定為有噴泉的公園，這也讓影片畫面不那麼單調。

當然，我們還可以上傳一張動漫參考圖片，再輸入提示詞，如此一來，圖片中的動漫人物就能動起來啦。

例如，我們上傳一張蠟筆小新的靜態圖，然後輸入提示詞：蠟筆小新大笑著舉起手裡的小花。圖片用途選擇「用作起始影格」。

我們來瞅瞅效果：

再上傳一張呆萌皮卡丘的圖像，輸入提示詞為「皮卡丘開心地蹦起來」。圖片用途選擇「用作起始影格」。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

繼續上效果：

上傳《海賊王》路飛的圖像，再餵它提示詞：男孩突然哭起來。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

效果如下：

不得不說， Vidu 的動畫效果相當驚艷，在保持風格一致性的同時，顯著提高了畫面的穩定性和流暢性，沒有出現變形、崩壞或六指狂魔、左右腿不分等「邪門」畫面。

梗圖、表情包燥起來

在「圖生視頻」板塊中，除了支援首幀圖上傳，Vidu 這次還上新一項功能－角色一致性（Charactor To Video）。

所謂角色一致性，就是上傳一個角色圖像，然後可以指定該角色在任意場景中做出任意動作。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

我們就拿吳京為例。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

^{提示詞：在一艘宇宙飛船裡，吳京正穿著太空服，對鏡頭揮手。}

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

如果說，首幀圖上傳適合創作場景一致性的視頻，那麼，有了角色一致性功能，從科幻角色到現代劇，演員七十二變，信手拈來。

此外，有了角色一致性功能，一般使用者創作「梗圖」、「表情包」可以燥起來了！

例如讓北美「意難忘」賈斯汀・比伯和賽琳娜再續前緣：

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

《武林外傳》中佟湘玉和白展堂嗑著瓜子，聊著同福客棧的八卦：

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

還有《甄嬛傳》皇后

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

只要腦洞夠大，什麼地鐵老人吃手機、鰲拜和韋小寶打啵、容嬤餵紫薇吃雞腿，Vidu 都能整出來。

就一個字，快！

影片產生過程中，使用者最煩啥？當然是龜速爬行的進度條。

試想，為了一段幾秒的視頻，愣是趴在電腦前等個十分鐘，再慢性子的人也很難不破防。

目前，市面上主流 AI 視訊工具會產生一段約 4 秒的影片片段，通常需要 1 到 5 分鐘，甚至更長。

例如，Runway 最新推出的Gen-3 工具需要1 分鐘來完成5s 視訊生成，可靈需要2-3 分鐘，而Vidu 將這一等待時間縮短至30 秒，速度比業界最快水準的Gen-3 還要再快一倍。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

基於完全自研的U-ViT 架構，商用精心佈局

「 Vidu」底層則是基於完全自研的U-ViT 架構，由團隊在2022 年9 月提出，早於Sora 採用的DiT 架構，是全球首個Diffusion 和Transformer 融合的架構。

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

在DiT 論文發布兩個月前，清華大學的朱軍團隊提交了一篇論文—《All are Worth Words: A ViT Backbone for Diffusion Models》。這篇論文提出了以 Transformer 取代基於 CNN 的 U-Net 的網路架構 U-ViT。這是「Vidu」最重要的技術基礎。

由於不涉及中間的插幀和拼接等多步驟的處理，文本到視頻的轉換是直接且連續的，“Vidu” 的作品感官上更加一鏡到底，視頻從頭到尾連續生成，沒有插幀痕跡。除了底層架構上的創新，「Vidu」也復用了生數科技過往累積下的工程化經驗與能力。

生數科技曾稱，從圖任務的統一到融合視頻能力，“Vidu”可被視為一款通用視覺模型，能夠支持生成更加多樣化、較長時長的影片內容。他們也透露，「Vidu」還在加速迭代提升。面向未來，「Vidu」靈活的模型架構也將能夠相容於更廣泛的多模態能力。

生數科技成立於2023 年3 月，核心成員來自清華大學人工智慧研究院，致力於自主研發世界領先的可控多模態通用大模型。自 2023 年成立以來，團隊已獲得螞蟻集團、啟明創投、BV 百度創投、位元組錦秋基金等多家知名產業機構的認可，完成數億元融資。據悉，生數科技是目前國內在多模態大模型賽道估值最高的創業團隊。

公司首席科學家由清華人工智慧研究院副院長朱軍擔任；CEO 唐家渝本碩就讀於清華大學計算機系，是THUNLP 組成員；CTO 鮑凡是清華大學計算機系博士生、朱軍教授的課題組成員，長期關注擴散模型領域研究，U-ViT 和UniDiffuser 兩項工作均是由他主導完成的。

今年 1 月，生數科技旗下視覺創意設計平台 PixWeaver 上線了短視頻生成功能，支援 4 秒高美學性的短視頻內容。 2 月Sora 推出後，生數科技內部成立攻堅小組，加快了原本視頻方向的研發進度，不到一個月的時間，內部就實現了8 秒的視頻生成，緊接著4 月份就突破了16 秒生成，生成品質與時長全方面取得突破。

如果說4 月份的模型發布展示了Vidu 在視頻生成能力上的領先，這次正式發布的產品則展示了Vidu 在商業化方面的精心佈局。生數科技目前採取模型層和應用層兩條路走路的模式。

一方面，建構覆蓋文字、影像、影片、3D 模型等多模態能力的底層通用大模型，面向 B 端提供模型服務能力。

另一方面，以影像產生、影片產生等場景打造垂類應用，依照訂閱等形式收費，應用方向主要是遊戲製作、影視後製等內容創作場景。

《目前最強國產Sora！清華團隊突破16秒長視頻，懂多鏡頭語言，會模擬物理規律》

《專訪生數科技唐家渝：清華系團隊拿到近億融資，用Transformer來做多模態大模型》

《國內公司有望做出Sora嗎？這支清華系大模型團隊給了希望》

^{參考連結：}

^{Vidu官連結：www.vidu.studio}

以上是又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

8648

Java教學

1792

CakePHP 教程

1733

Laravel 教程

1583

PHP教程

1454

Related knowledge

DeepMind機器人打乒乓球，正手、反手溜到飛起，全勝人類初學者 Aug 09, 2024 pm 04:01 PM

但可能打不過公園裡的老大爺？巴黎奧運正在如火如荼地進行中，乒乓球項目備受關注。同時，機器人打乒乓球也取得了新突破。剛剛，DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址：https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢？大概和人類業餘選手不相上下：正手反手都會：對手採用多種打法，機器人也能招架得住：接不同旋轉的發球：不過，比賽激烈程度似乎不如公園老大爺對戰。對機器人來說，乒乓球運動

首配機械爪！元蘿蔔亮相2024世界機器人大會，發布首個走進家庭的西洋棋機器人 Aug 21, 2024 pm 07:33 PM

8月21日，2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相，並最新發布元蘿蔔AI下棋機器人－國際象棋專業版（以下簡稱「元蘿蔔國象機器人」），成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品，全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新，首次在家用機器人上實現了透過機械爪拾取立體棋子，並進行人機對弈、人人對弈、記譜複盤等功能，

Claude也變懶了！網友：學會給自己放假了 Sep 02, 2024 pm 01:56 PM

開學將至，該收心的不只即將開啟新學期的同學，可能還有AI大模型。前段時間，Reddit擠滿了吐槽Claude越來越懶的網友。「它的水平下降了很多，經常停頓，甚至輸出也變得很短。在發布的第一周，它可以一次性翻譯整整4頁文稿，現在連半頁都輸出不了！」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”，滿滿地

李飛飛團隊提出ReKep，讓機器人具備空間智能，還能整合GPT-4o Sep 03, 2024 pm 05:18 PM

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時，加上最近老上頭條的1X人形機器人NEO，你可能會產生一種感覺：我們似乎開始進入機器人時代了。事實上，這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道，有用的機器人往往需要與環境進行複雜精妙的交互，而環境則可被表示成空間域和時間域上的限制。舉個例子，如果要讓機器人倒茶，那麼機器人首先需要抓住茶壺手柄並使之保持直立，不潑灑出茶水，然後平穩移動，一直到讓壺口與杯口對齊，之後以一定角度傾斜茶壺。這

鴻蒙智行享界S9全場景新品發表會，多款重磅新品齊發 Aug 08, 2024 am 07:02 AM

今天下午，鸿蒙智行正式迎来了新品牌与新车。8月6日，华为举行鸿蒙智行享界S9及华为全场景新品发布会，带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品，从智慧出行、智慧办公到智能穿戴，华为全场景智慧生态持续构建，为消费者带来万物互联的智慧体验。鸿蒙智行：深度赋能，推动智能汽车产业升级华为联合中国汽车产业伙伴，为

分散式人工智慧盛會DAI 2024徵稿：Agent Day，強化學習之父Richard Sutton將出席！顏水成、Sergey Levine以及DeepMind科學家將做主旨報告 Aug 22, 2024 pm 08:02 PM

會議簡介隨著科技的快速發展，人工智慧成為了推動社會進步的重要力量。在這個時代，我們有幸見證並參與分散式人工智慧（DistributedArtificialIntelligence，DAI）的創新與應用。分散式人工智慧是人工智慧領域的重要分支，這幾年引起了越來越多的關注。基於大型語言模型（LLM）的智能體（Agent）異軍突起，透過結合大模型的強大語言理解和生成能力，展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型，成為目前AI圈的熱門話題。 Au

ACL 2024獎項發表：華科大破解甲骨文最佳論文之一、GloVe時間檢驗獎 Aug 15, 2024 pm 04:37 PM

本屆ACL大會，投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議，由國際計算語言學協會組織，每年舉辦一次。一直以來，ACL在NLP領域的學術影響力都名列第一，它也是CCF-A類推薦會議。今年的ACL大會已是第62屆，接收了400餘篇NLP領域的前沿工作。昨天下午，大會公佈了最佳論文等獎項。此次，最佳論文獎7篇（兩篇未公開）、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎（ResourceAward）3篇、社會影響力獎（

世界機器人大會上，這家承載「未來養老希望」的國產機器人被包圍了 Aug 22, 2024 pm 10:35 PM

在北京舉行的世界機器人大會上，人形機器人的展示成為了現場絕對的焦點，在星塵智能的展台上，由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲，能文能武，吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏，讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道，公司創始人來傑解釋到，絲滑動作的背後，是硬體側追求最好力控和最仿人身體指標（速度、負載等），而是在AI側則採集人的真實動作數據，讓機器人遇強則強，快速學習進化。而敏捷

See all articles

又一「國產版Sora」全球上線！清華朱軍創業團隊，影片生成僅需30秒

《目前最強國產Sora！清華團隊突破16秒長視頻，懂多鏡頭語言，會模擬物理規律》

《專訪生數科技唐家渝：清華系團隊拿到近億融資，用Transformer來做多模態大模型》

《國內公司有望做出Sora嗎？這支清華系大模型團隊給了希望》

熱AI工具

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題