4月20日,出門問問在北京舉辦主題為「AGI·降臨」的2023 AIGC戰略發布會。會上出門問問宣布內測探索大模型“序列猴子”,並提出CoPilot將會無所不在,同時在大模型能力的基礎上還同步開啟了面向創作者的CoPilot產品矩陣,面向C端的升級版語音助理魔法小問,以及面向B端的企業專屬大模型的內測探索。其中創作者的CoPilot產品矩陣包含了四款AIGC產品,分別為AI寫作平台「奇妙文」、AI繪畫平台「言之畫」、AI配音平台「魔音工坊」、數位人視訊與直播平台「奇妙元」。
自研大模型“序列猴子”,助力AGI“降臨”
出門問問大模型“序列猴子”是一款具備多模態生成能力的大語言模型,模型以語言為核心的能力體系涵蓋「知識、對話、數學、邏輯、推理、規劃」六個維度,能夠同時支援文字生成、圖片生成、3D內容生成、語音生成和語音辨識等不同任務。
目前,「序列猴子」大模型已經具備了一定的自然語言理解、知識、邏輯以及推理等能力,對於「湖南和湖北哪一個省會的人口更多?」這類比較複雜的問題能夠快速給出準確結果。
據介紹,出門問問自研大模型中文名「序列猴子」的靈感,來自數學家埃米爾·波雷爾在20世紀初提出的「無限猴子」定理。根據該定理,如果一群猴子隨機地敲打一台打字機,最終一定會產生完整的莎士比亞作品。這個定理是基於機率論和組合數學,闡釋了機率的統一性。出門問問自研大模型的建構原理與「無限猴子」類似,海量文本序列透過出門問問自主演算法的不斷訓練,經由大規模算力消化理解,便練成了「序列猴子」。
出門問創始人兼CEO李志飛表示,大模型不只是參數量大,當今的大模型是互聯網文本的深度建模,而互聯網文本是世界知識的映射,因此大模型是一個認知模型,是語言的建模。而語言是思維的邊界,所以大模型擁有無限想像空間。 「序列猴子」在訓練過程中已經展現了「湧現」能力,目前正處於「頓悟」階段,未來提升的速度會越來越快。他還認為,做人類的CoPilot會是大模型最好的“工作”,未來CoPilot將無處不在。
一站式CoPilot產品矩陣,打通內容創作全流程
基於「序列猴子」大模型,出門問問內測探索了多款創作者的AIGC產品及應用,為千萬創作者打造一站式CoPilot產品矩陣,打通內容創作全流程。目前出門問問已實現技術、產品、商業化的「三位一體」,註冊用戶超500萬,全球付費用戶超百萬。
奇妙-你的AI寫作助理(write.mobvoi.com)
作為發布會上首個亮相的CoPilot產品,「奇妙文」的AI寫作能力涵蓋了職場辦公、行銷、新媒體和創意寫作四大內容創作場景,能夠在用戶撰寫年終總結、客服話術、劇本、廣告文案等內容時,為其源源不斷地提供靈感和創意方向。
為更好幫助用戶提升內容創作效率,「奇妙文」開放了八大AI編輯功能,分別為風格轉化、要點提取、校對糾錯、續寫、改寫、擴充、縮寫、翻譯。 「奇妙文」還能在寫作中自動產生圖片,為使用者帶來圖文並茂的寫作體驗。
言之畫-你的AI繪畫助理(paint.mobvoi.com)
面對設計師、插畫家等在文字外對設計有強烈需求的創作者,出門問問內測探索了「言之畫」AI繪畫平台。 「言之畫」支持二次元、蒸氣龐克、插畫等8種創作風格。使用者只要輸入文字,「言之畫」就能一次生成8張光影逼真、細節豐富的2K高解析度影像。
除了以文生圖,它還擁有以圖生圖、動圖生成、個性頭像生成等AI繪圖能力,極大豐富了用戶的創作手段。對於企業用戶,「言之畫」還支援專屬模型定制,讓企業用戶能夠根據自身需求自訂模型風格,並且支援多人協作生產,更好地滿足企業的繪圖需求。
目前,「言之畫」已經與家裝設計平台酷家樂達成了探索意向,在酷家樂平台上,用戶們借助「言之畫」只需用文字描述出自己的需求即可輕鬆更換裝潢風格、調整家具位置等,進而設計出自己喜歡的裝潢方案。
魔音工坊-你的AI配音助理(moyin.com)
#面對AI配音場景,出門問問推出了新一代AI配音產品「魔音工坊」。 「魔音工坊」(海外版DupDub)是一款全球領先的全流程一站式AI配音平台,已向用戶開放了超1000種音色、超2000種聲音風格以及超20種方言和外語。
在大模型技術的加持下,「魔音工坊」是全球首款搭載了大模型AI寫作功能的配音平台,涵蓋了AI寫作、AI配音和剪輯等多個場景。用戶可以在它的輔助下輕鬆完成影視解說、有聲書、線上教育、新聞播報等集文案與配音於一體的內容創作。目前,「魔音工坊」已經與微信讀書、少年得到、大眾等多個行業的頭部企業達成了合作。
為了提供使用者更好的配音體驗,「魔音工坊」支持對選定聲音進行包括平靜、悲傷、開心在內的7種情緒的調節,對包括女中年、男孩等在內的10種角色進行遷移,同時也開放了韻律調節、局部變速、多人配音等AI聲音個人化編輯功能,讓使用者能夠像用word編輯文件一樣編輯聲音。
除了選擇聲音、編輯聲音,基於大模型的語言生成能力,「魔音工作坊」也將推出「捏聲音」功能,使用者可以自由選擇性別、年齡、語言、風格和情緒等聲音特徵,從0到1創作自己喜歡的聲音。
奇妙元-你的AI數位分身(weta365.com)
在文字、圖像、聲音等生成能力基礎上,為了讓影片內容創作者更快更好地創作形式新穎、生動有趣的作品,出門問問內測探索了AI數位形象創作及直播平台「奇妙元」。
據介紹,「奇妙元」平台現有超100款數位人、超1000款3D數位資產、超1000種聲音。憑藉多模態生成技術,「奇妙元」平台目前共支援圖片建模(2D數位人)、視訊建模(2.5D數位人)、3D建模(3D數位人)三種不同形式的數位人生成。其形象複製功能,只要一段5分鐘的真人影片素材,就可以1:1復刻使用者的形像神態,為使用者打造聲音一致、動作自然的數位人分身。
從個人到企業,CoPilot將無所不在
出門問問在語音助理領域有著深厚的積累,對AI語音的研究可以追溯至十年前,2014年出門問問發布了首款語音助理“小問助理”,2015年迭代了“小問秘書”,2017年推出了全場景VPA,並在2019年對VPA進行了升級。經過十年的累積與發展,這次發表會上出門問問內測探索的CoPilot-魔法小問,可以理解為Siri與ChatGPT的綜合體。
“你好問問,最近的火鍋店在哪裡”、“”你好問問,告訴下明天北京的天氣吧”,人們都習慣於在衣食住行前先查詢了解相關信息。作為針對個人用戶開發一款智慧語音助手,「魔法小問」可以幫助用戶查百科資訊、查天氣、查餐廳、查酒店,還能與用戶自由對話,讓用戶更方便、快速地獲取資訊。
根據出門問問介紹,「CoPilot」源自超級助理的概念,它將擁有基於大模型的高智商大腦,能夠分析海量數據即時準確地與人類交流;還會擁有動聽的聲音、靚麗的形象,可以搭載任意硬體平台,如手機、手錶、車機等;還能夠適配千行百業,化身高品質教學的老師、知識淵博的律師、專業的醫生、金融理財客服等,在需要的時候,隨時隨地展現專業知識,為人分擔壓力。
「序列猴子」開放生態,賦能更多產業
基於「序列猴子」大模型的底層能力,對於B端用戶和垂直領域,「出門問問Copilot」不僅提供通用能力支援服務和數位人形象客製化服務,還將開放自身角色能力,持續迭代資料介面。有需求的企業用戶可以登陸web端呼叫API服務,並且能透過上傳文件的方式,對產業專有內容進行訓練,從而實現客製化語音互動。序列猴子的網址為openapi.mobvoi.com。
目前,出門問已經與首批十大產業的內測探索夥伴達成了合作,包括汽車、教育、律師事務所、金融、醫療、旅遊等,未來出門問問「CoPilot」將逐步賦能更多產業,協助更多企業擁有自己的專屬大模型,打造自己的專屬「CoPilot」。
以上是出門問問內測探索大模式'序列猴子”,為個人與企業打造專屬CoPilot的詳細內容。更多資訊請關注PHP中文網其他相關文章!