「嗨,歡迎寶寶來到直播間,點擊關注不迷路,每晚都有直播福利哦~」
「618福利來了,直播間的粉絲寶寶們,12點整的時刻我們就最先抽免單了啊~」
當你走進直播間,看到「虛擬主播」跟你打招呼時,千萬不要驚訝。今年618平台正在重點推出的直播帶貨賽道“新亮點”,是各大平台越來越多的虛擬人員在直播間裡擔任主播的結果。
事實上,如果不仔細觀察,你很難發現這些主播是AI虛擬主播。她們的外表不僅與真人相似,而且她們在聲音、情感和動作方面的表現非常逼真,在某些方面甚至具備跳舞和唱歌等多種才藝。
AI賦能數字人 打破直播帶貨次元壁
從以「一禪小和尚」、「我是不白吃」、「默默醬」等為代表的虛擬IP初探直播帶貨開始,AI數位人直播正逐漸改變傳統的零售業和電商行業。越來越多知名品牌已經開始嘗試利用AI虛擬人直播來推廣自己的產品,例如完美日記的“Stella”,自然堂的“堂小美”,花西子的“花小西”等虛擬主播。
相對於真人主播高昂的營運成本,虛擬主播不受時間、地點、環境限制,一鍵開播,24小時全天候在線的優勢,極大的降低了商家直播帶貨的成本。對平台而言,虛擬主播是電商平台生態佈局中不可忽略的一環,透過不斷降低直播門檻,增加平台對中小企業的吸引力。
高品質合成資料集 打造「能言善道」的優質主播
AI數位人直播帶貨,已然是大勢所趨。不過,要實現廣泛商業化落地也面臨不小挑戰。尤其是高配版的虛擬人,效果越逼真,成本也會水漲船高。
直播間裡,主播主要透過聲音和畫面兩種途徑來介紹產品資訊。其中聲音是不可忽視的「第一媒介」。首先,主播有一個自然流暢、情感豐富的音色,才能給用戶帶來舒適的聽感,反之,如果主播的聲音過於機械、冷漠,則會影響觀看慾望;其次是互動體驗,例如主播透過語音控制發紅包,粉絲透過語音連麥與主播溝通,都會增加與直播間用戶的黏著度。
因此,為了達到更好的直播效果和使用者體驗,商家需要對虛擬主播的語音互動能力不斷進行調試,打磨直播話術,完善與用戶互動的功能。
無論何種機器學習能力,都需要演算法和資料的累積來支撐它們的技術層面。要提昇在直播帶貨場景下的語音互動能力,需要有大量優質的直播場景資料支撐模型訓練。
標貝科技深耕AI資料服務領域多年,在資料蒐集與標註方面具備豐富的實務經驗。針對直播帶貨場景,標貝科技基於專業級錄音棚及優質聲優資源,精心建立了高品質語音合成資料庫,並完成對資料庫的音字標註、韻律標註、音素邊界標註、口語化標籤標註等,可供演算法最佳化直接使用,確保合成出來的音色更穩定、自然度更高。
基於直播帶貨場景的合成資料庫
語種:中文國語、中英混合
#採集環境:專業錄音棚,訊號雜訊比不低於35dB
資料長度:5小時中文,1小時中英混
錄音語料:主播直播帶貨話術
取樣格式:無壓縮PCM WAV格式
取樣率:48KHz 24bit
標註內容:音字標註、韻律標註、音素邊界標註,重音、拖音、笑聲等標籤標註
適用領域:直播帶貨
歡迎對以上資料集有興趣的產業夥伴聯絡我們~
如果以上數據無法滿足您目前的需求,標貝科技還可以針對特定人群、特定場景、特定語種提供相應的數據客製化服務,全力幫助企業客戶得到滿意的數據服務。
以上是標貝科技直播帶貨場景合成資料庫 協助打造優質'AI主播”的詳細內容。更多資訊請關注PHP中文網其他相關文章!