亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

復旦百度聯(lián)手突破!音頻直接生成4K一小時長視頻

   發(fā)布時間:2024-10-21 10:15 作者:顧雨柔

復旦大學與百度攜手推出全新AI模型——Hallo2,該模型已正式在GitHub開源。Hallo2能夠生成長達數(shù)小時、分辨率為4K的人物動畫,相較于前代模型,實現(xiàn)了顯著提升。

Hallo2模型基于latent diffusion models構建,引入了數(shù)據(jù)增強方法,如patch-drop和高斯噪聲,有效提升了長時間視頻的視覺一致性和時間連貫性。同時,該模型還結合了向量量化生成對抗網(wǎng)絡和時間對齊技術,確保了高分辨率視頻的質(zhì)量和流暢性。

Hallo2還創(chuàng)新性地將可調(diào)整的語義文本標簽的肖像表情作為條件輸入,提高了生成內(nèi)容的可控性和多樣性。據(jù)項目頁面介紹,Hallo2是首個實現(xiàn)4K分辨率并生成長達1小時音頻驅動人像圖像動畫的方法,且可通過文本提示進行增強。

附Hallo2項目地址。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群