國産 AI 視頻神器大更新,支持 4K、60 幀,視頻生成有聲時代來了
AI 視頻生成領域的新突破:智譜清影重磅升級
行業現狀與挑戰
今年,AI 視頻生成領域迎來了前所未有的發展熱潮。各行業廠商紛紛推出各種創新功能,從提升視頻生成時長到優化畫面質量,再到引入AI特效,競争異常激烈。盡管許多模型聲稱能夠一鍵生成視頻,但實際效果往往不盡如人意,尤其是音效的缺失成為用戶心中的痛點。随着用戶對AI視頻的期待越來越高,這一問題愈發凸顯。
智譜清影的崛起
三個月前,智譜清影作為國内首個面向公衆開放的視頻生成産品,推出了清言App。用戶隻需提供一段指令或圖片,30秒内即可生成AI視頻。然而,智譜清影并未止步于此,而是不斷尋求技術突破和用戶體驗的提升。
重大升級亮點
提升視頻質量與自然度
智譜清影在最新的升級中,顯著增強了圖生視頻的質量、美學表現、運動合理性和複雜提示詞語義理解能力。人物面部表演細節更加豐富,動作連貫性更強,物理特性模拟更為逼真,大大提升了視頻的自然度和逼真度。
支持超高清視頻生成
此次升級還支持生成10秒、4K、60幀的超高清視頻,且支持任意比例的圖像生成視頻。用戶可以根據需求自由選擇視頻尺寸,滿足不同場景的應用需求。
多視頻生成與音效匹配
同一指令或圖片可以一次性生成4個視頻,進一步豐富了用戶的創作選擇。此外,智譜清影将在本月上線與畫面匹配的音效功能,徹底解決音效缺失的問題,為用戶提供更加完整的視聽體驗。
開源貢獻
值得一提的是,智譜清影在國内企業中少有地一直支持開源。此次,智譜正式發布了最新版本的視頻模型 CogVideoX v1.5,并開源了兩個模型:CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V。未來,CogVideoX v1.5 将同步上線到清影,并與新推出的 CogSound 音效模型結合,為用戶提供更強大的技術支持。
結語
智譜清影的這次重大升級不僅解決了用戶長期以來的痛點,還為AI視頻生成領域樹立了新的标杆。通過持續的技術創新和用戶體驗優化,智譜清影正逐步實現其成為行業領軍者的願景。
我來說兩句