騰訊和清華、香港科大推出圖生視頻大模型Follow-Your-Click

一隻小狗的圖片加上一個提示詞Raise head,Follow-Your-Click就能生成這隻小狗將頭抬起再垂下的重複動作影片。不同提示詞可生成不同動作影片。     取自Follow-Your-Click網站
一隻小狗的圖片加上一個提示詞Raise head,Follow-Your-Click就能生成這隻小狗將頭抬起再垂下的重複動作影片。不同提示詞可生成不同動作影片。 取自Follow-Your-Click網站

《證券時報》官網創業板資訊網站《券商中國》報導,3月15日,騰訊和清華大學、香港科技大學聯合推出全新圖生視頻大模型「Follow-Your-Click」,基於輸入模型的圖片,只需點擊對應區域,加上少量提示詞,就可以讓圖片中原本靜態的區域動起來,一鍵轉換成影片

報導稱,在目前的圖生影片大模型中,一般的生成方法不僅需要使用者在提示詞中描述運動區域,還需要提供運動指令的詳細描述,過程較為複雜。另外,從產生的效果來看,現有影像產生視訊技術在移動影像的指定部分上缺乏控制,產生的影片往往需要移動整個場景,而不是影像上的某一個區域,精準度和靈活性上有所欠缺。

為了解決這些問題,騰訊混元大模型團隊、清華和港科大的聯合項目組提出了更實用和可控的圖像到視頻生成模型Follow-Your-Click,帶來更加便捷的交互,也讓圖片「一鍵點,萬物動」成為現實。

不過,券商中國並未再深入報導更多細節。實際探訪其網站,Follow-Your-Click似只能將圖片轉換成2、3秒鐘的影像,譬如將一隻小狗的圖片加上一個提示詞Raise head,就能生成這隻小狗重複將頭抬起再垂下的重複動作影片。網頁上也註明這一技術的限制,這一技術路徑仍在生成大型複雜的人類動作上,有所限制,這可能是與動作與複雜性以及相關的訓練樣本仍十分稀缺有關。

報導說,騰訊混元大模型團隊,正在持續研究探索多模態技術,擁有業界領先的影片產生能力。此前,騰訊混元大模型作為技術合作夥伴,支持《人民日報》打造原創視頻《江山如此多嬌》,生成中國大美河山的精美視頻片段,展示出了較強的內容理解、邏輯推理和畫面生成能力。

2月15日,OpenAI在全球AI生成影片領域丟出一枚爆炸性訊息。當日,該公司發布了一款名為Sora的「文字生成影片」模型,並向部分研究人員和創作者開放Sora的存取權。Sora除了可以根據文字描述生成視頻外,還可以根據現有的圖片生成視頻,目前可生成的視頻長度在1分鐘左右。

緊跟著Sora,2月26日,GoogleDeep Mind團隊發布了110億參數的AI基礎世界模型Genie。僅用一張圖片,便可產生一個互動式世界,生成的世界「動作可控」,用戶可以其中逐幀行動。谷歌表示,Genie開啟了「圖/文生成互動世界」的時代,也將成為實現通用AI Agent的催化劑。

平安證券表示,OpenAI、Google相繼發布多模態大模型Sora、Genie,AGI浪潮或將加速到來。

報導說,2月28日,阿里巴巴智慧計算研究所發表了一款全新的生成式AI模型EMO(Emote Portrait Alive)。EMO只需一張人物肖像照片和音頻,就可以讓照片中的人物按照音頻內容「張嘴」唱歌、說話,且口型基本一致,面部表情和頭部姿態非常自然。

報導指出,EMO為多模態領域的視頻AI帶來新玩法。不同於文生視頻模型Sora,EMO主攻圖+音頻生成視頻的方向:輸入單張照片+任意語速的人聲音頻,EMO即可自動產生具有豐富面部表情和頭部姿勢的聲音肖像影片。

OpenAI 影片

延伸閱讀

讓台生畢業直接在陸就業 北京清華招聘會首設「港澳台生」專區

清華教授:大學像工廠 學生不快樂

會計師看時事/AI風險治理五大關鍵

一座小模型 牽起白沙屯媽、日本船型萬燈祭文化交流情誼

相關新聞

避川普關稅大棒 陸去年出口創高

美國候任總統川普本月重返白宮前,大陸官方昨公布最新外貿數據,去年出口規模首次突破人民幣廿五兆元,創下新高,尤其年末出口強...

陸半導體業 高薪搶人成過去式

高薪是半導體公司吸引人才的武器,以往中國大陸不少半導體公司動輒開出數倍薪資挖角,範圍包括台灣、南韓甚至美國,不過有大陸財...

年關近金廈小三通跑單幫亂象頻傳「國門蒙羞」引熱議

民眾搶買年貨帶動金廈小三通的邊境貿易熱潮,不少人利用小三通跑單幫賺取豐厚利潤,也衍生的亂象卻引發民怨。社群媒體今天熱傳一...

美公告2024年假冒和隱私惡名市場名單 微信首次被移除

美國貿易代表署(USTR)8日發布《2024年假冒和隱私惡名市場名單》(2024 Review of Notorious...

AI算力縮水29% 輝達發布陸版RTX 5090D顯示卡

輝達(NVIDIA)7日發布RTX 50系列顯卡,也推出符合美國出口管制規則的大陸特供版旗艦顯卡RTX 5090 D,將...

救股市 陸禁大型基金拋售股票

中國大陸股市在二○二五年開局首周表現不佳,上交所、深交所近日約見外資機構,召開座談會聽取意見之際,路透引述消息指,大陸主...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。