英特爾也玩元宇宙!AI擴散模型生成360度影像
英特爾今天宣布,實驗室與Blockade Labs合作推出Latent Diffusion Model for 3D(LDM3D),這款新穎的擴散模型可使用生成式AI創造3D視覺內容。LDM3D是業界首款使用擴散過程產生深度圖的模型,建立可360度觀看的生動、沉浸式3D影像。
英特爾實驗室AI∕ML研究科學家Vasudev Lal指出,生成式AI技術可以進一步擴大和提升人類的創造力並節省寶貴的時間。
但他說,然而今日絕大多數的生成式AI模型均侷限在產生2D影像,僅有極少數能夠從文字提示中產生3D影像。與目前潛在擴散模型(latent diffusion model)不同的是,LDM3D使用參數數量幾乎相同的模型,從給定的文字提示中產生影像和深度圖。相較於標準深度估測後處理法,可為影像中每個像素提供更準確的相對深度,為開發者節省建構場景所耗費的大量時間。
近年來在電腦視覺領域,特別是生成式AI取得顯著進展。然而今日許多先進的生成式AI模型僅限於產生2D影像,與通常僅能從文字提示中產生2D RGB影像的現有擴散模型不同,LDM3D讓使用者能夠從給定的文字提示中同時產生影像和深度圖。LDM3D在使用與潛在擴散模型幾乎相同的參數數量情況下,相較標準的深度估測後處理法,為每個像素提供更為精確的相對深度。
英特爾指出,這項研究可能徹底改變人們與數位內容的互動方式,使用者能夠以過往想像不到的方式去體驗他們的文字提示。LDM3D所產生的影像和深度圖,讓使用者能夠把靜謐的熱帶海灘、科幻宇宙中的未來世界,透過文字敘述轉換成精細的360度全景圖。
英特爾認為,這種捕捉深度資訊的能力可以立即強化整體的真實感和沉浸感,為娛樂、遊戲、室內設計、房地產銷售,以及虛擬博物館和沉浸式虛擬實境(VR)體驗等各式各樣的行業,開啟創新應用。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言