英特爾也玩元宇宙！AI擴散模型生成360度影像

2023-06-27 13:15 聯合報／記者鍾張涵／即時報導

英特爾實驗室與Blockade Labs合作推出Latent Diffusion Model for 3D（LDM3D），這是一款新穎的擴散模型，使用生成式AI創造3D視覺內容。圖／英特爾提供。

英特爾今天宣布，實驗室與Blockade Labs合作推出Latent Diffusion Model for 3D（LDM3D），這款新穎的擴散模型可使用生成式AI創造3D視覺內容。LDM3D是業界首款使用擴散過程產生深度圖的模型，建立可360度觀看的生動、沉浸式3D影像。

英特爾實驗室AI∕ML研究科學家Vasudev Lal指出，生成式AI技術可以進一步擴大和提升人類的創造力並節省寶貴的時間。

但他說，然而今日絕大多數的生成式AI模型均侷限在產生2D影像，僅有極少數能夠從文字提示中產生3D影像。與目前潛在擴散模型（latent diffusion model）不同的是，LDM3D使用參數數量幾乎相同的模型，從給定的文字提示中產生影像和深度圖。相較於標準深度估測後處理法，可為影像中每個像素提供更準確的相對深度，為開發者節省建構場景所耗費的大量時間。

近年來在電腦視覺領域，特別是生成式AI取得顯著進展。然而今日許多先進的生成式AI模型僅限於產生2D影像，與通常僅能從文字提示中產生2D RGB影像的現有擴散模型不同，LDM3D讓使用者能夠從給定的文字提示中同時產生影像和深度圖。LDM3D在使用與潛在擴散模型幾乎相同的參數數量情況下，相較標準的深度估測後處理法，為每個像素提供更為精確的相對深度。

英特爾指出，這項研究可能徹底改變人們與數位內容的互動方式，使用者能夠以過往想像不到的方式去體驗他們的文字提示。LDM3D所產生的影像和深度圖，讓使用者能夠把靜謐的熱帶海灘、科幻宇宙中的未來世界，透過文字敘述轉換成精細的360度全景圖。

英特爾認為，這種捕捉深度資訊的能力可以立即強化整體的真實感和沉浸感，為娛樂、遊戲、室內設計、房地產銷售，以及虛擬博物館和沉浸式虛擬實境（VR）體驗等各式各樣的行業，開啟創新應用。