快訊

警察爆退休潮!彰縣今年555人申請 員警不戀棧嘆「不如歸去」

00940申購期間忙翻 元大銀補償存匯人員一人一萬元

OpenAI再寫AI生成模型新里程碑:Sora的優勢與風險何在?

※如欲轉載本文,請與北美智權報聯絡

吳碧娥╱北美智權報 編輯部

2024年2月15日,OpenAI推出人工智慧影片生成模型Sora,並公開了一系列示範影片,展示Sora極其逼真的動畫製作能力,讓人留下深刻的印象。只要透過提示詞描述一個想法,就能在幾秒鐘內看到它以高真實的影片形式呈現在你眼前,這就是Sora的力量。

OpenAI將Sora技術報告取名為「Video generation models as world simulators」,展現OpenAI打造「世界模擬器」的企圖。Sora是AI發展進程的里程碑,將加速超越人類的「通用人工智慧」(AGI)到來,Sora不僅推動上游AI伺服器、光通訊和晶片產業發展,影視、廣告行銷、IP等內容產業,未來都有可能受益於生成式影片發展。

OPEN AI正在教導AI理解和模擬物理世界的運行方式,Sora建立在過去OpenAI對DALL-E和GPT模型的基礎之上,OpenAI在2023年9月發布了DALL-E 3,它是DALL-E文字到圖像模型系列的第三代產品。Sora利用改良版的DALL-E3技術,並超越了ChatGPT基於文字模型的功能。根據OpenAI公佈的Sora大模型技術報告,Sora的核心技術為Diffusion Transformer架構,透過影片壓縮網路、時空補丁提取和影片生成三個主要步驟,可製作出長達60秒、解析度1080p的影片,還能根據文字提示編輯和擴展內容,代表著人工智慧創建內容領域的重大突破。

要訓練從文字到影片的AI產生系統,需要大量帶有相應文字字幕的影片,OpenAI首先訓練一個高度描述性的字幕產生器模型,並對高度描述性影片字幕進行訓練,以提高文字保真度以及影片的整體品質。OpenAI利用GPT將簡短的使用者提示,轉換為較長的詳細字幕,然後傳送到視訊模型,使Sora能夠根據用戶提示詞產生準確的高品質影片,還能夠在時間上向前或向後,擴展出更長且視覺連貫的影片。

在發佈Sora的同時,OpenAI也承認Sora有其限制,包括不能準確模擬基本相互作用的物理過程(例如玻璃破碎)、長時間樣本中可能出現不連貫性,或是對於理解因果關係仍有挑戰。而為了安全性問題,Sora將限制對性、暴力、仇恨或名人圖像,以及包含智慧財產權內容的文字提示。OpenAI目前先向小型的「紅隊」(red teaming)提供部分的訪問權限,「紅隊」由錯誤訊息、仇恨內容和偏見等領域的專家所組成,他們將以對抗性方式測試Sora模型。OpenAI亦和特定的影片製作者和藝術家共享Sora,以尋求在創意領域中的使用回饋,未來才會進一步將Sora公開給一般公眾,時間仍未定。

還有哪些AI影片生成工具?

事實上,文字生成影片並非新鮮事。在Sora發布前,已有數十種影片生成產品開始投入使用,全球數百萬用戶根據文字或圖像提示創建短片。根據美國投資機構a16z統計,截至2023年底,已有21個經由大型科技企業和新創公司發布的AI視訊模型,其中包括較知名的Runway、Pika、Genmo以及Stable Video Diffusion等[1](詳見圖一)。

圖一、21個AI影片模型

圖片來源:a16z

Sora並非同類產品中的第一個,只是其他已經發布的AI模型,基本上都只能生成10秒以內的極短影片,Sora可以產生60秒一鏡到底的多鏡頭影片,大幅提高了影片的品質和生成內容長度。而其他大型科技公司也有令人矚目的AI影片生成模型,像是Meta的Emu Video、Google的Lumiere,以及字節跳動的MagicVideo,只是至今仍未宣布他們的模型何時公開,僅處於研究階段。因此,OpenAI推出的Sora,仍為AI影片生成行業向前邁出了一大步。

用AI模型也能拍出電影

另一個值得注意的是,熱門照片和影片編輯應用程式Facetune和Photoleap背後的以色列新創公司Lightricks,即將在今年3月27日推出一款視覺AI視訊工具LTX Studio,強調僅使用文字描述即可產生角色、場景、分鏡,除了能在較長的製作過程中進行編輯和控制,甚至可以製作整部電影。由使用者編寫生成人物和情節的文字描述,再從各種攝影機角度和風格中進行選擇,並添加音樂、音頻和各種自訂元素。Lightricks表示,LTX Studio最初將會是免費的,未來希望透過LTX Studio催生更多類型的電影專案,即使是非常小的團隊,也能夠創造出驚奇之作。

圖二、LTX Studio帶來的故事敘述體驗。

圖片來源:LTX Studio

潛在的資安風險

KPMG安侯企業管理股份有限公司董事總經理謝昀澤表示,過去一段時間,以生成式AI技術創作或偽冒影片的深偽技術(Deepfake)越來越普及,但多數影片都無法達到高畫質、長時間,且多鏡位的品質,且深偽的工具使用門檻也較高。但Sora卻一舉突破了這些障礙,根據簡單的提示詞所生成的4K超高畫質影片,真實感已經達到專業人士難以分辨真偽的程度。

謝昀澤認為,過去大家都擔心會有超越專家能力的「超級人工智慧」(Super AI)出現,但是現在「超級深偽」(Super Deepfake)欺詐技術,已隨著越來越多的網路AI影音服務就在眼前,如果沒有適當的風險控制,恐將形成「深偽即服務」(Deepfake as a Service,簡稱DaaS)的暗黑產業鏈,這項技術可能被用來製造更加精細和難以辨識的假新聞,對公眾意識形態、選舉、乃至國家安全均構成前所未有的挑戰,連過去傳統的資安防護與認證基礎工程,如遠距身分識別等機制,都可能被撼動。儘管Sora的能力令各界感到驚艷,但AI生成影片所衍生的社會影響和道德問題仍成為隱憂,尤其美國將在2024年進行總統大選,AI生成影片可能傳遞錯誤和詐欺宣傳,在選舉期間更成為不可忽視的巨大風險,潛在資安風暴正在生成中。

 

資料來源:

  1. OpenAI Research: Video generation models as world simulators.
  2. 2024/2,Lightricks: Lightricks Introduces First Generative AI Filmmaking Platform: LTX Studio.

 

備註:

 

作者:吳碧娥
現任:北美智權報主編
學歷:政治大學新聞研究所
經歷:北美智權報資深編輯

驊訊電子總經理室特助

經濟日報財經組記者

東森購物總經理室經營企劃

延伸閱讀&電子報訂閱連結:

【更多內容請見《北美智權報》352期;歡迎訂閱《北美智權報》電子報

延伸閱讀

趨勢觀察/AI大型語言模型 行銷好幫手

矽光子 CPO 族群 強強滾

「雄心、恐懼與金錢」紐時:AI爭奪戰 2015年就點燃

【專家之眼】台灣AI發展缺乏OpenAI執行長Altman式的瘋狂

相關新聞

《 TAIPEI AMPA 2024 》 碳中和成永續經營關鍵, 汽機車供應鏈聯手提升綠色競爭力

由Environment環境、Social社會責任、Governance公司治理所組成的“ESG”,被視為是評估一間企業經營的指標,已經開始對全球各種產業產生重大影響。TAIPEI AMPA今(2024)年舉辦ESG永續講堂,邀請領先推動ESG的參展廠商分享實績,協助汽機車零配件及車用電子產業提升綠色核心競爭力。

《 TAIPEI AMPA 2024 》為專利找出海口:在「臺灣專利超級站」發現臺灣專利超級讚!

為讓優秀的專利得獎作品能持續在國內外市場發光發熱,經濟部智慧財產局今年4月於「台北國際汽機車零配件展」(TAIPEI AMPA 2024) 設置「臺灣專利超級站(讚) Taiwan Patent Go」得獎專利專館,為得獎專利作品拓展新商機。智慧局表示,設置「臺灣專利超級站」目的是讓具有潛力的得獎專利技術藉由專業展進行多元展示及宣傳曝光,推薦給專業買主客群,同時提供面對面洽商媒合的機會,希望透過專利專館平台,促成專利商品化交易及開創市場新商機,達到「臺灣發明,創益無限」(Invent in Taiwan.Create for Business.)目標。除了TAIPEI AMPA 2024外,今年智慧局還會在台灣國際創意禮品文具展、新一代設計展及台灣創新技術博覽會等共4個展會設置「臺灣專利超級站」,篩選優良專利作品參與展出。

《 TAIPEI AMPA 2024 》2024年台北車輛三展強化跨產業整合 驅動產業革新

2024年台北國際汽機車零配件展(Taipei AMPA)、台北國際車用電子展(Autotronics Taipei)及台灣國際智慧移動展(2035 E-Mobility Taiwan)於4月17日至20日在台北南港展覽1館聯合舉行。本屆展會吸引來自全球19個國家、超過1,000家廠商參展,共計2,700個攤位,規模盛大,再創新高。展會不僅呈現臺灣汽機車產業上中下游完整供應鏈實力,更透過資通訊、電子、半導體等異業跨域技術整合,帶動台灣車輛產業加速革新,展現其在全球車輛供應鏈所扮演的關鍵地位。

2023亞太地區私募市場研析

由於總體環境的不確定性,全球多數市場的私募股權交易和出場數量大幅下降,2023 年,亞太地區私募股權基金籌集資金僅 1,000 億美元,為十年來的最低水準,面對嚴峻的市場,投資人紛紛制定新的策略來尋找買家並提高出場估值。

AI工具提示詞寫作的挑戰與應對方案

AI工具的提示詞寫作極具挑戰,需精準描述關鍵細節,以簡練語言驅動AI。由專業提示詞工程師開發的AI工具,會比讓每個人學習寫提示詞更有效率,而這也是實現AI賦能大眾的可行路徑,因此企業主應該要慎重考慮雇用提示詞工程師,以避免在AI浪潮中落於人後。

日本2024/05/01啟用特定發明專利申請案非公開制度

日本將啟用特定發明專利申請案非公開新制:2024年5月1日起提交的日本發明專利申請案,凡屬指定技術領域、可能須經保全審查的日本在地發明案,無論發明人國籍為何,第一案皆須先在日本申請。違反規定的申請人,可能無法在日本取得相關發明專利保護,並可能被課以罰金,甚至被追究刑責。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。