利用AI寫專利稿的可能性初探 — AI的工作原理與限制

【劉宏明╱房地產公司專案執行經理】

※如欲轉載本文,請與北美智權報聯絡

筆者曾經是一名程式設計師,有20年從事專利相關工作的經驗,目前仍致力於撰寫專利說明書。由於工作的需要,筆者也成為了一名專利發明人,申請了超過100件專利。然而,當筆者要寫這篇文章時,筆者不禁感嘆科技的進步神速。過去幾年來,筆者見證了許多企業試圖用電腦程式來實現寫專利的目標,甚至有些已經成功獲得了專利;但是,這些成果都沒有讓筆者感到驚艷;直到最近,利用AI寫專利才真正成為可能。雖然現階段還不夠完善,但根據目前的發展速度,很快就會變成一個非常實用的工具。在這個系列文章中,筆者想先簡單介紹AI的機器學習原理,然後回顧專利寫作的特點,最後探討利用AI撰寫專利稿的前景和挑戰。關於更具體的寫作環節,將在下一篇文章中更深入探討,首篇將著重在探討AI的工作原理與限制。

AI的機器學習原理

機器學習是指電腦能夠從大量的資料中自動找出規律並執行任務,而不需要人類事先給定規則或指令。舉例來說,如果要讓電腦從照片中辨識出鳥類,就需要讓電腦根據一個適合該任務的模型 (model)進行學習。首先,要提供一些已經標示好答案的動物照片給電腦,並讓電腦嘗試回答是否為鳥類。然後,再告訴電腦它的回答是否正確,並利用高效能的AI算力,重複這樣的過程很多次,這個過程就叫做機器學習。當AI的回答正確率達到一定水準之後,就表示該模型訓練完成。訓練完成後的模型,就可以用來執行預定的任務。

AI其實只是掌握很多資訊的機器

AI有它的局限性,主要是因為AI沒有像人類那樣的想像力。如果提供給AI學習的資料中沒有包含某些答案,AI就無法推斷出來。舉例來說,如果任務是要做房屋的物件推薦,但沒有提供客戶在做決策時會考慮哪些因素,AI就無法做出合適的推薦。更進一步舉例,如果客戶的需求是要找鄰居素質好的房屋,但提供給AI學習的資料只有客戶的線上操作行為(例如許多客戶曾經做過選擇的行政區、總價、近公園綠地等等),卻沒有包含客戶對於鄰居素質好的定義或是背後的真正需求,AI自然就無法給出滿意的答案。

學會如何利用AI,將是最關鍵的一步

在了解AI並非萬能,而且未來也不太可能萬能後,筆者就發現,在AI的時代中,最重要的是要學會如何利用AI,或者說如何『協助』AI,讓AI能夠獲得做判斷時所需的關鍵資訊,然後讓AI盡可能地完成任務。例如,如果要求AI提供鄰居素質好的房屋時,同時也要提供客戶對於鄰居素質好的定義或是背後的真正需求,這樣AI才有可能給出更有用的答案。更具體來說,利用GPT(生成式預訓練,Generative Pre-Training)的模型除了可以處理上述模糊或不確定的情況,還能學習或適應新的數據或環境。這就是為什麼AI發展了這麼多年,卻是在ChatGPT推出之後,才『突然』造成如此巨大的震撼的主要原因,也讓一直在發展AI技術的Google被嚇醒,發出代表高度威脅的「紅色警戒」(code red)。

AI其實也不怎麼了解他自己

為了更進一步說明AI的限制,以下將舉一個理論上AI應該很清楚的事情,但AI卻顯得一無所悉的例子,並希望讀者可以從這個限制去了解該如何利用AI。

基於以上內容,相信大家已經能了解GPT的強大之處,但如果明知故問,而且只提出單純的問題,不帶有任何指示,AI的回答只會讓人感到很發散。該問題是:『為什麼AI發展了這麼多年,ChatGPT推出後,很多人都非常驚訝。主要原因是什麼?』,結果不論是ChatGPT、New Bing或Google Bard都只是很發散地描述AI或GPT本身的特性,卻沒辦法解釋主要原因是什麼。這絕對不是AI還無法理解這個指令的含意,只是說明AI真的無法掌握到最關鍵的因素,這就是目前AI的限制。但,當給予AI適當的提示,AI就會顯得好像他突然醒悟過來,給予更為豐富的描述。這就是AI其實是知道答案,但AI在沒有提示,AI就是提不出來,必須要人類給予指導。因此當我的提問後末尾增加『因為傳統的 AI 需要針對特定任務進行機器學習,而 GPT 不需要』時,不論是ChatGPT、New Bing或Google Bard均紛紛表示贊同我的看法,才能開始深入地說明細節。換言之,與AI互動,掌握提示詞(prompt)是至關重要的,目前在國外已有企業高薪聘用提示詞工程師,因為他是所謂懂得運用AI的最核心所在。

不要用錯AI工具

事實上,Google在發展AI技術方面已經有很長的歷史,但由於傳統AI技術無法處理模糊或不確定的情況,只能處理特定任務,例如自動駕駛,所以Google開發了多年的BERT AI並沒有達到商業化的價值。雖然ChatGPT推出後讓Google感到面子掃地,但當Google也採用了GPT原理,並結合了過去累積的大量資料和硬體資源而推出Bard之後,一切又變得不同了。根據筆者實際試用Bard的體驗,突然爆紅的ChatGPT就顯得像小學生一樣。這主要是因為ChatGPT背後的母公司OpenAI缺乏足夠的資金去更新更多的預訓練模型,導致它在回答某些問題時常常出錯。相反的,被商業化應用的微軟所推出的New Bing(或稱bing copilot,底層技術與ChatGPT是相同的)和Google Bard就表現得非常出色,因此在進入AI時代之後,不要只盯著實驗性質較高的ChatGPT,而是要善用真正被商業化的New Bing或Google Bard。不過,在使用這些免費AI工具時,還是要注意可能會有洩漏機密的疑慮。

本機端的AI系統

由於專利文件都是涉及機密性的,甚至有可能因為在使用AI工具的過程導致意外提前洩漏專利機密,因此專利從業者可以考慮自行撰寫本機端的AI系統。OpenAI是有開放付費的API,讓懂得程式開發者可以利用API來進行撰寫專利的任務,卻不用擔心機密外洩的問題。如果不熟悉程式撰寫者,當然也可以利用AI來寫出完整的AI系統。關於如何實作,細節上可以參閱AutoOGPT[1]所公開的內容,當然也可以直接把AutoGPT安裝在本機,只是必須要提醒的是,不太清楚是AutoGPT的作者是故意的,還是程式優化未完成,利用AutoGPT完成相同任務,他將會消耗數倍的Token,實際上支付給OpenAI的費用會暴增許多。

不要抗拒AI,要善用AI

依據筆者與許多人討論AI的經驗,筆者發現許多人其實是被媒體誤導,而對AI產生抗拒。媒體很喜歡用聳動的標題與議題來吸引人,總是喜歡報導某某專業會在多少年以後消失,被AI取代,而認為自己花了10年、20年累積起來的專業,就這麼簡單被AI否定了價值,心理上就很不舒服,進而抗拒AI。然而,如同微軟對於copilot的行銷宣傳,AI只是輔助真人大幅提高工作效率,而非取代真人。在不久的將來,人們只會被善於使用AI的真人所取代。又加上,GPT技術的推出後,讓獲取某些專業的門檻被大幅降低,例如即使原本不懂寫程式的人,只要懂得用AI也能寫出程式碼[2],而且還可以在完全沒有寫一行程式碼的情況下,只要懂得如何『輔助』AI,就能完成非常複雜的AI程式[3]。


備註:

  1. https://github.com/Significant-Gravitas/Auto-GPT
  2. 將底下這串描述丟給Google Bard、New Bing或是ChatGPT,就可以寫出AI的Python程式語言,其原理其實與用AI寫專利差不多,都是要懂得『輔助』AI :"用python寫一個程式,內容是從指定的URL讀取CSV檔案,並建立一個函式y=W*x+b,其中x的資料來自於該CSV檔案中YearsExperience欄位資料,而y的資料來自於Salary欄位資料,以X軸與Y軸圖形方式展示x與y的資料,其中每個X軸Y軸交會的點以紅色"X"來顯示, 該圖示的標題為中文字"年資-薪水", x軸標示為文中字"年資",Y軸標示為中文字"月薪(千)",接受輸入特定的YearsExperience,而回應符合該年資的Salary
  3. 這是基於深度強化學習訓練了一個用於打敗最終遊戲魔王的AI 代理,作者有附上他與AI對話與互動的完整過程,讓大家可以更深入體會什麼是要懂得『輔助』AI。 https://github.com/linyiLYi/street-fighter-ai


【詳細內容請見《北美智權報》332期;歡迎訂閱《北美智權報》電子報

延伸閱讀

Google 3年付1億美元刊登新聞 紐時多了額外收入

Google折疊機出擊 台鏈沾光

Google強攻生成式AI 帶旺台積

Google登紐時新聞 付費30億

相關新聞

從電動車到AI 看馬斯克開放原始碼背後的商業盤算

特斯拉執行長馬斯克在電動車和AI領域頻頻祭出開放原始碼大旗,無私地推動產業創新。然而,若深入剖析其開放原始碼策略,卻發現馬斯克的慷慨背後,藏著精心設計的商業算盤。這場看似利他的開放原始碼大秀,實則是一齣商業利益最大化的好戲。

氫離子幫浦抑制劑之藥劑劑型的顯而易見性:Santarus, Inc. v. Par. Pharm., Inc., 694 F.3d 1344 (Fed. Cir. 2012)

於臨床上,奧美拉唑是非常重要的氫離子幫浦抑制劑,可用於抑制分泌太過旺盛的胃酸,減少胃食道逆流、胃潰瘍及十二指腸潰瘍等症狀,改善患者的日常生活。藥物專利侵權訴訟的攻防中,涉及氫離子幫浦抑制劑者數量不多,較常見者係以其藥物化學構造的顯而易見性為爭議者,較少見者則如本文,係涉及氫離子幫浦抑制劑之藥劑劑型的顯而易見性,因此,本文擬藉由Santarus, Inc. v. Par. Pharm., Inc., 694 F.3d 1344 (Fed. Cir. 2012).案件[1] ,來探討有關氫離子幫浦抑制劑之藥劑劑型的顯而易見性。

歐盟資料法正式上路

為了打造資料經濟並推動2030年數位轉型工作,歐盟繼資料治理法之後,進一步完成資料法(Data Act)立法工作,該法業於2024年1月11日生效,且最快於生效日起20個月後開始適用(亦即2025年9月12日)。 惟第3(1)條規定(新產品資料存取簡化)係適用於該法生效日起32個月後上市之連網產品及其相關服務,亦即2026年9月12日。

中國機器人產業發展研析

中國似乎尚未在機器人創新方面處於領先地位,但其國內生產和採用正在迅速增長,並且政府已優先投入該產業發展,即便關鍵技術取得越發困難,但在資源挹注下,中國機器人企業取得領先可能只是時間問題。

2024年全球電動車產業發展:新興市場成為新戰場

經濟部國際貿易署於日前主辦「工具機應用產業趨勢與商機分享會」,MIH EV研發院執行長鄭顯聰分析全球新能源車產業市場,亞太市場是最具有潛力的地區,台灣工具機廠商可以思考如何切入汽車領域的相關應用,趁勢而起成為全球電動車產業生態系統的關鍵角色。

控告華碩的ACQIS公司來歷為何?專利蟑螂與合法NPE的界線

美國德州聯邦陪審團於3月22日裁定,華碩生產銷售的電腦相關硬體零組件侵犯了ACQIS公司的2項專利,必須支付1800萬美元(約新台幣5.7億元)的賠償金。雖然華碩主張這些專利無效,並強調自己並未刻意侵權,但陪審團仍認定專利有效,駁回了華碩的主張。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。