快訊

拜登下令搭公共運輸工具戴口罩 示警下月美染疫死亡數達50萬

瞄準專利分析 Google打造專屬演算法模型

【蔣士棋╱北美智權報 編輯部】

※如欲轉載本文,請與北美智權報聯絡

各國專利局都正在研究如何使用人工智慧(AI)協助工作,更有許多研究機構與企業,投入使用AI來撰寫專利的可能。在這片風潮之下,Google憑藉著在自然語言處理(NLP)上的技術優勢,推出了為專利分析量身打造的BERT演算法模型。也許初步看起來,BERT能做的不過是「猜單字」而已,但若能吸引更多人投入,假以時日必然不容小覷。

專利分析的重要性不言可喻,分析方法也相當五花八門,但能獲得市場認可的卻相當有限。原因很簡單卻也很難克服:專利文本內的文字數量太過龐大,而且許多字句的用法也與日常生活不同,想要用量化的方法進行分析難免掛一漏萬,精準度也稍嫌不足;如果改用逐篇閱讀、比對的方法又相當曠日廢時,還得再加上不同語言的隔閡。因此,就算明知專利資料是個大金礦,但真能從中挖出黃金的還是少之又少。

在眾多科技大咖中,Google很早就對專利產生興趣。2006年時,Google就推出了名為「Google Patents」的專利搜尋引擎服務,讓使用者可以從中搜索超過全球各國的獲證專利或申請中的專利文件,總數量超過1億篇。其中,包括五大局(IP5,分別為:USPTO、EPO、JPO、KIPO、CNIPA)在內,全球有17個專利局公告的專利全文,都可以透過Google Patents獲得。到了2018年時,Google Patents也與Darts-ip合作,把專利訴訟的資料也納入搜尋範圍中,讓資料庫更加完整。

Google從2006年就開始建構全球專利搜尋平台

近年來,Google也開始試著把人工智慧(AI)技術的研究成果,應用在專利上。Google在2018年時,就在自然語言處理(Natural Language Processing, NLP)領域發布了BERT演算法,並逐步運用在機器人聊天室(chatbot)、搜尋、自動完成(autocomplete)中。到了今年11月底,Google又對外釋出了使用BERT架構的專利文件技術專屬方案,讓全球的研發機構和專利產業使用。

由於專利文件用語的特性,Google這次也對BERT演算法的技術進行了微調。首先,在對文本進行分詞(tokenization)時,為了使語意分析更精準,這套方案裡的BERT使用的並不是一般分詞方法,而是針對特定技術領域重新設計。例如,對於「義肢(prothesis)」這個字,在通用的分詞技術上可能會被切割成 “pro”、 “the”、 “is”三個片段,但在分析專利文本時, “prothesis”就會被視為一個完整片段來分析。

此外,專利文件跟一般文書也有結構上的差異,例如摘要(abstract)的內容可能是簡短的描述性文字段落,而請求項(claim)則可能是有歸屬或前後關係的條列式文字。為了反映這個特性,Google又另外設計了五種標記(token)套用在專利文件的各個段落中,讓分析模型更為精準。

那麼,BERT演算法在專利分析上又有何用呢?以Google提供的報告來看,最顯著的功能在於辨識以及產生關鍵的同義字(synonsyms)。首先,Google挖空了三份專利文件摘要中的 “eye”單字,再把這三份文件送進BERT演算法分析並預測被挖空的單字。結果,在測試的三份文件裡,第一和第三份都把正確的答案(eye)列為第一預測結果,而第二份文件則是列為第三預測結果,預測的精準度相當高。

圖1:Google使用BERT演算法的第一份預測結果。預測1即為正確答案(eye),預測2則為相近的retina
圖1:Google使用BERT演算法的第一份預測結果。預測1即為正確答案(eye),預測2則為相近的retina

BERT演算法已經具備不同技術領域的語言分析能力

可別以為這只是簡單的猜單字遊戲而已。Google指出,這三份專利摘要所描述的其實是三個互異的技術領域:第一份是視覺處理系統的節能方法、第二份是紡織機器、第三份則是關於非侵入式的醫療程序。換句話說,雖然三份專利摘要裡都有 “eye”單字,但語意跟使用情境都大不相同。然而,經過BERT的分析後,不但都能得出正確的預測結果,系統也會給出與正確答案相似的其他結果,例如第一份預測中出現過的 “retina”答案,就沒有出現在第二、第三份預測中。這樣的結果也反映了BERT對於不同技術領域用語的熟悉度。

在實際應用上,Google認為,BERT演算法將有助於企業的專利部門改進內部的機器學習模型,各國的專利局也可以將BERT應用在專利審查以及前案檢索上。目前,Google也已經將全套程式碼、操作指引、範例都發布在Github上,任何人都可以根據自己的需求開發出其他應用。

有了Google以及人工智慧的加入,未來的專利分析也必然會更加精采。


【詳細內容請見《北美智權報》274期;歡迎訂閱《北美智權報》電子報

相關新聞

陷類似商標困境:五年前騰訊贏了 五年後亞馬遜為何卻輸了?

同樣是商品或服務標識被他人在先註冊為商標,五年前,騰訊變相奪回了「微信」商標;五年後,亞馬遜因使用「AWS」標識,不僅被判商標侵權,還被要求賠償原告人民幣(下同)7646萬元。

國際不確定因素難解 台商回台投資意願因而大增

這兩、三年的台灣民間投資出現了久違的榮景,除了得歸功於半導體業的製程設備採購更新,也不能忽視台商回台投資的效應,尤其當美中貿易戰以及新冠肺炎疫情均未消停時,這些在海外打拼多年的台商終於發現:家真的才是最好的避風港。

專利授權量比獲證量重要 成大打破數大就是美的迷思

自2020年8月1日起,國立成功大學 (以下簡稱成大) 的研究總中心正式更名為產學創新總中心,究竟除了名稱變更外,在組織架構上又起了什麼變化?對於成大整體在研發創新及產學合作方面的運作,又會產生什麼實質的影響?毫無疑問的,成大產學合作績效表現在國內大專校院裡一直都非常亮眼,不管是在「爭取企業界機構產學與效率」或是「智慧財產授權收益與效率」,一直都名列前茅。而且,在《遠見》雜誌去年初公布的《2020企業最愛大學生排行榜》中,成大連續6年蟬聯冠軍,其畢業生為企業最愛僱用的社會新鮮人。為何企業厚愛成大學生?為何成大於產學合作表現如此亮眼?有什麼做法是值得其他學校學習的?藉成大產學創新總中心正名之際,北美智權報專訪了成大助理副校長暨產學創新總中心主任莊偉哲及產學創新總中心營運長暨企業關係與技轉中心主任張志涵,將分兩刊期為讀者解開這個令人好奇的迷團,這一期先由張志涵解構成大產學創新總中心,及分享成大智財管理及產學合作的經驗,下一期將由莊偉哲來解密產學創新總中心的績效及新創加速中心的運作模式。

發明被人偷搶去申請怎麼辦?美國AIA法案後第一件專利衍生程序Andersen v. GED案

在美國,若我的發明被他人偷偷拿去申請專利,我該如何提起救濟?在2012年美國發明法案(簡稱AIA)之前,採取的是權利衝突程序,修法後,採取的是專利衍生程序,以認定到底誰是真的發明人,以及誰可以取得該專利。美國專利審理暨救濟委員會直到2018年3月,才正式決定啟動第一件衍生程序之審理,並在2019年3月做出最終書面決定。臺灣過去對於美國的專利權利衝突程序,以及美國發明法案後的專利衍生程序的運作並不熟悉,本文將以這則Andersen v. GED案,來說明美國的專利衍生審理程序。

嚴格限制商業活動的價格漲跌 合理嗎?

在自由競爭的社會中,商品價格的波動本來就是自然現象,但台灣社會對於民生物資的價格,卻一直抱持著只能跌、不能漲的心態。誠然,惡意囤貨或者哄抬物價都是不可取的行為,政府依法也必須加以處分,但若廠商只是因應市場供需變化而漲價,消費者自然會做出買不買單的決定,政府也不需要強加干預了。

新年新希望 - 智慧局2021年工作展望

2020年世界經歷COVID-19全球大流行,各國經濟遭受嚴重衝擊,民眾生命受到威脅,不僅帶來全球經濟劇烈變動,也帶來新的產業發展趨勢和商機。為順應迎面而來的重大變局及轉機,同時迎接後疫情時代經濟復甦的挑戰,保護產業創新研發成果的智慧財產權,扮演著重要的角色。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。