快訊

與跨性別女子的賽跑?美國體壇「平等戰爭」

比神奇寶貝訓練師更夯的人工智慧訓練師登場了

【李淑蓮╱北美智權報 編輯部】

2020年1月,經中國人力資源和社會保障部(人社部)同意,中國就業培訓技術指導中心於同年2月25日發佈了《關於擬發佈新職業資訊公示的通告》,新增包括人工智慧 (AI) 訓練師在內的16個新職業。雖然AI訓練師的薪資水平不算特別吸人,但由於AI市場漸熾,未來前景絕對比神奇寶貝訓練師來得夯。另一方面,台灣產官學研雖然也在積極發展人工智慧,但AI產業職場狀況不太清晰,是不是也該考慮來「正名」一下

據朱明德《AI新職位「人工智慧訓練師」》分析報告(下稱《報告》)指出,有人認為「人工智慧訓練師」是AI給人類帶來的第一個非技術類的「新職位」。雖然於2020年時全中國AI訓練師的人才缺口才3,494人,但伴隨著AI行業的高速成長,至2022年人才需求可望猛增5倍多,達21,884人。至於職缺需求及薪資水準方面,大公司的要求明顯高於新創公司,一般希望有3年以上經驗,而新創公司大多只要求1年以上經驗,甚至經驗不拘。

由於是非技術類的「職位」,因此相對於工程師來說薪水偏低,薪資範圍有73%落在8000元 (人民幣,下同)以下,甚至有過半數55%低於5000元,僅有27%是超過8000元的。

至於薪資偏低的原因相信是由於目前AI訓練師所屬行業以智慧客服居多 (占53%),一般而言客服薪資水準本來就不高。

AI訓練師產生之背景與定義

機器學習 (Machine Learning) 及深度學習 (Deep Learning)是人工智慧的2個子集,也是其核心所在;而AI訓練師主要工作顧名思義,是用資料來訓練AI 設備及系統 (即使其學習)。

《報告》指出,一般而言,AI公司(或公司的AI部門)從客戶(使用者)那裡獲取到的原始資料無法直接用於模型訓練,在AI訓練師出現以前,是由AI產品經理先用相關工具簡單處理,然後再交給資料標註人員進行標註加工,但因為標註人員對資料的理解和標註品質差異很大,導致整體標註工作的效率和效果都不夠理想。

同時,AI公司(部門)在其細分領域內積累了大量資料,這些資料往往在使用一次後就不再產生更多價值,隨之帶來了第二個問題:資料無法累積和重複使用。

基於以上兩個問題,AI訓練師即應運而生。

《報告》給予AI訓練師的定義為:「人工智慧訓練師,是通過分析產品需求和相關資料,完成資料標註規則的制定,最終實現『提高資料標註工作的品質和效率』以及『積累細分領域通用資料』的價值,從工作流和工作難度等角度看,它介於資料標註和AI產品經理之間。

據說,AI訓練師是由BAT (百度、阿里巴巴、騰訊)某部門在2016年時創造出來的,但到了2020年才正式成為一門職業。不過,早在2017年10月12日,浙江省杭州市已發佈了關於公佈《杭州市專項職業能力考核項目(六)》的通知,明確了人工智慧訓練(初級、高級)的職業能力考核。在2019年中國國際貿易促進委員會商業行業委員會發布的《人工智慧訓練師職業能力要求》(徵求意見稿)中,更是明確的將AI訓練師區分為L1 ~ L5 五個等級,其中L1是最高級的,需要在相關領域有超過8年工作經驗。

在台灣,訓練AI 設備、系統的人員尚沒有正名,就筆者在104人力銀行所見,有人工智慧演算法工程師、人工智慧系統應用程式開發工程師、人工智慧應用工程師、人工智慧研發工程師、人工智慧應用後端工程師……等等,都是以工程師為主, 訓練AI可能只是其工作的一部分。所以,也可以說目前台灣很少AI公司或是公司的AI部門有專門訓練AI系統或設備的部門及職位。

然而,在中國除了正名之外,工作內容也是很明確的,《報告》指出AI訓練師工作職責主要有3大項:

  1. 提供資料標註規則:通過演算法聚類、標註分析等方式,從資料中提取行業特徵場景,並結合行業知識,提供表達精準、邏輯清晰的資料標註規則,最終確保資料訓練效果能滿足產品的需求;
  2. 資料驗收及管理:參與模型搭建和資料驗收,並負責核心指標和資料的日常跟蹤維護;
  3. 積累領域通用資料:根據細分領域的資料應用要求,從已有資料中挑選符合要求的通用資料(適用於同領域內不同客戶/使用者),形成資料的沉澱和積累。

仔細一看,這倒有一點像是大數據工程師。

與其他職位之差異

《報告》詳細分析了AI訓練師及AI產品經理與工程師之異同,人工智慧訓練師需要和AI產品經理討論需求,進而制定資料標註規則,並提出產品體驗優化建議,如圖1。在這裡,「優化」是很重要的關鍵字。試想一個服務型機器人一直沒有把服務做好 (例如點餐作業),這時候即必須不斷改進(資料標註規則)、不斷優化,AI機器人才能把服務做好。

圖1. AI訓練師及AI產品經理的合作關係 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)
圖1. AI訓練師及AI產品經理的合作關係 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)

人工智慧訓練師需要和資料標註人員緊密協作,管控好整個流程的輸入規則和輸出結果,及最終輸出標註準確的資料(供模型訓練)(如圖2)。

圖2. AI訓練師和資料標註的異同 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)
圖2. AI訓練師和資料標註的異同 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)

表1為人工智慧訓練師的工作流程,展示了人工智慧訓練師和資料標註、AI產品經理協作的工作流及其每個節點的交付物。不難發現,人工智慧訓練師在資料標註和AI產品經理之間,起到橋樑的作用。

表1. 人工智慧訓練師的工作流程 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)
表1. 人工智慧訓練師的工作流程 (資料來源:朱明德《AI新職位「人工智慧訓練師」》)


【詳細內容請見《北美智權報》262期;歡迎訂閱《北美智權報》電子報

相關新聞

低利率環境下 該如何有效運用資金?

雖然全球各國政府和央行們,會持續透過行政政策與貨幣政策,讓國家經濟朝好方向發展,但是實體經濟的復甦與成長通常相對緩慢,所以貨幣政策的刺激,很可能會引導房地產和證券市場領先上漲,漲多出現修正,修正後繼續上漲。長時間來看,股市、房地產、通貨膨脹都會成長,只是幅度有所不同,在超低利率的時代,人們應該好好把握這種有利於資產躍升的金融環境,不要輕易浪費了你的資產時間價值。

此役勝算幾何?特斯拉不滿加徵關稅 起訴美國政府要求退稅

2020年9月23日,據外媒報導,特斯拉將川普政府和美國貿易談判代表羅伯特·萊特希澤訴至美國國際貿易法院(U.S. Court of International Trade),請求法院判定川普政府對該公司從中國進口的部分零部件徵收關稅是不合法的,要求退還已經支付的關稅稅款,並賠償期間利息。

台灣房價合理嗎?

台灣房地產,相對於大部分的受薪階級,確實很貴,但貴不等於不合理,就跟所有日常商品一樣,有不同等級的價格,匹配不同等級的商品,房地產也跟商品一樣,甚至是高度資本化的金融商品,因為他跟金融市場掛勾非常深,本身是價格波動相對穩定的抵押品,同時又可以產生很大的資本槓桿,屬性完全就是金融市場的一項商品,汽車、珠寶、貴金屬、精品,價格穩定性都比房地產更差,房地產毫無疑問就是金融商品的一種,事實就是如此,要釐清台灣房地產的價格合理性,首先就是要認清房地產的屬性,因為地球上所有的商品都離不開經濟學原理。

大陸發佈「十四五規劃」 台商怎麼應對?

中國大陸在2020年底發布「十四五規劃」,2021年3月5日,十三屆全國人大四次會議審查了《國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要(草案)》。由於大陸現正面臨人口紅利不斷流失、大規模舉債導致投資效率偏低,以及新冠疫情與美中貿易戰擴及科技領域,加速跨國供應鏈遷出,在內外壓力下,「十四五」規劃比過去幾年更重視穩定與創新轉型。

是嘲諷還是侵權?從LV與LG旗下公司爭執一案看戲謔仿作

嘲諷(parody)或稱戲謔仿作,與智慧財產權侵害往往僅是一線之隔,如何畫下那道界線,全端賴法院的判斷。繼279期討論美國法院的商標嘲諷判決後,本篇以LV與LG旗下公司之侵權爭議為例,回頭瞭解我國智慧財產權法院如何處理商標與著作嘲諷問題,以及一、二審判決結果為何大不同。

陡生變局:全球通信專利許可 愛立信優勢不再 小米等反客為主?

三十年河東,三十年河西。全球通信技術領域的專利許可格局,正在悄然發生變化。一方面,4G時代達成的全球專利許可協議相繼到期,融合了5G專利的全新協議需要重新達成。包括愛立信(Ericsson)、美國科技公司InterDigital等在內的眾多通信專利巨頭,都需要重新與包括華為等在內的眾多合作夥伴重新簽署全新的合作協議。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。