A.I人工智慧/大數據機器學習

分享

在前幾年其實這幾個名詞非常的夯,引領風潮,全世界都在瘋狂,因為AlphaGo 打敗了無數個圍棋高手,開始炒熱機器學習。有人也許好奇,AlphaGo的技術不就是人工神經網路嗎,他的概念由來已久,至少不是現在才橫空出世的新技術,那麼為何深度學習為何遲至今日還未發光發熱呢?我在之前「機器學習筆記-人工智慧 X 股市預測」這篇也講個類似的問題。原因很簡單,數據資料收集的普及化(大數據)以及硬體的成長(GPU 的開發)。要做好深度學習,就得訓練網路、調整網路,以影像辨識為例,過程中便可能需要輸入成千上萬,甚至數以百萬、千萬或上傳張圖像,不斷優化調整神經元的輸入權重,提高辨析圖像的精準度。但那怕是最簡單基本的神經網路,亦需採用大量運算資源,過往如果以CPU 加上顯卡來推動此事,顯然力有未逮,當然顯現不出好成果,直至近年來GPU 平行運算技術益發成熟精進,才使這項技術有爆發性的成長。

然而在大家著迷於大數據跟機器學習時,不知道讀者對於這三個名詞的認知在哪呢?我們在這邊稍微跟大家解釋一下。

人工智慧 Artificial Intelligence

人工智慧(Artificial Intelligence),大家現在腦袋想的是不是一台機器人,他如果擁有人工智慧的話,就能夠自己判斷許多事情,並且取代人類的所有工作或者當成我們的朋友,像是「星際大戰」裡的 C-3PO 或者R2D2,廣義的人工智慧定義中,時常會被電影拿來當題材,但我們必須認定一件事,至少目前還做不到,而且還非常遙遠。

圖片來源: Janson_G (pixabay.com)
圖片來源: Janson_G (pixabay.com)
分享

回到1956 年夏天的那場會議(達特矛斯夏季人工智慧研究計劃),人工智慧領域先驅們的夢想是機器不僅能夠獨立思考,總有一天電腦可能會超越人類。現在已經是2019,前輩們的夢想現在雖然還達不到,但也許正往那條路邁進吧!那麼我們現在的技術能做些什麼呢? 我們來看一下「狹義人工智慧(Narrow AI)」的概念,像是機器在處理特殊任務之際,判斷的表現會如同人類一樣好、甚至是更好的技術。運用狹義人工智慧的例子有影像分類與人臉識別。增進「狹義人工智慧」還有應用這項技術,反而是現在多數科學家在做的事,畢竟這項技術能夠輔助人類很多,像是醫生會用電腦運算,來輔助診斷、金融業用電腦運算,來做決策等等,總之「狹義人工智慧」有點像是人類把一些規則跟標準定好之後,讓機器自己去做判斷,讓他做到「像人」一樣的思考判斷。

稍微解釋完「廣義」跟「狹義」二種人工智慧的定義之後,那我們看一下大數據又是什麼?

大數據 Big Data

大數據,又有人叫他巨量資料。大數據最白話的解釋就是我們每天隨時在產生的數據,從電腦、手機、行動裝置到感測器產生的資料,因為現在上述設備的普及,每天可能都有高達數ZB(zettabyte)的資料產生,因而取名大數據。只要公司、團體甚至個人網站透過合適的收集工具,就能儲存、管理和這些資料 — 取得先前無法想像的寶貴洞察。大數據紅的原因其實跟硬體的成長脫不了關係,因為收集起來的很多數據,無法分析也是白收集,因為硬體設備的快速成長,每個人都有許多手機,而且在使用應用程式、平台時,大家其實也沒什麼警覺心,常常資料就被收集過去了~~大數據的應用其實很多,我們來看看為什麼會需要大數據。

我們在上面剛講到人工智慧,要昇華成智慧,總要有個依據、判斷的根基吧,那大數據就是這一切的根基,從大數據中找到的精華,找到邏輯性,教給電腦,下面舉個例子。

Workday 23 他們推出一套軟體,他們先記錄了員工的薪水,還有每個區間(月份、年份)的調薪漲幅,然後就可以來預測員工的薪水漲幅和可能跳槽時間,幫助企業決定每名員工的加薪幅度、時間點和轉職時機。還有一款Ovia Fertility 36 的App,分析30萬名會員的數據,開發演算法,精準計算女生的排卵期,提高懷孕的機率,這個App 已幫助5萬名會員成功懷孕。其實我們生活中就很多大數據的例子,像是7–11,你們不覺得每一家的小七,擺放的東西其實都稍微不一樣嗎,他們會把該店,長期賣不太出去的東西,就不要給該店家進貨了。還有Nike 其實在xbox360 系列就開始收集大家的生活、運動數據了,透過這個數據,Nike 可以知道大家的年齡、身高、體重、運動習慣等等資訊,以此來建造他們更多的運動產品。這種生活周招簡單的案例,也是大數據的應用之一。

分享

大數據將全面影響每個人與每家企業。

對企業而言,大數據可望提升服務品質、增加管理效率、幫助決策和創造更多的價值。

對一般人來說而言,大數據可以是管理個人的工具之一,記錄自己的所有數據,讓人更了解自己的身體。

當你的生活一切都開始數據化,可以思考一下是好還是不好?那我們下面介紹一下機器學習

機器學習Machine learning

「機器學習」或許不是一個好名詞,容易令人困惑,或者馬上有人會提問,跟人工智慧差在哪邊?這邊把三個名詞都放進來,舉個簡單的句子:「機器學習」是一種學習方法,透過這種學習方式,讓電腦把「大數據」中的資料,學習透徹,並且成為一個良好的「人工智慧」。

機器不會主動閱讀資料來學習,所以這部分是我們人類來協助機器。機器學習在這30多年已經是一門多領域交叉學科,裡面包含了概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。所以其實要在這邊講得很非常詳細是不太可能的。想看專精的版本,也不是三言二語就能帶過。

總之機器學習主要是設計一個讓電腦可以自動「學習」的演算法。這個演算法能夠從資料中自動分析獲得規律,並利用規律對之後未知的資料,來進行預測的演算法。機器學習的執行包含了:收集資料、準備數據、 選擇模型、訓練機器、 評估分析、 調整參數、預測推論。

說了第三次,那大家知道為什麼「機器學習」會突然爆紅嗎XD,對!又是這個原因,就是硬體啦,在過去幾年裡人工智慧出現爆炸性成長,尤其是自2015年起, GPU的普極,使得平行運算的速度更快、成本更低,力量也更強…… ,講了第三次了,總之硬體的爆發,真的能帶給科技很多應用。下一個世代應該是5G吧,3D投影不是夢!

有興趣的讀者可以自己找找下面的名詞,可能會發現新大陸。

隨機森林、神經網路、梯度下降、監督式學習 、半監督式學習 、非監督式學習 、增強學習……。

也可以在下面評論、留言,大家一起進入神秘的資訊領域喔。

延伸閱讀
回應