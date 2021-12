近年來隨著網速提升、運算能力的提高、物聯網技術的成熟,我們每天都在製造和儲存非常龐大的數據量,促使大數據的應用越來越多面。

文‧劉虹君

何謂大數據﹖大數據(Big Data),稱為巨量資料,其概念是過去十年廣泛應用於企業內部的資料分析、商業智慧(Business Intelligence)和統計應用之大成。現在的大數據不只是資料處理工具,它是一種企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟體技術進化和雲端環境成熟等客觀條件成立,讓資料分析從過去的洞悉歷史進化到預測未來,甚至是破舊創新,發展新的商業模式。

大數據的定義是Volume(容量)、Velocity(速度)和Variety(多樣性),再加上Veracity(真實性)和Value(價值)兩個V。無論是幾V,大數據的資料特質和傳統資料最大的差異是資料來源多元、種類繁多,大多是非結構化資料,而且更新速度非常快。

大數據的價值是數據的真實性

要用大數據創造價值,必要條件就是數據的真實性。大數據的標準定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準。大企業如eBay、亞馬遜或AT&T等大型電商或許符合大數據的標準。但其實資料量只是大數據的其中一個面向,大數據揭示的是一種「資料經濟」的精神,而非只是「大」。

企業真正要尋找的是非傳統的、且未曾被挖掘過的資料,並從中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小,只要能從看似毫無意義的數據礦坑中挖掘出金礦,有誰會在意那座礦坑原本的大小呢?大數據這個名字容易讓人誤導,因為真正重要的是其中的大智慧。

無所不在的大數據威力

凡走過必留下痕跡

互聯網、社交網站、網購等已經是很多人生活的一部份,無可避免地我們有越來越多的重要個人資料,包括姓名、地址、電話、生日日期、證件號碼、信用卡資料,以致社交網絡、個人喜好、購物習慣、行為等,被不同的機構收集、追蹤、保存,甚至販賣。

不少機構還會把我們的資料,與其他用戶的資料作比較、分析,然後作出預測性的營銷。電子商務網站Amazon的成功,這句 「Customers Who Bought This Item Also Bought」 背後的數據分析能力,居功不少。假如你有網購的習慣,商戶除了擁有你所有的基本個人資料、地址、信用卡帳號,還有你的購物記錄、瀏覽記錄等。透過對比你與其他顧客的資料,和分析你所購買的商品和其他商品的關係,商戶可以估計出你的喜好、預計你將會需要的物品,從而對你作出個人化的精準行銷。我常開玩笑說:充滿大數據的今天,網路商家甚至比你的家人更了解你。

大數據與警政聯手出擊

近年來,「大數據」除了運用在商業、管理與科技研發上,從「資料探勘」中掌握「大數據」,也擴大到打擊與預防犯罪的領域中。大數據增強科技辦案能量,讓犯罪無所遁形。

隨著網路犯罪的橫行,加上資安管理法通過,要順利偵破網路犯罪案件,後端必須要有強大的犯罪資料庫。警政單位在二○一八年開始陸續使用大數據工具和建置大數據分析平台,透過分析相關的犯罪手法,再輔以資深員警的辦案經驗,藉此提高警察的破案率。

預測一直是大數據的核心應用,當然也運用在偵查領域的預防及體現在對犯罪行為的提前感知上,即犯罪預警,預防是對犯罪最好的打擊。

除此,大數據能夠幫助偵查人員精確鎖定犯罪嫌疑人、擴展案件相關線索,並深入挖掘其他罪行。大數據精確型偵查能夠回應新常態下犯罪發展出的系列性、跨區域性、地域性趨勢,彌補過去偵查機關由於對資訊量不足、準確性低,所導致的破案率低、追贓少的不足。近年來許多假新聞,網路詐騙等案件偵破,大數據在偵查破案中的功勞也不可小覷。