對於大多數人來說,“大數據”還是一個陌生的術語,但它的威力已無所不在:信用卡公司追蹤客戶信息,能迅速發現資金異動,並向持卡人發出警示;能源公司利用氣象數據分析,可以輕松選定安裝風輪機的理想地點;瑞典首都斯德哥爾摩使用運算程序管理交通,令市區擁堵時間縮短一半……
牛津大學教授維克多·梅耶-捨恩伯格在其新書《大數據》中說,這是一場“革命”,將對各行各業帶來深刻影響,甚至改變我們的思維方式,但同時它也引發“數據暴政”的擔憂。
商業:提供“精准預測”
在一些公司、實驗室和政府機構,“數據”被捧為21世紀新型“石油”或“黃金”。一些統計學家、物理學家和所謂的數據科學家從中獲利豐厚,他們服務於大數據應用程序開發公司,“藍色彼岸”便是其中之一。
“藍色彼岸”成立於5年前,目前有85名員工。經理尤韋·魏斯介紹,公司利用自行開發的軟件,分析超市刷卡記錄、天氣資訊、學校放假信息和交通報告等數據,為客戶提供“精准預測”。他們的客戶包括德國郵購業泰斗奧托集團和dm連鎖藥店。
魏斯說,“藍色彼岸”的軟件不僅能從單條信息中分析出更多內容,而且能發現信息間關聯,對零售業極為有用,可以避免發貨出錯,最大限度降低庫存成本。
奧托集團說,自從使用“藍色彼岸”的軟件,銷售預測准確度提高20%到40%。它准備把該軟件應用推廣到公司運動品牌零售商SportScheck,並收購“藍色彼岸”50%股權。
“大數據正在重塑整個經濟,我們只是處於起步階段,”魏斯說。
醫療:開啟個性化治療
位於柏林巴伯爾斯貝格地區的哈索·普拉特納研究所(HPI)可能成為數以百萬計癌症患者的希望。研究所二樓的計算機房常年保持低溫,以免價值150萬歐元的處理器過熱。普通計算機只有1個處理器,但那裡的每台計算機有40個處理器,運算速度是傳統計算機的1000倍,甚至更快。
普拉特納是全球最大的企業管理和系統化商務解決方案供應商“思愛普”(SAP)創始人,也是HPI贊助人。他介紹說,HPI的漢娜數據庫技術始於一個名叫“Sanssouci DB”項目,由8個大學生創立,曾獲得創新大獎,如今已成為“內存儲處理”的代名詞。
HPI負責人、數學家克裡斯托弗·邁內爾認為,該技術不僅有廣泛的商業前景,而且為癌症治療提供機遇,“我們正站在個性化醫療的門檻上”。
邁內爾說,每一種腫瘤都不盡相同,這意味著同樣的治療方法對不同人會產生不同效果。目前,為了給患者制定有針對性的治療方案,需花費數月破譯其基因組。這並不奇怪,因為每個人有大約30億個DNA“積木”。但在HPI“超級大腦”的幫助下,破譯基因組只需要短短數秒。
此外,HPI的計算機可以從公共基因庫中精選所有信息,為每一個患者尋找到最合適他症狀的治療方案。“目前,這種搜索配對過程還需花費數月時間,”邁內爾說。
安全:助力抓賊反恐斗黑客
在美國加州聖克魯斯市一個地下車庫,一名小偷正在撬車,卻被幾米開外正在一輛車裡吃午餐的警察逮了個正著。這名警察並非“碰巧”出現在那裡,而是根據一個計算機軟件的推薦在此守株待兔。
過去兩年裡,這座城市的警察換班時,都會根據長官和軟件發出的指示外出巡邏。該軟件輸入了警方所有數據,不斷更新,用於計算何時何地可能發生夜盜、搶劫、偷車等犯罪行為,其中三分之二切實發生了。
這一軟件由計算機專家喬治·莫勒和從事犯罪學研究的人類學家傑弗裡·布蘭廷漢姆聯合編寫,參照了預測地震余震的程序模式。聖克魯斯警察局副局長史蒂夫·克拉克於2011年偶然得知這一創意,三人共同開展了一個測試項目。他們把聖克魯斯市8年來的犯罪記錄輸入程序,再加上其他潛在相關數據,比如天氣狀況、公園資訊和公交線路等。
“起初,很多人持懷疑態度,包括我自己,”克拉克說,“但數據本身證明其確實有效。”據他介紹,使用犯罪預測系統一年後,夜盜案件減少11%,盜車案件減少8%,破案率大幅提升56%。
除警察局外,軍隊和情報機構也非常重視數據分析。比如,在搜尋本·拉丹的過程中,“大數據”就發揮了重要作用,正是數據庫分析讓調查人員把目光聚焦在巴基斯坦的阿伯塔巴德。
Splunk是情報界和軍方炙手可熱的軟件供應商,總部設在舊金山一家舊香腸工廠裡。不久前,在科技記者評出的全球最具創意的公司中,Splunk名列第5,而谷歌僅列第11位。全球超過90個國家的政府、機構、企業在使用Splunk的應用軟件,包括美國五角大樓和國土安全部。這家公司分析、破譯來自各種機器的數據,包括手機信號塔、空調、網站服務器和飛機等。Splunk產品部高級副總裁圭多·施羅德說,分析渦輪機提供的數據有助於最大程度降低燃油消耗,優化維修間隔期。
“安全領域是‘大數據’應用增長最快的領域之一,”施羅德說。除對付犯罪和恐怖主義外,Splunk的軟件還能查明黑客攻擊等網絡犯罪。
警惕“數據暴政”
個性化服務是“大數據”應用程序魅力所在。比如,如果有人在“臉譜”上表示“喜歡”某款牛仔褲,當他下次進入該店鋪時,就可能收到店主給他發送的同品牌牛仔褲的打折信息。看起來,這對零售商和消費者都有好處,但主張保護數據隱私的人卻認為,“大數據”理念其實與“專制獨裁”沒有區別。
為消除人們顧慮,許多公司強調他們收集、儲存、分析數據都是“匿名”,但事實上可能並非如此。在線期刊《科學報道》近期一項研究顯示,每個人有自己的行動模式,95%的人可能被識別。普林斯頓計算機科學家阿爾溫德·納拉亞南在其博客上說,可供分析的數據越多,就越不可能保持“匿名”,識別一個人只要33個字節的信息量。
在現代社會,一個更加迫切的問題是:人們是否真的願意接受一個“數字驅動經濟”的世界?在這個世界裡,數據分析能預測你的孩子在學校表現如何,他將來適合怎樣的工作,誰有多大幾率犯罪或得癌症,電視台和唱片公司能根據預測迎合觀眾或聽眾的口味……但在這個一切都計算好的世界裡,創意、靈感和驚喜在哪裡?
互聯網哲學家葉夫根尼·莫羅佐夫對許多“大數據”應用程序背後的意識形態提出尖銳批評,警告即將發生“數據暴政”。他提出,那些“大數據”應用程序應當接受獨立審計人定期審查,以防權力濫用。
“大數據”行業巨頭谷歌的一次不經意行為,顯示了人們對“數據暴政”的警惕。谷歌董事長埃裡克·施密特說,公司在2010年曾閃過這樣一個玩笑想法:通過數據分析預測股票價格,但後來放棄了,因為公司高管認為,這可能不合法。
但他沒有說,這是不可能的。
1