在2016年大數(shù)據(jù)展上,一人在試用VR設(shè)備。圖片來源:新華社 |
過去15年里,我們見證了大數(shù)據(jù)爆炸(這些數(shù)據(jù)來自互聯(lián)網(wǎng),社交媒體,科學(xué)設(shè)備,智能手機(jī),監(jiān)控攝像頭等等),以及涌現(xiàn)出的各種計算機(jī)數(shù)據(jù)處理技術(shù)。眾所周知,大數(shù)據(jù)無疑將促進(jìn)重要領(lǐng)域科學(xué)、技術(shù)和醫(yī)學(xué)的進(jìn)步??伤矔虮徽`用或濫用造成巨大風(fēng)險。
首先需要擔(dān)心的是,大量的數(shù)據(jù)并不等同于高質(zhì)量數(shù)據(jù)。比如說,據(jù)近期《自然》雜志報道,美國的選舉民意調(diào)查獲得有代表性的人口樣本越來越難,因為法律規(guī)定,他們目前只能通過呼叫固定電話進(jìn)行信息調(diào)查采集,但事實上越來越多的美國人更偏向用手機(jī)。即使我們能通過社交媒體搜集無數(shù)民眾發(fā)表的政治觀點,這些仍無法代表投票選民真實的意愿。事實上,推特和臉書上很多政治觀點都是電腦自動生成的。
按搜索結(jié)果來做聘用與晉升決策的大數(shù)據(jù)體系,很可能會對黑人不利,而原因僅僅是該候選人與大數(shù)據(jù)搜索結(jié)果中“此發(fā)型顯得人不專業(yè)”的各種圖片相匹配,這不過是把傳統(tǒng)的社會偏見體現(xiàn)在大數(shù)據(jù)上罷了。況且這種假設(shè)并非空穴來風(fēng)。去年,網(wǎng)絡(luò)新聞機(jī)構(gòu)ProPublica對累犯風(fēng)險模型進(jìn)行了研究并指出,我們所廣泛運用的為被捕犯人進(jìn)行判決的數(shù)據(jù)系統(tǒng),高估了黑人嫌疑人有罪的可能性而低估了白人的犯罪幾率。
大數(shù)據(jù)的另一風(fēng)險便是它易為人所操縱。人們一旦知道某個數(shù)據(jù)庫會用來做出對他們有影響的決策,肯定會費盡心思把衡量的天平傾向?qū)ψ约河欣囊环健1热缯f,如果按學(xué)生考試成績對老師進(jìn)行評估,老師便可能會相應(yīng)地調(diào)整策略,傾向應(yīng)試教育,有的老師甚至?xí)诮處熆荚u中弄虛作假。
與之類似的還有大學(xué)公職人員,為了提升自己大學(xué)在美國媒體或是世界大學(xué)排名的等級,做出了很多違規(guī)行為,比如挪用學(xué)術(shù)研究經(jīng)費投資高檔豪華健身房。更有甚者還做出了有違師德的行徑,圣瑪麗山大學(xué)為了提高學(xué)生保留率,在學(xué)校開學(xué)前幾周便找出了學(xué)校學(xué)習(xí)成績較弱的學(xué)生并令其退學(xué)。
要知道,如今大量可獲取的數(shù)據(jù)都含有私人信息,因此,大數(shù)據(jù)可能帶來的第三個風(fēng)險便是對個人隱私的侵犯。近年來,大量商業(yè)與政府網(wǎng)站的機(jī)密數(shù)據(jù)庫紛紛被盜;研究人員也表示,人們的政治立場甚至性取向都可以通過搜集平日網(wǎng)上發(fā)布的動態(tài)(比如影評)準(zhǔn)確分析出來——哪怕是人們匿名發(fā)布的動態(tài)也逃不脫。
最后,大數(shù)據(jù)在使用過程中缺乏明確的權(quán)責(zé)體系。因為對大數(shù)據(jù)分析出的具體結(jié)果無法作進(jìn)一步解讀,而且要是編寫該決策程序的相關(guān)人員拒絕提供該程序運作的具體細(xì)節(jié),那么一旦自己在大數(shù)據(jù)決策中受到了不公待遇,根本就申訴無門。雖然政府和企業(yè)可能出于警示不法分子的目的,聲稱這些大數(shù)據(jù)的決策程序是基于數(shù)學(xué)的科學(xué)方法,但是,就連政府和企業(yè)自己都對這種所謂的科學(xué)方法心存敬畏。歐盟近日通過了一項叫“解釋權(quán)”的措施,用以保證人們不受算法程序的誤判。
當(dāng)然,這項措施在實踐中是否有效可行,只有等待時間來告訴我們了。數(shù)據(jù)科學(xué)家凱西·奧尼爾在她近期著作《數(shù)學(xué)殺傷性武器》中指出,當(dāng)人受大數(shù)據(jù)迫害時卻求助無門時,對社會將產(chǎn)生深遠(yuǎn)的負(fù)面影響。
當(dāng)然了,大數(shù)據(jù)帶來的風(fēng)險是可以大大避免的。為了避免這些風(fēng)險,我們就要堅定保護(hù)個人隱私,監(jiān)測并糾正數(shù)據(jù)程序可能造成的不公推測,謹(jǐn)慎對待程序推算出的結(jié)論,嚴(yán)格跟進(jìn)算法內(nèi)部的運作和推算出決策的數(shù)據(jù)。
關(guān)于作者
恩尼斯特·戴維斯,紐約大學(xué)數(shù)學(xué)科學(xué)研究所計算機(jī)科學(xué)教授。
(編譯:羅玲敏 編輯:齊磊)