-->
第六課:大數(shù)據(jù)的普及與深化對信息安全的侵害
在上一期跟大家談了談大數(shù)據(jù)、AI、人工智能、機器學(xué)習(xí)還有區(qū)塊鏈這些技術(shù)之間的一些聯(lián)系,這一次我想跟大家談一談大數(shù)據(jù)技術(shù)在普及和深化的過程中,會對我們個人和社會的安全所帶來的一些侵害。
首先我們要知道要了解一下大數(shù)據(jù)是怎么工作的,在2009年美國有一個HN1型的流感他爆發(fā)了,谷歌在流感大型爆發(fā)前提前大概兩周的時間就公布了一份論文,這份論文里面就在預(yù)測說美國將要爆發(fā)流感,在哪些地區(qū)將要爆發(fā)的更嚴(yán)重,谷歌的提交這份預(yù)測,比美國疾控中心要早的好幾個禮拜,這件事情其實引起了一個震驚。
其實道理很簡單, Google收集了2003年—2008年期間大量的用戶們在搜索引擎上輸入的關(guān)健詞,這些關(guān)健詞都是跟感冒跟流感相關(guān)的,這些關(guān)健詞在什么地區(qū)、什么時間會慢慢的突然出現(xiàn)等等,這個是谷歌通過搜索引擎收集的數(shù)據(jù)從而最早得知的。
美國疾控中心反而要更慢一些,因為它是在有大量病人進入醫(yī)院,醫(yī)院接待病人以后才得到這個數(shù)據(jù),但是一般流感病人不會在剛剛開始有癥狀的時候就去醫(yī)院,很多人都是一直堅持到實在不行了才會去醫(yī)院,因此谷歌能夠通過對之前全世界各個地方的所有的用戶他們相關(guān)與流感的和身體感受的這些情況貢獻的這些數(shù)據(jù)。
比如搜集口罩、洗手液等等,其實也跟流感是相關(guān)聯(lián)的,還有一些并不是特別直接相關(guān)聯(lián)的,比如說像在2000年還有大量的錄影帶的租賃店,關(guān)于租賃錄影帶消費的搜索量也增加了,也側(cè)面反映大家不想出門,要留在家里看電視等等現(xiàn)象,這些其實都可能跟流感的發(fā)生和流行是有一定的關(guān)聯(lián)度的。這是2009年大數(shù)據(jù)的一個經(jīng)典的案例。
經(jīng)過十年,現(xiàn)在大數(shù)據(jù)已經(jīng)被廣泛應(yīng)用在很多領(lǐng)域,而且很多數(shù)據(jù)公司都在特別努力的去收集所有的每個用戶全面的數(shù)據(jù),因為就像我們剛才講的,預(yù)測流感,不是只關(guān)注大家搜感冒藥這一件事兒,可能你還要關(guān)注大家的其他的很多特征和生活變化。這些變化可能都跟流感有關(guān)系,甚至說有的時候你都看不出來跟流感有什么直接的關(guān)系,但是統(tǒng)計學(xué)會告訴你說這些跟流感也都是有關(guān)系的。
比如說有一個案例,每一次美國發(fā)生臺風(fēng)或者颶風(fēng)這種特別惡劣的天氣狀況時候,在超市里的某一種餅干他就賣的很好,大家就不明白了,從關(guān)聯(lián)度上來講,當(dāng)然如果天氣很惡劣的話,大家就要在家里待著,對餅干的消費肯定就是增加了,這是沒問題的,
但是為什么在這種天氣惡劣的情況下就專門有某一種餅干比別的餅干賣的更好,但是在平時的時候也并沒有跡象證明,這個餅干更受歡迎,這種關(guān)聯(lián)度,是從哪兒來的呢?
這個時候用邏輯就很難給弄清楚了,你需要去觀察這種餅干,去品嘗它、看它的包裝,都很難直接找到一個邏輯關(guān)系,但通過大數(shù)據(jù)的收集、整理、處理你就會發(fā)現(xiàn)這個關(guān)聯(lián)度。
所以現(xiàn)在每一家數(shù)據(jù)公司都試圖去收集所有他能收集到的數(shù)據(jù),不像以前,比如說以前的時候我是做服裝的,我要收集的就是大家都喜歡買什么樣的衣服,這最直觀的一個數(shù)據(jù)關(guān)聯(lián)度,你要喜歡買什么樣的衣服的話我生產(chǎn)類似的衣服推給你廣告,但是現(xiàn)在,我不滿足只推送曾經(jīng)買過我衣服的人,我更希望能夠找出那些沒買過我衣服但是也有可能會買我衣服的人。這樣的話,我除了要搜索他之前買衣服的記錄,還得把這個人的生活信息全都收集到,這樣才能夠去做更好的數(shù)據(jù)分析,做更好的大數(shù)據(jù)的關(guān)聯(lián)性計算,這里就涉及一個概念叫做unionID:同一用戶。
在《網(wǎng)中人》小說里其實一直有提及,就是《網(wǎng)中人》小說里這個巨無霸公司,所謂的異文網(wǎng),這就是一個虛構(gòu)的互聯(lián)網(wǎng)大的互聯(lián)網(wǎng)公司,這個互聯(lián)網(wǎng)公司他其實有非常多的不同的應(yīng)用,他有地圖,他有網(wǎng)店,他有外賣,他有直播,他有各種各樣的APP,每一個裝了這些APP的用戶在使用這個網(wǎng)站的APP的用戶,他都在為異文網(wǎng)貢獻他的數(shù)據(jù)了,這個異文網(wǎng)內(nèi)部他試圖去做的一件事情是什么?
就是拼湊出同一個用戶,比如說你現(xiàn)在用一個APP在看網(wǎng)絡(luò)視頻,另外一個APP去做地圖搜索,第三個APP在做外賣,你用的這三個不同的APP上你都有三個不同的ID,這三個不同的ID未必就是完全一模一樣的名字?,F(xiàn)在很多互聯(lián)網(wǎng)公司試圖要做的就是要把這些不同的ID找出來,歸結(jié)到同一個人身上,從而能夠收集你全方位的信息。
這個拼湊其實也很簡單,也并不復(fù)雜,因為大部分的APP都會要求你提供電話、郵箱地址,或者你的裝在同一部設(shè)備上的這些應(yīng)用,他都能拼湊出來是同一個人在使用,這種對用戶進行全方位畫像其實是數(shù)據(jù)收集的一個最重要的方式,
在這種收集的過程中顯而易見人就變得更透明了,就變得更可預(yù)知,就像谷歌能夠預(yù)測流感一樣,互聯(lián)網(wǎng)公司也能夠通過對你的這個數(shù)據(jù)的收集和學(xué)習(xí)他能夠慢慢的了解你的規(guī)律,他可能能預(yù)知你下面要做什么事情,有的時候我們自己可能都不清楚我們下面的反映是什么,但是也許互聯(lián)網(wǎng)公司會比我們了解的更清楚,這其實是一件挺可怕的事情,也在給我們打開一個人把我們的防護和防衛(wèi)都給解掉了,打開了很多的軟肋能夠被別人利用或者侵犯的這些軟肋,這是一個很大的風(fēng)險。
還有沒有更進一步的風(fēng)險可能會存在的,比如通過人臉識別、數(shù)據(jù)的收集來對一個人的內(nèi)心世界進行的一個預(yù)測,這個概念雖然現(xiàn)在聽上去還是很新的一個概念,但是這個概念并不是純粹的不可能的。在《網(wǎng)中人》這個故事里,一開始的潛逃的這個老陳,他其實是動互聯(lián)網(wǎng)公司里面發(fā)現(xiàn)了一個問題,這個互聯(lián)網(wǎng)公司他其實在偷偷的收集每一個用戶手機的視頻的攝象頭的數(shù)據(jù),也就是觀察你的臉,把你臉拍下來這個數(shù)據(jù),同時還在收集手機力學(xué)數(shù)據(jù)。
什么叫力學(xué)數(shù)據(jù),就他的陀螺儀、加速劑等等,專門記錄他手機的角度,或者移動的速率等等,
是這些數(shù)據(jù),這些數(shù)據(jù)有什么用呢?本來手機公司收集這些數(shù)據(jù)是無償提供給任何的一個APP使用的,任何一個APP都可以隨時調(diào)取這些力學(xué)數(shù)據(jù),用處就比如說,你在使用微信搖一搖功能,你手機搖一搖,你的微信APP怎么知道你手機在搖呢?他就要調(diào)這些力學(xué)的數(shù)據(jù)。這些互聯(lián)網(wǎng)巨無霸公司收集每一個用戶的手機的這些力學(xué)數(shù)據(jù),目的其實是什么呢?
他能夠通過這個手機的力學(xué)數(shù)據(jù),他能夠推斷這個用戶他到底在觸摸這個手機上的哪個位置,因為咱們拿著手機觸摸的時候我們自己會感覺這個手機并沒有動,但是其實這個手機是發(fā)生了運動的,因為你只要一點擊他受力不平衡就發(fā)生很細微的微小運動,這種運動咱們可能察覺不到,但是手機里面的這些傳感器都能夠察覺到,
他們會把這些數(shù)據(jù)拿出來就跟你搖一搖的時候出現(xiàn)的那些數(shù)據(jù)是一樣的類似的,這個時候這個APP如果在暗中收集了這些數(shù)據(jù)之后,他一直在學(xué)習(xí)你的話,特別是他能夠通過攝象頭觀察你的臉,知道你現(xiàn)在正對著這個手機操作,以此來區(qū)分你是不是在對這個手機進行輸入的操作,或者說他只是放在你口袋里那個就是很隨機的在振動,他能夠把這個區(qū)分開來之后,他就能夠非常專門的來學(xué)習(xí)你在觸碰這個手機的時候點擊,刻意的點擊這個手機的時候發(fā)生的這些振動跟你輸入內(nèi)容這種關(guān)聯(lián)度。
如果他真的學(xué)習(xí)你的輸入習(xí)慣和輸入內(nèi)容以及這個手機力學(xué)數(shù)據(jù)變化的這些關(guān)聯(lián)度,他能夠計算的很精準(zhǔn)之后,這個APP即便是在后臺它也能夠發(fā)現(xiàn)你在其他APP輸入的東西是什么。比如你在使用網(wǎng)絡(luò)銀行的時候輸入的密碼是什么,你在你打開你的郵箱的時候使用的密碼是什么,或者說你發(fā)微信的時候發(fā)出去的那些信息是什么,它就可以識別出你在這個手機上的輸入的任何的東西,雖然是小說里的技術(shù),但并不完全是虛擬的,其實是有可能發(fā)生的,而且有一些公司就已經(jīng)在開發(fā)這類型的技術(shù)了。
你比如說像蘋果公司他之前的時候就是會把這些力學(xué)數(shù)據(jù)直接提供給各個APP使用的,也不需要經(jīng)過你用戶的同意,但是在我記得好象是去年年底或者是今年年初的時候一版新的IOS里面,操作系統(tǒng)里面他就會增加了一個設(shè)定,就是要求你所有的用戶想要去讀取手機里面的這些你所有的APP想要去讀取手機里的這些力學(xué)的數(shù)據(jù)的時候,必須得經(jīng)過用戶的同意,所以這也就證明說像蘋果公司這樣的他是手機的開發(fā)商,他是生產(chǎn)商他都沒有事先都沒有意識到他提供的這些數(shù)據(jù)可以被別人怎樣的利用,所以這個是這個技術(shù)的一種風(fēng)險,這也是說所謂的大數(shù)據(jù)和高科技在發(fā)展的過程中可能會出現(xiàn)的很多的風(fēng)險之一。
比如說我們現(xiàn)在每個人每天跟誰最親,誰看你的次數(shù)最多,肯定不是你的愛人,不是你的家人,而是你的手機,這個攝象頭就是手機的眼睛,你不知道你的手機里的哪個APP他其實正在調(diào)取你攝象頭的使用權(quán)限,他正在通過你的攝象頭觀察你,說不定有不少APP都在暗中不停的在觀察你,就跟我們大家都一直聽說的一些新聞,有一些APP在偷聽我們是一個道理,比如說你在平時從來沒有搜過一個產(chǎn)品,但是你提到,在跟朋友的聊天中提到的一些關(guān)健詞,你第二點就會在手機上收到這種產(chǎn)品的推送,這也挺可怕的,就說明那些APP他在偷聽你。
你的APP未來特別是到了5G時代,這個網(wǎng)速特別快了之后,你的手機是不是也在偷看你,這家互聯(lián)網(wǎng)巨頭就是異文網(wǎng)他的后面的操控者,他在收集了這么多的人臉的數(shù)據(jù)之后他想要做什么,他想要通過大數(shù)據(jù)的方式去學(xué)習(xí)每個人臉上細微的表情變化,這個細微的表情變化跟這個人內(nèi)心活動的一個關(guān)聯(lián),
比如說這個表情變化就意味著你喜歡這件事情,或者你討厭這個事情,我們有的朋友就說我非常的低調(diào),我平時不在朋友圈里評論,我不在任何地方評論,那我都把我了想法藏在我心里,我要不要去得罪人,你比如說我們都有這種體驗就是你刷朋友圈的時候會發(fā)現(xiàn)有的人怎么這么神經(jīng)病,每天發(fā)這種東西很反感,但是你肯定不會直接在下面評論說你是不是有神經(jīng)病,但是您的手機在觀察你,他可能通過你的這個表情的這些細微的變化他能發(fā)現(xiàn)你到底是討厭這個還是喜歡這個,因為我們自己夜里每個人在家躺在床上刷手機的時候肯定是不會掩飾自己的表情的,也不會去誤導(dǎo)我們了手機的用表情,
所以這個時候你是暴露無疑的,如果他觀察到了你內(nèi)心的變化,下一次的時候他再想得知你的想法的時候,即便你不發(fā)言也許都能夠通過你的這些面部表情來發(fā)現(xiàn)你內(nèi)心的感受,這其實是一個更可怕的一個應(yīng)用,當(dāng)然這是未來,這不是現(xiàn)在眼前就一直在普遍發(fā)生的,但我相信他也不是一個很遠的未來,因為現(xiàn)在咱們是處在一個新媒體的時代,并不是以前傳統(tǒng)媒體的時代,
這些媒體自媒體他可以根據(jù)你個人的喜好和習(xí)慣和他對你的了解,他你會喜歡的那個版本推給你,而不是事實真相的版本,這種情況就意味著什么,就意味著說我們每個人都會看到一個自己想看的那個版本的社會新聞,這件事情到底發(fā)生了什么其實我們不知道,或者說這個政客他到底是一個什么人,其實我們也不知道,我們就只知道人間希望我們喜歡他,所以給我們推了我們會喜歡他的那些事情,我們就擁護他,或者某一種政策,
這種政策的真相我們也不知道,我們只是人家知道我們會喜歡這個政策怎么樣去陳述他我們就會接受他或者喜歡他,當(dāng)這個大數(shù)據(jù)算法他能夠猜透你的內(nèi)心想法或者知道你的內(nèi)心感受的時候我們每個人都變成透明的,這個透明的一個風(fēng)險不止是說我們被人發(fā)現(xiàn),還更可怕的是我們可以被人洗腦,這個其實是在一個新媒體是在大數(shù)據(jù)時代一個更多的一個風(fēng)險。
由于時間的關(guān)系,我今天先跟大家聊這么多有關(guān)大數(shù)據(jù)時代的這個科技發(fā)展,他可能會對我們個人和社會的安全所帶來的侵害,下一期我想講一講,我們怎么樣作為一個普通人,我們有什么辦法能夠盡量減少這些風(fēng)險對我們的侵害,謝謝大家。
賬號合并
經(jīng)檢測,你是“鈦媒體”和“商業(yè)價值”的注冊用戶?,F(xiàn)在,我們對兩個產(chǎn)品因進行整合,需要您選擇一個賬號用來登錄。無論您選擇哪個賬號,兩個賬號的原有信息都會合并在一起。對于給您造成的不便,我們深感歉意。
Oh! no
您是否確認要刪除該條評論嗎?