“大數(shù)據(jù)扼殺熟悉度”的話題引發(fā)爭議已經(jīng)不是第一次了。被投訴最多的是電商、外賣和出租車。關(guān)于黑貓投訴大數(shù)據(jù)培訓(xùn)是騙局,仍有網(wǎng)友在2019年1月提交的投訴未處理。今年3月,復(fù)旦大學(xué)孫金云教授花費近5萬元乘坐出租車800次。
圖/微博投票
在網(wǎng)友對“大數(shù)據(jù)殺戮”現(xiàn)象表示不滿和譴責(zé)后,終于有了官方回應(yīng)。4月8日,唯品會、京東、美團(tuán)、餓了么、每日優(yōu)鮮、盒馬生鮮、攜程、去哪兒、如氣出行、滴滴出行等10家互聯(lián)網(wǎng)平臺簽署承諾書:“不哄抬物價,沒有數(shù)據(jù)優(yōu)勢?!?/p>
“我們的推薦算法不同于其他內(nèi)容平臺,我們根據(jù)不同人群的出行方式推薦最優(yōu)的出行路線和性價比最高的方式。推薦系統(tǒng)是不斷迭代的,不可能一下子解決所有問題?!?一位該領(lǐng)域的大數(shù)據(jù)算法工程師告訴坦克“”。
那么,這些算法是如何一步步融入我們的日常生活的呢?“推薦算法”對商家和用戶來說有哪些優(yōu)缺點?作為互聯(lián)網(wǎng)用戶,我們?nèi)绾尾拍茏畲笙薅鹊乇Wo(hù)我們的數(shù)據(jù)隱私?
1.算法讓你隱形
公司如何使用數(shù)據(jù)算法讓你“一目了然”?
“(企業(yè))通過算法和平臺未明確說明的行為來猜測用戶的秘密,例如購物興趣和其他行為興趣。通過行為猜測一個人的興趣或購物傾向的概念并不新鮮。他們會猜測和對方交談得到的信息,以及他們穿的衣服,他們稱之為‘霸皇’?!?《計算廣告》作者劉鵬在科普視頻中生動地解釋了推薦算法的基本邏輯,而他的另一個身份就是知乎的大V“北冥程海生”。曾在一家科技公司負(fù)責(zé)大數(shù)據(jù)實現(xiàn)相關(guān)業(yè)務(wù)。
除了科技圈專業(yè)人士的意見,學(xué)術(shù)界的科研團(tuán)隊也進(jìn)一步驗證了推薦算法的“神算”。
2020年,孫錦云教授帶領(lǐng)20余人的團(tuán)隊,在北京、上海、深圳、成都、重慶等地進(jìn)行了800余場實地考察,花費了近5萬元的出租車費,得出了一個驚人的結(jié)論,那就是,用戶手機(jī)打車軟件分為三、六、九等。手機(jī)越貴,打車越貴。
大數(shù)據(jù)根據(jù)您使用的手機(jī)品牌判斷您的消費能力,甚至為您量身定制充電標(biāo)準(zhǔn)。這是成千上萬人的互聯(lián)網(wǎng)嗎?
圖/人民網(wǎng)官微
你認(rèn)為你的手機(jī)有多少電池是隱私?大多數(shù)人可能會說不。但實際上,電量反映了一個非常重要的信息——如果手機(jī)電量已經(jīng)充滿或者一直在增加,則說明手機(jī)處于充電狀態(tài),用戶很可能在室內(nèi)。
此外,手機(jī)中用來測量我們的步伐和判斷運動姿勢的傳感器陀螺儀可以判斷用戶的運動狀態(tài),無論你是走路、跑步、開車還是坐地鐵都逃不過它的“眼睛”。
“如果手機(jī)的電池一直是滿的,可以判斷是插在充電線上,從行駛的速度上可以判斷,而且這種狀態(tài)一天可以持續(xù)十個小時,那么可以判斷,這個人的職業(yè)是出租車司機(jī)?!?/p>
“再比如,你認(rèn)為手機(jī)系統(tǒng)有可能知道你的工作地點和家庭住址嗎?如果你想知道你去哪里上班,系統(tǒng)只需要每天十點對你進(jìn)行采樣如果它發(fā)現(xiàn)一個月有 20 天你都在同一個地方,那么你基本上可以確定你在哪里工作。同樣,如果你把采樣時間放在晚上 12 點,你可以得出你家在哪里的結(jié)論?!?劉鵬通過兩個簡單的例子說明了大數(shù)據(jù)是如何知道個人信息的。
從某種意義上說,今天的移動設(shè)備已經(jīng)成為了你的“器官”,你很難想象除了睡覺之外,你可以不帶手機(jī)出門的場景。由于它是一個器官,它可能會泄露你的很多隱私。畢竟手機(jī)上有很多傳感器,可以學(xué)習(xí)到很多個人信息,而一些獲取信息的方式也是非專業(yè)人士無法想象的。
“我想讓人們知道的是,他們在網(wǎng)上所做的一切都會受到監(jiān)控、跟蹤和評估。您所做的每一個動作都會被仔細(xì)監(jiān)控和記錄,直到您停下來。你看一張照片多久可以被記錄下來,”前高管杰夫在紀(jì)錄片《監(jiān)視資本主義:智能陷阱》中說。
算法可能比你更了解你自己。它了解您的情緒,無論您是內(nèi)向還是外向,并擁有您的所有個人信息。還有什么比這更可怕的呢?
2、落入“算法陷阱”
確實有人說算法推薦的東西更符合自己的心意,節(jié)省挑選的時間;但也有人說我們剛剛掉進(jìn)了“算法陷阱”。
讓我們首先看看算法如何更智能地了解我們的偏好并相應(yīng)地提出建議。
“你可以通過數(shù)據(jù)來判斷你是否是一個對價格敏感的人。以電商為例,很多賣家會在一個平臺上開十幾家店鋪,同一產(chǎn)品在每家店鋪的價格不同。算法會向你推薦你能承受的價格。不可能消除價格歧視,這違反了商業(yè)的本質(zhì)。只是意味著在互聯(lián)網(wǎng)的條件下變得更容易實現(xiàn)?!?劉鵬告訴坦克“”。
科技公司收集用戶數(shù)據(jù)后,會創(chuàng)建一個預(yù)測用戶行為的模型。數(shù)據(jù)越多,模型就越準(zhǔn)確。每個人在屏幕上進(jìn)行的每一次點擊,無論是點贊、不感興趣、點贊等,這些數(shù)據(jù)都會變成一個數(shù)據(jù)庫,從而塑造為您制作的模型。
畢竟在市場競爭中,一旦獲得更多的用戶數(shù)據(jù),做出更精準(zhǔn)的模型,公司就有機(jī)會占據(jù)更大的市場空間。
圖/A站《監(jiān)視資本主義:智能陷阱》紀(jì)錄片
“互聯(lián)網(wǎng)的推薦邏輯主要看你的目標(biāo)函數(shù)是什么,比如內(nèi)容推薦,是讓點擊率更高,瀏覽時間更長,還是讓用戶的滿意度更高,不同目標(biāo)函數(shù)的推薦邏輯會不一樣,不一樣。經(jīng)過不斷的正反饋,算法的準(zhǔn)確率會越來越高,推薦也會越來越準(zhǔn)確?!?劉鵬向坦克“介紹”。
互聯(lián)網(wǎng)的出現(xiàn)給很多人帶來了便利,但技術(shù)是一把雙刃劍。系統(tǒng)對你的了解越多,大數(shù)據(jù)向你推薦的東西就越準(zhǔn)確,這會讓你花更多的時間在他們身上。在應(yīng)用程序上,讓你越來越沉迷于手機(jī)。
對此大數(shù)據(jù)培訓(xùn)是騙局,目前流行的社交軟件也利用推薦算法來吸引用戶的注意力,最終讓用戶陷入“刷的越來越長”的狀態(tài)。
例如,社交平臺上的點贊和評論等短期信號可以給人心理上的滿足感。這種滿足感是對人的一種“獎勵”。得到獎勵后,人們會期待下一次。有更大的滿足感。這是人們沉迷于社交網(wǎng)絡(luò)的重要原因之一。
“美國青少年的抑郁和焦慮急劇增加,青少年自殘甚至自殺的人數(shù)急劇上升,10 至 14 歲女孩的自殘率增加了 151%。這增長模式指向社交媒體?!奔~約大學(xué)斯特恩商學(xué)院的社會心理學(xué)家海特博士說。這是整個社會落入“算法陷阱”的另一個方面。
1996年以后出生的孩子從初中就開始使用社交媒體,00后被稱為“互聯(lián)網(wǎng)原住民”。這些年輕人更熟悉網(wǎng)絡(luò)生活,更容易因網(wǎng)絡(luò)環(huán)境而焦慮、脆弱或抑郁。情緒。此前的調(diào)查顯示,很多年輕人都有“手機(jī)焦慮癥”。一旦手機(jī)不在手邊,他們就會陷入焦慮,不知所措。
在一定程度上,這種新型癥狀出現(xiàn)的原因之一是算法更能吸引人們沉浸在手機(jī)應(yīng)用中,讓人覺得“玩手機(jī)很開心”。手機(jī)讓人們的生活更加便捷,算法讓人們更加沉浸其中,最終人們離不開手機(jī)上的虛擬世界。
3.正確理解推薦算法
客觀地說,任何技術(shù)創(chuàng)新都離不開利弊并存,推薦算法也是如此。
“首先我們不能妖魔化它,如果你今天不能通過數(shù)據(jù)了解你的喜好,那么你收到的信息流就會很混亂,體驗會更差。人們擔(dān)心隱私被利用,但使用數(shù)據(jù)的目的實際上只是為您提供個性化的內(nèi)容和廣告,用戶實際上并沒有任何損失,平臺也不會拿出您的數(shù)據(jù)進(jìn)行交換或出售。從經(jīng)濟(jì)利益的角度來看,他們做這些事情是不值得的。產(chǎn)出比例不平衡?!眲Ⅸi從企業(yè)的角度向坦克解釋道。
事實上,我們國家對數(shù)據(jù)的使用有一定的標(biāo)準(zhǔn),有些界限是不能觸及的,比如用戶的電話號碼、E-mail和身份證號碼。對于很多人來說,數(shù)據(jù)泄露的風(fēng)險并不是來自這些大平臺,而是可能發(fā)生在一些小平臺,或者公司內(nèi)部的個人身上,比如可以看到數(shù)據(jù)的員工,從數(shù)據(jù)庫中偷偷你的快遞地址。倒出來賣掉。
“不可能通過法律法規(guī)徹底解決數(shù)據(jù)保護(hù)問題,更多地依靠技術(shù)手段,比如對核心領(lǐng)域進(jìn)行加密,保證內(nèi)部工程師看不到數(shù)據(jù)信息?!?劉鵬告訴坦克“”想要真正解決數(shù)據(jù)保護(hù)還是要靠技術(shù)手段。目前,在數(shù)據(jù)安全保護(hù)問題上,BAT等公司都有團(tuán)隊在做相關(guān)加密技術(shù)的研發(fā)。
/ 網(wǎng)絡(luò),基于 VRF 協(xié)議
另外,還有一個困擾大家很久的問題——應(yīng)用真的聽我們的嗎?這是推薦算法的一種手段嗎?
“這個原則上是可以的,但是實用性很差。如果軟件要24/7聽,需要在App里面開啟錄音功能,耗電很大,你的手機(jī)很快就沒了電,我個人認(rèn)為是不可能的,如果是文字和輸入法,還是可以的。” 劉鵬從專業(yè)的角度為我們解答了這個問題。如果用戶仍然擔(dān)心這個問題,可以考慮在手機(jī)設(shè)置中關(guān)閉某些軟件的麥克風(fēng)權(quán)限。
另外,很多用戶對電商平臺的推薦算法還有一個疑問——為什么我們買的東西還是推薦?算法不知道我們已經(jīng)購買了該物品嗎?這是否表明它不夠聰明?
“其實這是因為很多用戶的重復(fù)購買率很高。從技術(shù)上講,平臺很容易讓算法停止推薦用戶已經(jīng)購買過的東西,但從利潤的角度來看,重復(fù)建議非常有效。” 劉鵬對客人說“”。
本質(zhì)上,數(shù)據(jù)和算法本身就是為了讓平臺更精準(zhǔn)的推送給目標(biāo)用戶,讓用戶有更好的體驗,但在技術(shù)發(fā)展的過程中,難免會遇到各種情況。也會根據(jù)不同的需求制定不同的推薦邏輯。
也許一個算法會導(dǎo)致社會兩極分化,甚至讓你被操縱,無法擺脫算法為你打造的模型,落入“信息繭”。但在一定程度上,算法也在便利我們的生活。
我們真正需要的是科技行業(yè)開發(fā)更好的技術(shù)手段來規(guī)避現(xiàn)有問題,而制定和運行算法的人對其行為有更高的道德要求,而政策法規(guī)對人們的數(shù)據(jù)安全有更嚴(yán)格的規(guī)定來保護(hù),用戶可以有更廣闊的視野和獨立思考的能力。
可以看出,這仍然是一個全社會的問題,需要大家在探索的同時,共同努力提高。正如人們提出的大數(shù)據(jù)殺戮問題一樣,它也有被解決和優(yōu)化的可能。歸根結(jié)底,我們希望在未來看到的只是推薦算法不僅更智能,而且更良性。
*文中題圖來自:Photo ,基于VRF協(xié)議。