這個夏天,因工作和城市的轉(zhuǎn)換,我有了一個悠長假期。我打算走一圈,并提前用手機百度做了詳盡的酒店攻略,結(jié)果卻有些狼狽——此后我的百度App首頁資訊冒出了很多酒店“艷事”,而且還被太太看到了。
結(jié)果,我一邊費勁地自證清白,一邊輸入一堆體面人物來沖刷。這場小風波,由軟件里一個叫“個性化推薦”的功能而起。它通過算法記錄我的閱讀行為,計算我的喜好,并認為讀懂我心。
“個性化推薦”是PC互聯(lián)網(wǎng)時代的產(chǎn)物,卻在移動互聯(lián)時代發(fā)揚光大。隨著Google、Facebook等巨頭從2005年開始陸續(xù)將其納入技術(shù)戰(zhàn)略,統(tǒng)一、標準化的互聯(lián)網(wǎng)信息傳播形式終結(jié)了。在此后十余年的進化中,推薦算法變得越來越聰明,幫助人腦極大提升信息獲取效率的同時,也帶來新的問題。
如今,個性化推薦技術(shù)在全球如日中天,包括中國。不但誕生了今日頭條等資訊巨頭,還席卷搜索、網(wǎng)購、娛樂、社交、理財?shù)葞缀跛谢ヂ?lián)網(wǎng)細分行業(yè)。
本文試著撥開這些榮光,還原我們被推薦算法“統(tǒng)治”后的信息環(huán)境真相,還將觸及技術(shù)過濾下“越開放越封閉”的矛盾共存。當然,這個問題很復雜。我先從以下三個問題入手——我確信對大多數(shù)人來說,它們存在已久卻從未被深入推敲。
我看到的信息真的越來越豐富?
誰在決定我看什么?
屏幕里的世界是真實的嗎?
離完全個人化的傳播不遠了
雖然我鐘情人文領(lǐng)域,卻不是一個技術(shù)悲觀主義者。相反,當我還在傳統(tǒng)報紙的時候,我就熱衷于用RSS訂閱提升工作效率,例如用一款叫“ZAKER”的聚合閱讀軟件。
后來我成了它的總編輯,隨后開始了一段1個月左右的不適,主要是思維方式上。關(guān)于“個性化推薦”,當時扎克伯格有一段有趣的答記者問。記者問:“為什么你這么看重News Feed(動態(tài)信息流)?”小扎說:“你對家門口一只瀕臨死亡的松鼠的關(guān)心,也許更甚于非洲難民?!?/p>
傳統(tǒng)新聞人可不是這么看,頭版編輯會毫不猶豫地選擇后者。職業(yè)新聞訓練讓他們追求最具真實性和公共影響力的資訊產(chǎn)品,并且過濾掉一些與大眾道德相悖的雜質(zhì)。
推薦算法動搖了這套穩(wěn)定運行了一個世紀的信息傳播模式。這讓轉(zhuǎn)型初期的我十分苦惱——某些常規(guī)判斷失效了,一條美食攻略或汽車降價消息會悄然爬上我的頭條,它們的影響力顯然不夠大,縱使還算符合我的興趣。
這里面可能有守舊的因素,但絕不是孤例。事實上,F(xiàn)acebook的News Feed的進化就是一部大眾反對史。從最初推出個人動態(tài)分享功能,到資訊按熱門排序,無不招致抗議——用戶認為前者涉及隱私,后者則違背他們“按時間順序閱讀”的習慣。
扎克伯格對此卻非常堅決。Facebook上平均每個用戶一天的新鮮事有1500條,但用戶只能看完其中的300條。如果讓Feed按時間排序,非常不利于用戶體驗。于是,扎克伯格和他的工程師們寫出EdgeRank算法[1],用以量化描述用戶的“興趣”并排序,2011年又全面轉(zhuǎn)向機器學習。
他的預(yù)見是正確的。人們漸漸不再反對了,還相當喜歡。如今News Feed也成為了日收4000萬美金的明星產(chǎn)品。在其2016年十周年慶典上,扎克伯格這樣自我打分——“改變了整個互聯(lián)網(wǎng)行業(yè)。”
“個性化推薦”首先是倒逼的產(chǎn)物,目的是解決信息過載。最早可追溯到1995年由卡耐基·梅隆大學推出的個性化導航系統(tǒng)“Web Watcher”。此后十年間,麻省理工、AT&T實驗室、IBM等著名機構(gòu)也加入其中,分別在廣告、銷售、搜索等領(lǐng)域各有建樹。
2003年,芝加哥大學法學教授凱斯·桑斯坦注意到這一趨勢。他于當年出版的《網(wǎng)絡(luò)共和國》一書中開門見山地告訴人們:未來某時,科技將能極大地幫助人類過濾他們的所讀所看所聽。我們現(xiàn)在習慣的報紙、雜志和廣播電視多已成為過去式。
“我們離傳播系統(tǒng)完全個人化的時代已經(jīng)不遠了?!鄙K固箤懙?。
誰在決定你的屏幕
14年后的今天,桑斯坦的部分預(yù)言正在實現(xiàn)。推薦算法得到廣泛應(yīng)用,除了資訊服務(wù),還為人們推薦商品、電影、音樂、美食、社交好友和旅游勝地。“你會有一種錯覺,最了解你的不是家人,而是手機程序?!蔽业呐笥延朴剖侵囟仁謾C依賴者,對此感觸良多,“好像整個世界都為你而轉(zhuǎn)?!?/p>
再說說三年前我轉(zhuǎn)型至互聯(lián)網(wǎng)的那個焦慮的夏天。幸而我的新同事都很熱心,幫我打破藩籬,給我講解推薦算法的原理。在那些精妙的流程圖中,我體會著大數(shù)據(jù)的藝術(shù),以及與機器相處的哲學。
黃仲輝是ZAKER的CTO,給了我最初的技術(shù)思維啟蒙?!八惴ㄊ且环N策略機制。具體到內(nèi)容推薦,影響因素變得異常復雜,因為更新頻率很高?!彼f,“通俗來講,要對用戶信息、行為特征、關(guān)聯(lián)規(guī)則、社交關(guān)系等有既精準又全局的理解和把握?!?/p>
這段話至少涉及兩類基礎(chǔ)算法:“基于內(nèi)容的推薦算法”和“協(xié)同過濾算法”。它們應(yīng)用最廣,也最典型。
前者在資訊閱讀領(lǐng)域有著基石般的存在。形象地說就是“你多看什么就給你推薦什么”。Feed流(信息流)是目前資訊和社交軟件最常用的展示方式,因直觀、簡單、高效等優(yōu)勢深受歡迎。若究其字面意思卻既形象又令人難堪——“飼料”,比喻像喂動物一樣填滿那些貪婪又懶惰的腦袋。
早期Feed流都是以Timeline(時間線)排序,最經(jīng)典的案例就是朋友圈。這種排序法易于理解且充滿極簡主義哲學。然而它的缺點也很明顯——呈現(xiàn)效率極為低下,如果更新量很大且不是強熟人關(guān)系,使用體驗將相當災(zāi)難。
于是,“重力排序算法”得以衍生,它是兼顧熱度和更新時間的綜合策略。它給內(nèi)容施加兩種力:“重力”和“拉力”。前者是時間,新內(nèi)容會把老內(nèi)容刷下去。后者則代表點擊數(shù)、評論、贊等“熱度”,又會把熱點內(nèi)容推上去。如此往復,用戶將看到一種“既新又熱”的動態(tài)平衡。
?基于內(nèi)容的推薦算法原理圖(來自“人人都是產(chǎn)品經(jīng)理”社區(qū))
“協(xié)同過濾算法”主要是基于人際關(guān)系和興趣關(guān)聯(lián)的推薦方案。例如“我很多朋友愛看NBA,我也極有可能喜歡籃球”,“讀王小波的人很有可能也喜歡喬治·奧威爾(對王影響最大的作家之一)”。
有趣的是,協(xié)同過濾最終不是在資訊而是在電商領(lǐng)域發(fā)揮了最大價值。“相比資訊,用戶購物偏好和商品種類都相對有限,推薦結(jié)果也就能相對精準?!秉S仲輝說。
那個被引用無數(shù)的“尿布—啤酒”的銷售案例就是協(xié)同過濾的經(jīng)典應(yīng)用。沃爾瑪分析消費者購物行為時發(fā)現(xiàn),男性在買嬰兒尿片時都會順手犒勞自己幾瓶啤酒。于是,兩種看似風馬牛的東西,通過大數(shù)據(jù)和算法,捆綁銷售實現(xiàn)效益最大化。
“絕大多數(shù)情況下,推薦算法不會單一應(yīng)用,而是多種算法的組合和優(yōu)化。”黃仲輝說。推薦算法在實戰(zhàn)中升級,進化得更為復雜?!爸悄芘判颉背蔀樾碌膶檭?。它具有更高級的機器學習能力,能更準確地預(yù)測“內(nèi)容價值”,從而實現(xiàn)一些更高級細分的功能,如 Facebook 屏蔽標題黨,知乎處罰抱團點贊等。
他們消失了
從傳播學角度看,推薦算法不僅迎合人們的行為,還符合人們的心理。“它為什么被接受且流行?”美國密歇根州立大學傳播學碩士江曉雅說,“這或許符合了人們的一種信息選擇機制——選擇性接觸?!?/p>
“選擇性接觸”指的是,人們傾向于接觸和他們的觀念相近的信息,回避和他們的觀念相左的信息。
技術(shù)和心理的合力讓真實的天平失衡,所有人的屏幕只是過濾后的結(jié)果。這種改變相當隱形,個體對其甚難覺察。
美國學術(shù)期刊《輿論季刊》刊發(fā)的一個調(diào)查表明,愛泡社交網(wǎng)絡(luò)和搜索引擎的人,意見更極化;另一份學術(shù)期刊《信息、傳播與社會》發(fā)現(xiàn),兩檔脫口秀的Facebook粉絲,很少有共同的信息來源。
美國人伊萊·帕里澤想驗證一下這些隱蔽的鴻溝。他請幾個朋友在Google同時輸入“埃及”,結(jié)果大相徑庭。
“丹尼爾(Daniel)的搜索結(jié)果首頁沒有任何埃及抗議活動的新聞,而斯科特(Scott)的則滿是這些。這可是當天的大新聞?!痹?011年的TED分享中,他為全球觀眾展示了這個小秘密。
Facebook也好不到哪去。帕里澤是美國左翼活動人士,號召更開放、多元、透明的互聯(lián)網(wǎng)環(huán)境,因而也關(guān)注了一些保守派人士的賬號,想聽聽不同的聲音?!暗幸惶?,我注意到, 我Facebook里保守派朋友的動態(tài)消息全都消失了,這讓我很吃驚。而且沒有任何人告知我。”
這些觀察被他寫進著作《過濾氣泡》,爾后這個書名成了流行詞。帕雷瑟用各種方式告誡人們,將信息判斷權(quán)交與算法后,看似省事兒,實則被包進了“信息繭房”,而它們正是封閉、分化、偏見的溫床。
“你的‘過濾氣泡’是你獨一無二的信息世界?!迸晾咨f,“氣泡中有什么,取決于你是誰,你做了什么。但你不能決定什么信息被通過,也看不到哪些信息被刪除。”
“算法帶來權(quán)力的轉(zhuǎn)移。更確切地說,是對信息的支配權(quán)從專業(yè)人士轉(zhuǎn)移到機器?!泵绹e夕法尼亞大學傳播學博士候選人方可成說,“算法成了新的權(quán)威?!?/p>
我們好像又回到了1915年
現(xiàn)在的Facebook和13年前那個起步于哈佛大學宿舍的社交工具相去甚遠,那些發(fā)發(fā)校園照片的小清新日子永遠回不來了。日活12億的體量讓其成為全球最具影響力的社交媒體,也成為最具破壞力的假新聞陣地——每一秒,News Feed的推薦機制都在海納百川,把真相,也把謊言分門別類、互不干擾地投給嗷嗷待哺的用戶。
然而,由于篤信自己算法的優(yōu)勢,F(xiàn)acebook在美國大選前開除了所有的熱點話題編輯。此后兩個月,它幾乎被假新聞掩埋。紐約時報稱,整個大選期間共125萬條假新聞飛揚,“推波助瀾者正是Facebook和Twitter之流?!?/p>
前總統(tǒng)奧巴馬也哀嘆:“它們被包裝得天衣無縫,以至當你在 Facebook 上看到它們時,會認為它們跟電視新聞一樣權(quán)威。”
由推薦算法制造的片面甚至虛幻的世界,帶來全面、客觀、中立、平衡等健康信息傳播形態(tài)的喪失。正如英國留歐支持者知道公投結(jié)果后深感絕望,希拉里的粉絲也在特朗普獲勝后毫無防備——他們在Facebook里完全不知道那群做相反選擇的人的存在。
“造成的最終結(jié)果之一,就是極大地影響了公眾對真正事實的探究,甚至集體做出錯誤的決定?!薄都~約時報》評價。
《華盛頓郵報》則對Facebook用戶做了抽樣調(diào)查,發(fā)現(xiàn)幾乎所有用戶的熱門話題是一則關(guān)于世界首例“男性生殖器移植”的新聞。由此可見。“獵奇+性”的超級組合,在Facebook的算法里也獲得極高的通行權(quán)限。
這是全球資訊低俗化浪潮的縮影。在中國,流量和用戶時間的爭奪異常慘烈,推薦算法在某種意義上已成為垃圾信息的引擎,大把謀殺數(shù)以億計人的時間。
Facebook無意承擔更多作為超級媒介的責任,它甚至不希望成為媒體。去年,工程師們調(diào)整了算法,降低專業(yè)新聞的權(quán)重。這意味著,用戶將獲得更多的碎碎念,而非經(jīng)嚴格流程生產(chǎn)的事實真相?!靶侣勈萘恕!盉uzzfeed[2]科技記者查理·瓦澤爾這樣認為。
這套新算法卻不盡如人意。2016年9月,挪威作家湯姆·艾格蘭發(fā)布了歷史照片《凝固汽油彈的女孩》。那個正遭受烈火之痛的越南小女孩赤身奔逃的畫面,是上世紀越戰(zhàn)最著名的瞬間,它還獲得普利策新聞獎。
但Facebook的算法把它刪除了,還順帶封了作家的號,挪威首相索爾貝格也轉(zhuǎn)發(fā)了此貼,結(jié)果也被干掉了——算法可能將此圖視為“兒童色情”。
Facebook CEO桑德伯格隨后寫信給挪威首相道歉。首相說,社交媒體不應(yīng)該將責任轉(zhuǎn)交給機器。
這和《過濾氣泡》作者伊萊·帕里澤在TED演講中的呼吁如出一轍?!拔覀儗⑦x擇權(quán)傳遞給了計算機算法,但問題是,它們并沒有人類所具備的道德精神?!保ㄎ?葉偉民)
◎關(guān)于作者
葉偉民,媒體人。畢業(yè)于蘭州大學核物理專業(yè)。曾任ZAKER總編輯,南方周末特稿編輯、記者?,F(xiàn)從事互聯(lián)網(wǎng),同時是多家平臺的簽約作者和寫作導師。
◎注釋
[1] EdgeRank算法:Facebook對新鮮事排序的算法。依據(jù)用戶對好友的動作計算分值,按總分決定事件的排序。該算法更多考慮人與人的關(guān)系因素,對內(nèi)容質(zhì)量較少干涉。
[2] Buzzfeed:美國的新聞聚合網(wǎng)站,2006年創(chuàng)建于美國紐約。
◎譯名對照表
凱斯·桑斯坦 Cass Sunstein
喬治·奧威爾 George Orwell
《輿論季刊》 Public Opinion Quarterly
《信息、傳播與社會》 Information, Communication & Society
伊萊·帕里澤 Eli Pariser
查理·瓦澤爾 Charlie Warzel
湯姆·艾格蘭 Tom Egeland
埃爾娜·索爾貝格 Erna Solberg
雪莉·桑德伯格 Sheryl Sandberg
亞伯拉罕·弗萊克斯納 Abraham Flexner
制版編輯: 許逸|
本頁刊發(fā)內(nèi)容未經(jīng)書面許可禁止轉(zhuǎn)載及使用
公眾號、報刊等轉(zhuǎn)載請聯(lián)系授權(quán)
copyright@zhishifenzi.com
知識分子為更好的智趣生活 ID:The-Intellectual