北大新研究用數(shù)學(xué)模型揭網(wǎng)紅崛起奧秘,登上Nature子刊
【導(dǎo)讀】社交媒體上的「網(wǎng)紅」是怎樣產(chǎn)生的?在一項(xiàng)發(fā)表于《自然·通訊》的研究中,北京大學(xué)與瑞士蘇黎世聯(lián)邦理工大學(xué)領(lǐng)導(dǎo)的研究團(tuán)隊(duì)合作,通過數(shù)學(xué)模型揭示了「網(wǎng)紅」崛起之路。
社交網(wǎng)絡(luò)對(duì)我們生活的影響越來越廣:在信息傳播、新技術(shù)應(yīng)用、輿論營(yíng)造和形成中都發(fā)揮著關(guān)鍵作用。2020 年,推特用戶每天發(fā)送 5 億條推文,超過 8000 萬張圖片通過Instagram發(fā)布。
這些基于 UGC 的定向在線平臺(tái)在很大程度上影響了社會(huì),社交網(wǎng)絡(luò)用戶所能接觸到的信息和受眾,遠(yuǎn)遠(yuǎn)超出現(xiàn)實(shí)生活中的朋友。在這個(gè)過程中,一些用戶迅速獲得人氣,成為所謂的「網(wǎng)紅」。
這些追隨者眾多的「網(wǎng)紅」的社會(huì)影響力不可小覷。,已經(jīng)深刻影響了消費(fèi)者和公司在市場(chǎng)中的行為,2017 年,超過 70% 的美國(guó)企業(yè)聘請(qǐng) Instagram 網(wǎng)紅來推廣產(chǎn)品。
網(wǎng)紅是如何產(chǎn)生的?背后的機(jī)制究竟是什么?這些問題引發(fā)了越來越多學(xué)者的關(guān)注。
論文鏈接:
https://www.nature.com/articles/s41467-021-27089-8.pdf
近日,由北京大學(xué)、瑞士蘇黎世聯(lián)邦理工大學(xué)領(lǐng)導(dǎo)的研究團(tuán)隊(duì)就從數(shù)學(xué)模型角度,對(duì)社交網(wǎng)絡(luò)上的「顯著影響者」,即「網(wǎng)紅」的產(chǎn)生和被用戶關(guān)注的機(jī)制進(jìn)行了分析。
這篇文章發(fā)表在近日出版的《自然·通信》上。
與 21 世紀(jì)頭十年蓬勃發(fā)展的 Facebook 和 LinkedIn 相比,當(dāng)今最流行的平臺(tái),例如 Twitter、Instagram 或 TikTok,表現(xiàn)出一些其他明顯的特征。
最明顯的區(qū)別之一是,這些新的在線社交平臺(tái)屬于定向網(wǎng)絡(luò),也就是說,不需要雙方同意,也可以按照算法推薦建立關(guān)系。
新網(wǎng)紅是如何產(chǎn)生的?
從直觀上,質(zhì)量更好的 UGC 更有可能吸引用戶,情感價(jià)值更高,更容易成為「網(wǎng)紅」。 但研究表明,除了少數(shù)模型之外,其他領(lǐng)域的「網(wǎng)紅」產(chǎn)生規(guī)模效應(yīng)的研究更加集中社會(huì)經(jīng)濟(jì)方面,忽略了 UGC 的影響。
之前闡釋網(wǎng)紅誕生機(jī)制的模型,基于「優(yōu)先依戀」模型。不過這種「富人會(huì)越來越富」的理論,并不能證明新的 Instagram網(wǎng)紅崛起的原因,很多網(wǎng)紅在成功之前都是沒什么名氣的。
「內(nèi)容為王」:生成內(nèi)容質(zhì)量更高
文章提出了一種簡(jiǎn)單但可預(yù)測(cè)的網(wǎng)絡(luò)形成機(jī)制,結(jié)合了功利原則和 UGC 質(zhì)量。 研究假設(shè)用戶有共同的興趣,并將他們與定義其 UGC 質(zhì)量的屬性相關(guān)聯(lián)。
為了定義基于 UGC 的形成過程,研究人員收集了Twitter 數(shù)據(jù)集,分析連接的時(shí)間序列,發(fā)現(xiàn)有證據(jù)表明,網(wǎng)紅的形成過程源于個(gè)人對(duì)更好質(zhì)量的 UGC 的不斷搜索,并與關(guān)注者的興趣出現(xiàn)了「對(duì)齊」,即網(wǎng)紅與粉絲的興趣同質(zhì)性。
關(guān)注者的數(shù)量可以被視為網(wǎng)紅UGC質(zhì)量的agent。按照UGC質(zhì)量降序給agent進(jìn)行編號(hào)。agent1被視作UGC質(zhì)量最高,agent2質(zhì)量次之,以此類推。
對(duì)于agent i,計(jì)算出新連接比之前連接的中位數(shù)排名更高(在排名中)的可能性。
研究結(jié)果與假設(shè)吻合,按照被關(guān)注可能性評(píng)估,關(guān)注者始終在追尋UGC質(zhì)量更好的網(wǎng)紅。
研究數(shù)據(jù)與純隨機(jī)結(jié)果(淺藍(lán)色)的比較,二者在統(tǒng)計(jì)學(xué)上差異顯著。
齊夫定律
齊夫定律(Zipf"s law)是由哈佛大學(xué)的語言學(xué)家喬治·金斯利·齊夫于1949年發(fā)表的實(shí)驗(yàn)定律。它可以表述為:在自然語言的語料庫里,一個(gè)單詞出現(xiàn)的頻率與它在頻率表里的排名成反比。
所以,頻率最高的單詞出現(xiàn)的頻率大約是出現(xiàn)頻率第二位的單詞的2倍,而出現(xiàn)頻率第二位的單詞則是出現(xiàn)頻率第四位的單詞的2倍。
實(shí)驗(yàn)證明,本研究中的模型也遵循這一縮放定律。
網(wǎng)紅粉絲的「重疊」
分析兩個(gè)網(wǎng)紅被同一個(gè)第三個(gè)用戶關(guān)注的概率也是一個(gè)有趣的問題。 換句話說,目標(biāo)是研究不同agent的粉絲集合之間的相似性。 這個(gè)相似性揭示了粉絲的共同興趣的存在。
為了驗(yàn)證模型,研究人員在Twitch上收集了三個(gè)數(shù)據(jù)集,這是一個(gè)流行的在線游戲平臺(tái),并成功驗(yàn)證了模型的正確性。
這表明,本文中的模型盡管形式簡(jiǎn)單,但已經(jīng)得出了幾個(gè)現(xiàn)實(shí)世界中影響「網(wǎng)紅」崛起的屬性。
如上圖所示,agent的粉絲在前 15 個(gè)節(jié)點(diǎn)之間的重疊結(jié)果和驗(yàn)證數(shù)據(jù)集對(duì)照。a圖平均數(shù)值結(jié)果是從模擬中獲得的,當(dāng)達(dá)到平衡時(shí),有 10^5 個(gè)代理。b圖來自與國(guó)際象棋類別相關(guān)的 Twitch 數(shù)據(jù)集結(jié)果。
未來方向
許多當(dāng)今最流行的在線社交網(wǎng)絡(luò)都在很大程度上基于 UGC。 此文分析了基于 UGC 的在線社交網(wǎng)絡(luò)的幾個(gè)宏觀特征。
此外,由于簡(jiǎn)單,該模型可以向不同方向擴(kuò)展,例如通過考慮不同的更新規(guī)則和社會(huì)學(xué)激勵(lì)加以豐富。另一種可能是引入多維質(zhì)量屬性,來應(yīng)對(duì)多種興趣的可能性。
該模型還可以適應(yīng)不斷增長(zhǎng)的網(wǎng)絡(luò)形成模型,用戶可以在不同時(shí)間加入,研究一些網(wǎng)紅的崛起和。在理想情況下,這些研究可以與不同平臺(tái)的實(shí)證分析相結(jié)合,比如在新一代中占主導(dǎo)地位的 Instagram 或 TikTok等。
未來,關(guān)于推薦系統(tǒng)在社交媒體平臺(tái)上的作用,及其對(duì)用戶行為的影響的初步結(jié)果,可能進(jìn)一步擴(kuò)展。用戶行為與平臺(tái)機(jī)制之間的相互作用,屬于一個(gè)廣泛、未探索的研究方向,可能會(huì)進(jìn)一步闡明數(shù)字化大趨勢(shì)對(duì)我們社會(huì)的影響。
參考資料:
https://www.nature.com/articles/s41467-021-27089-8#Sec2
https://www.groovypost.com/howto/instagram-tips-tricks
本文來自微信公眾號(hào)“新智元”(ID:AI_era),編輯:David,36氪經(jīng)授權(quán)發(fā)布。