《Nature》最新研究:大數據預測你的偶像何時涼?

大數據技術2019-07-07 18:01:34

來自公眾號:HyperAI超神經


By 超神經


場景描述:最新發布在《Nature》子刊上的一篇論文《Quantifying and predicting success in show business》,通過蒐集分析影史依賴,一百多萬名演員的作品和發展數據,推算出影史演員的職業生涯發展特點,和個人的發展規律。


關鍵詞:量化數據    職業生涯發展   平均模型



最近一項發表在《Nature》子刊 Communications 中的研究引起了科學界和演藝界的廣泛關注,來自倫敦瑪麗皇后學院數學系的幾位研究人員,發佈了一篇關於《通過量化方法,預測演員事業發展週期》的文章。


這項研究的數據,蒐集了從有記錄開始,到 2016 年1月16日,在 IMDb 上 1512472 名男演員,和 896029 名女演員的職業生涯記錄。


其中最早的數據,可以追溯到 1888 年。在研究中,他們總結出了一些特徵,也很有趣,也很值得思考。


曇花一現:大部分演員的宿命


這是研究團隊,通過定量分析這些數據,得到的第一個結論:有大量的演員,只在自己職業生涯的開端有過作品,此後就是長久的沉寂。


他們也許有職業方向的調整,但也都因為在影視行業中,優質作品和優質角色,本身就是一種非常稀缺的資源。


奧斯卡獲獎作品《愛樂之城》講述了好萊塢演員夢


研究團隊認為,在演員的職業生涯中,90% 的時間是處於失業狀態的,並且只有 2% 的演員能夠通過演出報酬,來養活自己。


在分析演員的職業生涯中的累積財富時,也體現出了非常明顯的馬太效應,即羣體中的少數人手中,聚集着行業中絕大多數的資源。


研究發現影史上約有 100 多位男演員,他們集中了有史以來約 80% 的電影資源。


女演員的尷尬:全球影視業的通病


Annus mirabilis是在歐美文化裏的一個概念,直譯到中文語境裏就是「奇蹟時刻」,在一項學科獲得快速和重大突破的時刻,就稱為 Annus mirabilis


在本文中,也指一位演員的職業生涯最輝煌的階段,也有高光時刻的意思。比如 90 年代的趙薇,千禧年的 F4,他們的職業生涯裏都展現出了很明顯的奇蹟年特徵。


這項研究中,在統計和分析所有從業 20 年以上的演員作品數據後,發現了兩個特徵:


  • 男演員擁有更多的角色機會,而且一個男演員的演藝生涯裏的 Annus mirabilis 奇蹟時刻,可能出現在他職業生涯的任何時段;


  • 女演員不但在工作機會上,遠少於男演員,而且對於她們來説,演藝生涯的 Annus mirabilis 奇蹟時刻,對於大部分女演員來説,都只發生在年輕、職業生涯剛開始的時候。


如圖為該篇論文中的部分研究方法:

L:為演員職業生涯時長;

S:為演員有作品的年數,數量以每年 IMDb 的記錄為標準;

k:為該演員當年的作品數量;

n:為該演員的作品生產效率;


如圖片示例中是一名男演員,其職業生涯共計 L = 23年,並且在有作品的 12 年中(s = 12年中)累計有 17 個作品( n = 17 )。


可預測的奇蹟時刻:愛豆何時走花路?


這些研究結果,也不單單針對於羣體,在研究中通過百萬級演員職業生涯的數據,研究人員還定義出了一個平均模型:


如圖:

ξ(κ):表示計算年偏離奇蹟年的作品;

κ :表示與奇蹟年的偏離值;


這個模型,可以根據某個演員已經產生的數據,推算自己的奇蹟年。


也就是説,當我們想測算某個演員,還有多久可以到達自己的職業生涯巔峯,只需要根據 ta 之前的從業數據,套入這個模型中,來推算 ta 還有幾年到達、或者已經發生過了自己的 Annus mirabilis 奇蹟時刻


選秀節目出道的楊超越,帶來了「錦鯉」熱潮


如果算出 κ 的偏離值在 0 以下,則説明這位演員還有  κ 年就要大火!


如果 κ 大於 0,則説明這位演員,可能已經度過了自己的奇蹟時刻,未來將有可能進入平穩發展的階段。


據該研究的團隊表示,目前這個模型的準確率已經接近85%,團隊也希望能夠對演藝界有所參考。


數據量化的演員發展:瞎説什麼大實話


在娛樂圈,有一句話「小紅靠捧,大紅靠命,強捧灰飛煙滅。」描述演員的職業發展的規律,網絡中也有不少命理師,依靠給明星、商業大佬推算運勢,而被粉絲們關注。


命理師的推演也很有趣


無論是基於八字的命理推演,還是影視發展至今的歷史數據,都是遵循着自己學科體系下的規律和經驗,得出的暫時結論。


比如命理推算是推演出趨勢,而量化數據,則是歸納數據中表現出的某些特徵。但這些結論不等於結果,結論也不代表觀點。越發開放的平台和輿論環境,審美和要求都愈加提高的觀眾,才是對此最有評判資格的。


最終,一個演員職業生涯的成功與否,取決於個人的作品質量,這源於演員個體的努力程度,並不會受任何既定規律的限制。



參考內容:

[1].《Quantifying and predicting success in show business》2019.6月發表於 《Nature Communications》;

[2].《 Mathematicians work out how to predict success in show business》2019.6月發表於 ScienceDaily;


超神經數據集


Netflix 電影評價數據集


Netflix 數據集是一個有關電影評價信息的數據集。該數據集中包含隨機挑選的 48 萬 Netflix 客户,對 1.7 萬 部電影,超過 1 百萬 條評價,數據時間段為 1998.10 到 2005.11。


評價以 5 分制評分為基準,每部電影評價為 1-5 分,客户信息進行了脱敏處理。該數據集來自於 netflixprize,netflixprize 比賽旨在大幅提高有關某人根據自己的電影喜好欣賞電影的預測準確性。該比賽由 2006 年持續至 2011 年。


HyperAI 超神經蒐集並整理全球數百個公開數據集,還提供國內鏡像下載,對科研機構和開發者們提供免費服務。


更多有關影視信息的數據集,請訪問 https://hyper.ai/datasets 或點擊閲讀原文獲取。




●編號844,輸入編號直達本文

●輸入m獲取文章目錄

推薦↓↓↓

Linux學習

https://hk.wxwenku.com/d/201102234