Facebook「十年對比挑戰」背後:面部識別算法的隱憂與警惕 | 新商業情報

三聲2019-02-10 03:22:15

👆本號引起極度舒適,建議星標一下

目前流行於各大社交軟件的十年對比挑戰有可能被用於建立數據集,研究面部識別算法。


作者 | Kate O’Neill

出處 | Wired

編譯 | 王曦

來源 | 新商業情報NBT

(ID:newbusinesstrend)


如果你活躍於社交媒體,你可能已經注意到Facebook、Instagram和Twitter上正流行的一種趨勢——發佈自己十年前和現在的個人照片對比。

 

我並沒有加入其中,而是在Twitter上發佈了一條調侃的推文——十年前的我:可能會在Facebook和Instagram上參與類似的挑戰;現在的我:思考如何挖掘這些數據來研究面部識別算法的年齡增長和識別。

 

我的意圖並不是想説在網絡上走紅的東西就是危險的。但我知道,面部識別表明了一種人們應該意識到的趨勢——我們毫無保留地在社交網站上發佈個人數據的深度和廣度,這值得深思。

 

在那些對我的推文持批評態度的人當中,許多人認為,無論如何,這些數據已經存在。Facebook早就擁有了每個用户的的個人頭像。

 

他們當然有。在該十年對比挑戰眾多不同的版本中,人們被要求將自己的第一張頭像與當前的頭像放在一起,或者將一張10年前自己的照片與當前的頭像放在一起。所以,這些照片的確是存在的,而且在很大程度上是公開的。

 

那這些照片會如何被收集起來呢?

 

想象一下,你想要訓練一種面部識別算法來識別與年齡相關的特徵,更具體地説,是年齡的增長(例如,當人們變老時,他們看起來會是什麼樣子)。理想情況下,你需要一個包含大量人臉照片的數據集。如果你知道他們照片相隔的時間是固定的,比如説10年,那就好辦了。

 

你可以在Facebook上搜索個人資料圖片,查看其發佈日期或EXIF(可交換圖像文件格式)數據。但是這些圖片可能不會在最後被存入數據集。人們不會按時間順序上傳照片,並且許多用户的頭像不是他們本人的照片。

 

更何況,就Facebook上的個人資料照片而言,他們的上傳日期不一定與照片的拍攝日期匹配。由於用户可以掃描離線照片,照片上的EXIF數據在評估日期時也不一定是準確的。

 

多年來,他們可能多次發佈過一張照片。並且有些人會上傳在網上找到的圖片截圖。一些平台為了保護隱私會刪除EXIF數據。

 

而通過十年對比挑戰,大多數人都附上了照片時間(“2008年的我和2018年的我”),並在提供了更多關於這張照片拍攝地點和拍攝內容的信息(“2008年在某某大學,由某某拍攝;2018年到某城市參加的某某活動”)。

 

“十年對比挑戰”活動也曾在國內流行


通過這樣的方式,就可以建立一個非常大的數據集,收集10年前到現在人們精心整理的照片。

 

當然,在我的推文裏,還有其他反對的聲音。一些批評人士指出,垃圾數據太多,導致數據無法使用。但數據研究人員和科學家解釋説,與病毒式傳播的話題一樣,在人們開始具有諷刺意味地參與或試圖攻擊一個話題之前,通常早期的數據更真實、有效。

 

至於假照片,圖像識別算法非常複雜,足以識別人臉。如果你上傳一張貓的10年前和現在的圖片對比,此類樣本會被直接濾掉。

 

而Facebook方面否認參與了10年對比挑戰。Facebook的一名發言人迴應説:“這是一個由用户自己創造並捧紅的話題。Facebook並沒有開創這一潮流,而這一話題使用的是Facebook上已經存在的照片。Facebook沒有從中得到任何好處。更何況Facebook用户可以在任何時候打開或關閉面部識別功能。”

 

有人用你的Facebook照片來研究面部識別算法一定是件壞事嗎嗎? 不一定;在某種程度上,這是不可避免的。不過,更重要的結論是,我們需要在使用這些技術時考慮到我們生成的數據以及如何大規模使用這些數據。

 

良性的情況是:面部識別技術,特別是年齡增長,可以幫助尋找失蹤的兒童。去年,新德里(New Delhi)警方報告説,他們使用面部識別技術在短短四天內就找到了近3000名失蹤兒童。如果這些孩子已經失蹤了較長一段時間,他們看起來可能會和警方手上的照片略有不同,所以準確的年齡增長算法在這方面能起到很大的幫助。

 

而面部識別的用途大多很普通,年齡識別可能對於針對不同目標市場的廣告最有用。廣告可以通過攝像機或傳感器,根據不同年齡段的用户特徵(以及其他視覺上可識別的特徵)選擇播放不同的廣告。雖然這個用途不是一個重大突破,但它能使廣告更加個性化,與用户更相關。然而,隨着這些數據與我們的位置跟蹤、響應和購買行為以及其他信息合併在一起,它可能會帶來一些真正突破性的用户互動。

 

和大多數新興技術一樣,面部識別也有可能帶來令人擔憂的後果。總有一天,年齡的增長會成為保險評估和醫保的一個因素。比如,如果你比同齡人衰老得更快,你可能會被要求支付更多,甚至會被拒絕投保。

 

亞馬遜在2016年末推出實時面部識別服務後,開始向執法部門和政府機構銷售這些服務,比如俄勒岡州奧蘭多和華盛頓縣的警察局。但這項技術引發了重大的隱私擔憂——警方不僅可以利用這項技術追蹤涉嫌犯罪的人,還可以追蹤沒有犯罪的人,比如抗議者和其他警方想要調查的人。

 

美國公民自由聯盟(American Civil Liberties)要求亞馬遜停止銷售這項服務。亞馬遜的部分股東和員工也是如此,他們以對公司估值和聲譽的擔憂為由,對這項服務的銷售持反對意見。

 

不管這個十年對比挑戰背後的起源或意圖是什麼,我們都必須更清楚地瞭解我們創建和共享的數據、授予它的訪問權限以及其使用的含義。如果它確實是在為了研究年齡而增長收集的照片,那麼每個用户都有權利選擇是否參與其中,並清楚地知道誰應該訪問這些照片以及訪問的目的。

 

從任何一個網絡流行的趨勢,甚至任何一個社交平台的細節中,我們都能看到一個更宏觀的信息:對於世界上出現的大多數技術來説,人類是最豐富的數據源。人類是連接物質世界和數字世界的紐帶。我們的數據使得企業變得更聰明、更有利可圖。

 

所以,我們應該要求企業無論如何都要對個人的數據給予應有的尊重。當然,我們也要學會妥善管理自己的數據。



 爆料或尋求報道加微信號:Hoffman3056

  【商務合作加微信號:sansheng_kefu

點擊【下方圖片】 瞭解更多精彩文章
https://hk.wxwenku.com/d/109931706