圖像處理與深度信息識別:不同空間頻譜信息在深度知覺加工中的作用

三倉心理學界2019-04-12 23:25:48

薈萃心理學各領域新進展、新動態

來源 | 華東師範大學心理與認知科學學院官網


人們可以通過各種線索來識別空間中的深度信息。如上圖所示,即使對於2D圖像,我們依然可以使用包括透視、紋理梯度變化、遮蔽等一系列線索來評估圖像中各個位置的相對深度。然而一個更深入的問題在於,我們是如何使用這些信息的?如果我們真是基於特定的局部線索來完成深度知覺的,那我們的深度知覺就會很大程度上會依賴於特定的環境。在我們熟悉的環境中,我們會更善於找到有效的局部線索,從而幫助我們更好地加工深度信息。然而事實上我們的深度知覺並非十分依賴特定環境——人們在不熟悉的環境中也能基本準確地判斷深度信息。所以,是否存在另一種通用的機制,幫助我們用更加一般的規則經行深度知覺加工呢?這一問題一直受到相關領域研究者的關注。

       

在近日發表於Journal of Vision上的一篇論文中,華東師範大學心理與認知科學學院的陳中廷博士與其合作導師Jeffrey A. Saunders博士通過傅里葉變化的方法,評估了不同朝向的空間頻譜信息對於深度知覺加工的影響。

傅里葉變化是一種常見的信號處理方法,廣泛應用於信號過濾、圖像處理等各個領域。儘管先前的文獻並沒有對空間頻譜信息和深度知覺的關係做很多的探討,但如上圖所示,經過傅里葉變換後的各朝向頻譜特徵(右側方形圖所示)相較於原先的圖像,更凸顯了深度變化而造成的特徵差異,從而説明了理論上頻譜特徵可以被用於深度知覺的加工。


為了驗證這一問題,研究者採用了特殊的圖像處理方法,以控制不同空間頻譜信息對於深度知覺的影響(見下圖)。在不同的實驗條件下,特定朝向的空間頻譜信息被添加/除去,從而使研究者可以比較其對於深度知覺的影響。研究者通過數學建模的方法進一步指出,不同朝向的頻譜信息在知覺加工中的影響與貝葉斯理想觀察者模型(Bayesian Ideal Observer Model)所推測的優化整合過程一致,説明我們的知覺系統有效地整合了各種不同特徵的空間信息,從而從不同方面促進深度知覺這一過程。這一研究也幫助我們進一步認識到,人類的知覺加工與計算視覺研究中的特徵信息有着密切的聯繫,而並非是一個直覺的、啟發式的過程。對於深度知覺的研究將有助於我們認識自己,並促進相關計算機視覺及人工智能的發展。

論文信息:

Chen, Z. (陳中廷), & Saunders, J. A. (2019). Perception of 3D slant from textures with and without aligned spectral components. Journal of Vision, 19(4):7, 1-23, https://doi.org/10.1167/19.4.7.

本文內容來自網絡

不代表三倉心理學界觀點,如有侵權請聯繫後台

合作、投稿等請長按二維碼聯繫小編

https://hk.wxwenku.com/d/200014823