banner
学习与分享

您的当前位置:首页 > 新闻资讯 > 学习与分享

视觉感知——对轮廓检测重要性的实际理解

来源:未知 │ 发表时间:2023-04-26 | 浏览数:载入中...

正常图像
变色图像

图片上有个房子,如果改变图片对比度或者颜色,我们仍然可以确定并理解那张照片中是个房子。

但是,如果拍摄相同的图像并改变对象及其彼此的方向,那么将从根本上改变人们正在查看的内容。虽然我们倾向于根据颜色和照明来考虑视觉场景,但更重要的是物体及其相互之间的轮廓。

►1935 年,库尔特·科夫卡 (Kurt Koffka)指出,如果单独面向的元素对齐或共线组织,我们的视觉系统会将这些单独的元素视为属于一起。

格式塔心理学

科夫卡所描述的是所谓的“良好延续”——当这些元素共享特征时,我们的视觉系统将它们视为一个整体。这些视觉感知的准则或“法则”是格式塔心理学研究领域的基础。·自 1890 年代以来,研究人员一直在努力理解人类对格式塔的感知。有大量的研究和文献致力于理解格式塔原则以及我们如何解释和寻找轮廓。

波浪背景上的格式塔三角形图1(a)格式塔心理学原理的例子
格式塔例子图 1(b)格式塔心理学原理的例子

通过快速浏览图 1 中的图像,我们的大脑会自动为闭包示例 (a) 填充缺失的部分,并且我们可以根据地面 (b) 确定图形。人类视觉系统可以快速将图像组合在一起,而无需我们思考。

大脑研究/V1

大脑如何处理这些信息以使其遵循格式塔原则?

(点击打开查看大图)

►视觉皮层(也称为枕叶)位于头部后部,包含多个与视觉处理有关的区域。涉及视觉处理的前几位部分称为 V1,它具有专门的神经元,较针对非常特定的线条方向发出信号。

诺贝尔奖获得者Hubel 和 Wiesel 在他们的单细胞记录实验报告了这样的观点:只有当一条线的特定方向呈现在眼睛上时,单个神经元才会发送信号——如果线的方向略有不同,神经元就不会做出反应。

一旦这些对方向敏感或“调整”的神经元相互交谈,它们就会帮助我们建立对一个有凝聚力的世界的视觉感知。不同线路的信号加起来就是我们所看到的完整画面。

Gabor补丁

研究轮廓——我们的视觉系统感知到的线条——包括多种研究方法的实施。

图 2. 单个 Gabor 补丁示例

Gabor 补丁轮廓通常用作视觉科学中的刺激物,因为它们被认为是对 V1 方向敏感细胞响应的粗略估计(见图 2)。Gabor 补丁图像由正弦曲线制成,如图 3 所示。

图 3. 正弦波图像

Gabor 补丁看起来像黑白斑点,但实际上在研究中很有用,因为它们可以朝向任何方向,可以变大或变小,甚至可以改变对比度以测试视觉系统的响应方式。

这就是心理物理学研究真正发挥作用的地方,也是我们可以开始了解人类视觉感知的极限所在的地方。研究人员使用各种任务来提出问题,不较涉及我们对线条的视觉处理,还涉及我们在噪声中感知轮廓的能力。

图 4. 噪声中的 Gabor 补丁轮廓

当我们睁开眼睛时,我们都可以毫不费力地看到轮廓、线条和边缘。所以,了解视觉系统是如何工作的,可以让科学家们针对视觉系统不工作时出现的问题制定解决方案。


总之,通过格式塔原理,科学家们注意到人类视觉系统会自动将事物组合在一起,以形成一幅连贯的世界图景——如果您想了解更多关于用于研究视觉处理的主要方法,请留言联系我们免费咨询更多的眼动追踪资讯。


动图封面
Gazepoint GP3 眼动追踪系统

►Gazepoint GP3眼动仪,60Hz系统,包括API / SDK,专业版数据分析软件。

►GP3是一款研究级眼动仪,在其成像和处理系统的心脏处使用60Hz机器视觉相机。


DVA9dSrMu7gKIac7VEJGG1S6MADn1au2CEs9K75yubDi3qw66E0y87K8kv+aO8dRB1U31hoxqSwyjMn7A6DjBr3kpm5GmITeaKgs701lkxEvPRRpd6LWc5uRGoltE4wZ66AjD7xR5yAqAkFI5J9JfZyIvZfClXz5zhlS6UoyGCdEiBH3b6muJJvMpsjYM6mm1CJXtJOtFL/sGTKDJNTmOm2rPF+xdX8qyCDyrnFQ5HZWE6JjzRckxE1irFWeY8e6