欢迎光临
我们一直在努力
您的位置:首页>人工智能 >

这款无镜头相机专为AI和计算机视觉程序而打造

相机曾经是他们自己的设备,带有镜头和胶片,并前往药店购买照片。然后,他们消失在手机,平板电脑,笔记本电脑和视频游戏机中。现在看来,有朝一日,相机可能会像一块玻璃一样变得不起眼。

根据一项新的研究,一个靠近窗户边缘的光电探测器可以探测到穿过光缆的玻璃状光信号内部反射的反射。对这些微小的探测光滴进行一些巧妙的处理,使得玻璃窗像一个巨大的相机镜头。

由此产生的颗粒状图像(想象像第一代智能手机拍摄的像素化,有点扭曲和低分辨率的表兄弟)将不会很快与传统相机竞争图像质量。但是出于许多计算机视觉程序的目的,窗玻璃或汽车挡风玻璃可以提供图像处理算法或神经网络可能需要的所有分辨率。

犹他大学电气与计算机工程副教授Rajesh Menon表示,人眼从未见过相当数量的相机拍摄的图像。它们仅通过处理来自工厂车间的安全摄像机馈送或视频的算法或自动车辆图像传感器来看到。并且人类从未见过的图像数量正在增加。

因此,梅农问道,“如果机器将比人类更多地看到这些图像和视频,那么为什么我们不考虑仅仅为机器重新设计相机呢?将人类完全从环路中取出,完全从非人类角度考虑相机。“

换句话说,计算机视觉算法并不总是需要辨别人眼所要求的高分辨率和图像保真度。Menon和他的合着者Ganghun Kim的“透视无镜头相机”拍摄的低质量图像仍然可以提取大量信息(成本更低,占地面积更小)。

Menon和Kim的技术,他们已经代表大学申请了专利,从一块玻璃或塑料开始。Menon说,视觉媒体本身没有什么特别之处。他们使用了一张有机玻璃,因为它易于使用和切割。

他们将一个现成的光电探测器(640×480像素,提供8位分辨率)连接到塑料板的边缘,使它们平滑并准备与成像设备连接。他们,在有机玻璃窗格周边的其余部分放置反光带。Menon说,他们可以在没有胶带的情况下进行成像,但这种技巧可以提高信噪比。

他们将这种视野简化为概念验证实施。他们在窗格前面设置的对象是一个32 x 32个LED灯的阵列。然后,当1,024个灯中的每个灯被单独照亮时,他们查看到达光电探测器的信号。

因此,来自LED阵列的任何任意图像,至少在第一近似中,将仅是来自已经被照射的每个LED灯的信号的线性组合。

Menon说,对于这个项目,他们开发了传统的信号处理算法,可以根据光电探测器接收到的信号重建图像。他们将此步骤称为“反问题”,因为他们的算法采用了复杂且混乱的信号并向后驱动它以发现可能产生探测器检测到的光子的物体。

“我们正在探测空间中与特定物体相对应的光子分布,”他说。“作为人类,我们希望看到一对一的地图。这正是镜头的作用。这里我们有一对多的地图。这就是我们必须解决逆问题的原因。“

这也是为什么这些窗玻璃“相机”特别适合依赖计算机视觉的程序。图像质量和可分辨信息可能足以用于计算机视觉,但尚未(并且可能永远不会)准备替换传统的基于镜头的相机以用于人类观看的图像。

梅农还表示,他的团队正在开发一种机器学习算法来研究更复杂的图像 - 例如可以检测到的手写数字,并将其解析为它们所代表的数字。

梅农说,这项技术的首批应用之一可能是虚拟现实和增强现实护目镜。在这些耳机中,护目镜的图像生成和图像显示硬件已经足够庞大,眼动跟踪相机可能是一个麻烦的补充。那么,如果这款透明无镜头相机的版本可以提供足够好的信息来跟踪用户的眼球运动呢?

具有讽刺意味的是,技术形式的突破可能会从当今最先进的技术水平大幅降低。但是,梅农说,或许最重大的飞跃是思考重新设计技术的思维转变,这对于人工智能和图像处理系统来说“足够好”。因为像苍蝇眼一样,AI世界中最重要的不是单一数据源的高质量,而是数据源的激增。

这就是为什么,至少对于计算机视觉算法而言,未来几年,相机和玻璃窗板可能会开始看起来更像彼此。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。
在线看片网站