光学发明反映了人眼的图像处理能力
发布时间:2024-02-14 01:00:04 阅读数: 146
利用超曲面进行几何图像变换的示意图。物体的图像以纳米级空间分辨率投影在亚波长薄的超表面上,然后通过约束方式重新定位像素,将其转换为有意扭曲的图像。光(绿色虚线)在(x, y)平面上以仅振幅透射率f (x, y)从图像的每个像素传输,由具有相位轮廓φ (x, y)到(x, y)平面的超表面引导,形成具有重新分布的强度轮廓g (x, y)的图像。DOI: 10.1038/s41467-023-43981-x
在一个寒冷、阳光明媚的日子里,你开车行驶在一条乡村公路上,周围是白雪覆盖的田野。在瞬间,你的眼睛处理了这个场景,挑选出单独的物体来聚焦——一个停车标志,一个谷仓——而场景的其他部分在外围变得模糊。当你坐在办公桌前的时候,你的大脑会把这些聚焦的和模糊的图像储存起来作为记忆,然后在你的脑海中描绘出来。
宾夕法尼亚州立大学电子工程研究人员模仿人眼这种简单、即时的图像处理能力,创造了一种超表面:一种类似于玻片的光学元件,利用放置在不同角度的微小纳米结构来控制光线。在通讯作者、宾夕法尼亚州立大学电子工程与计算机科学(EECS)副教授倪兴杰的带领下,该团队在《自然通讯》上发表了他们的发明。
研究人员表示,人工智能(AI)系统需要强大的计算能力和能量,处理图像和识别物体的速度可能很慢。相比之下,超表面可以用于预处理和转换图像,然后再被相机捕获,允许计算机和人工智能以最小的功率和数据带宽处理它们。metassurface的工作原理是将图像从笛卡尔坐标系(图像像素沿x轴和y轴排成直线和列)转换为对数极坐标系(使用类似靶心的像素分布)。“就像人眼内部的光感受器的排列一样,超表面拍摄图像并将它们排列在对数极坐标系统中——中心聚焦特征的像素更密集,外围区域的像素更稀疏,”Ni说。“这可以让照片中更重要的部分清晰地显示出来,而其他部分则不那么清晰,从而节省了数据带宽。”
超表面被放置在照相机前面,这样光线首先通过它,然后将图像从笛卡尔坐标系转换成对数极坐标,然后由照相机将其数字化并传输到计算机。由于它的工作原理是使用纳米结构来弯曲光,所以超表面不需要任何能量,并且以光速工作。“由于物体的图像可以在大小或方向上变化,因此需要对图像进行预处理,使其能够抵抗缩放和旋转变化,”倪说。“这种预处理有助于人工智能应用程序更容易地将它们识别为相同的对象。”
通过在相机前放置不同的超表面,研究人员还可以将对数极图像转换回具有笛卡尔坐标的原始图像。研究人员说,这项发明有许多潜在的应用,包括用于目标跟踪和监视,例如绘制汽车如何在城市中移动。“metasursurface可以与人工智能系统协同使用,作为预处理器,使其更容易从多个街景摄像头中识别出同一辆车,”倪说。“或者,如果应用于卫星,它可能会跟踪飞机从起飞到降落。”