外媒消息称,苹果公司目前正在尽力提升计算机视觉方面的技术能力,主要是为了可以更加准确地检测和识别对象,比如在相机和被拍摄对象都在运动的情况下。这种通过热成像来辅助确定元素追踪的方法,似乎很有科幻感。但近日曝光的一项新专利,暗示了我们有望在不远的将来用上它。
周四的时候,美国专利商标局(USPTO)公布了一份题为《与一部分真实环境相关的、能够至少确定一个属性的方法和系统》。
这类应用与计算机视觉有很大的关联,即借助摄像头来分析场景,并从其看到的景象中获取有用的数据。
文档中提到了当前计算机视觉分析技术、在应对动态环境时的一个问题,因为许多算法都是特别针对静态环境而构建的。
但实际上,在使用智能机进行拍摄的时候,器材和被拍摄者经常都处于运动状态,想要明确追踪其中一个对象,似乎有些强人所难。
若场景中有多个移动物体,则相机姿态追踪的准确性会降低,甚至会故意忽略场景中在运动的物体。此外由于视线的遮挡,可能会遇到运动物体的识别问题。
虽然 2D 相机视图可以转换为 3D 空间中的点位,但该空间中的运用对象,也可能导致相机的 3D 定位问题。
这份专利给出的答案之一,就是使用两套不同类型的摄像头系统,其中包括一个热成像主摄、以及一个普通的摄像头。
两者都可以有效地提供相同的视点,但热成像相机可以像算法提供热图数据,辅以副摄像头提供的成像数据。
该算法能够分析热图像,并与成像数据相结合,以确定场景中的哪些项目与其它分离,增加热量、以及通常用于分析的颜色 / 对比度等其它属性。
例如,当有人穿着绿色的制服在场地中踢足球时,热图像会聚焦于球员身体产生的热量。算法可借此确定热图中的对象,然后用普通的副摄像头来挑选出正常图像中的球员。
此外,该技术还可用于确定被遮挡的平面拍摄图像。类似系统可借助热成像来覆盖 2D 图像的其中一部分,并提供一些可用于改变呈现的数据,比如被手遮挡的元件。
以建筑物分析为例,这样的系统可用于识别附近的行人。当来自相同视图的其它图像放在一起时,行人可以从最终构图中被自动移除。(听起来是不是有点耳熟?)
虽然该专利申请着重于描述消费级成像、视频编辑、以及增强现实,但它也能在自动驾驶汽车领域发挥更大的作用,比如传闻中的苹果 Project Titan 自动驾驶研究项目。
9 月初的时候,苹果描述了一款专利的前照灯,其能够突出现实道路的某部分区域,以便向驾驶员发出警示。
不过这样的系统,也可战略性地点亮部分道路,以帮助自动驾驶汽车的视觉系统更好地“看清”前方路面。