苹果获杀手级3D成像专利 可重建3D图像

news/2024/7/8 6:07:42 标签: apple, 照片, 图像处理, 生物, 2010, 图形

Apple 发明了可用于拍照和录像的杀手级3D成像照相机。开发中的新照相机将利用深度传感器,如LIDAR,RADAR和激光,来合成立体色差图产生3D影像。此外,这种相机将使用先进的色差、亮度传感器获取高色差精度。那样还不够,新相机将不仅包含面部识别还包含了表情识别功能。Intel在2010年即声称3D革命即将来临,显然Apple想要成为最早采用这种杀手级3D相机的公司之一。可能其他公司在3D相机上会打败Apple成为市场第一,但今天的发明所描述的技术将明确地为iOS设备提供杀手级3D图像,而且仅支持Apple的具有革命性的视网膜显示屏。Apple的革命性体验才刚刚开始,这种能在iPad屏幕上浏览3D图像、照片和视频的能力,其革命性体验将进一步引爆我们的大脑。

现在的照相机仅具有有限的3D功能

现存的3维图像捕捉设备,如数码相机、摄像机,能获取有限的捕捉范围内物体的3D视觉信息。例如,一些成像设备能提取关于捕捉范围内物体近似的深度信息,但不能获得关于这些物体表面的详细几何信息。

一些传感器能估算捕捉范围内物体的距离,但不能精确产生物体的3D形状。或者另外一些设备能获取和产生捕捉范围内物体表面的详细信息,但不能提取深度信息。

因此,这些传感器不能区分一个靠近传感器的小物体和远离传感器的大物体。

 

Apple的先进3D相机解决方案

Apple的发明是关于利用一个或多个专用相机捕捉3D图像的系统、装置和方法。

根据Apple描述,一个方案是一个3D相机捕捉至少一张包含一个或更多个物体的图像,包含: 一个第一传感器捕捉偏振图像,这个第一传感器包含一个相机和一个偏振滤镜与之相连;一个第二传感器捕捉第一张无偏振图像;一个第三传感器捕捉第二个无偏振图像;至少一个处理模块利用不少于第一张和第二张无偏振图像来取得所拍摄的一个或更多个物体的深度信息,处理模块进一步联结偏振图像、第一张非偏振图像和第二张非偏振图像形成合成的三维图像。

另一个方案是用三维成像装置捕捉至少一个含一个或更多物体的图像,包含:一个第一传感器捕捉偏振色差图像和确定所拍摄一个或更多物体的表面信息,一个第一传感器包含一个色彩成像设备和与之相连的一个偏振滤镜;一个第二传感器捕捉第一个亮度图像;一个第三传感器捕捉第二张亮度图像;至少一个处理模块利用不少于第一张、第二张亮度图像并联结偏振色差图像获取取所拍摄的一个或更多个物体的深度信息,利用表面信息和深度信息形成合成的3D图像。

还有一个方案的形式是一个物体至少采集一张图像的方法,包含:捕捉物体的一张偏振图像;捕捉物体第一张非偏振图像;捕捉物体的第二张非偏振图像;从不少于第一张和第二张非偏置图像中获取物体深度信息;确定物体的多个表面法向,这些表面法向是从偏振图像中取得;用深度信息和这些表面法向合成三维图像。

采样图像传感器包括电荷耦合器件(CCD)传感器,互补金属氧化物半导体(CMOS)传感器,红外线传感器,光探测和测距传感器等类似器件。图像传感器会对一系列色彩和/或亮度敏感并且会采用多种分色机制,如拜尔阵列(Bayer arrays),Foveon X3配置,多CCD器件,二向棱镜(dichroic prism)等类似器件。

 

设备将使用新3D捕捉技术

Apple称在一些实施方案中,会配备图像传感器将采集的图像转换或帮助转换成数字图像数据。图像传感器将置于多种电子设备中,包括(不仅限于)数码相机,个人电脑,个人数字助理(PDAs),手机,单独相机或任何用于处理图像数据的设备。

 

集成组件到3D图像采集相机中

Apple的专利如图FIG.1A ,下面的功能模块图是阐述3D相机的第一个方案的组件。

如FIG. 1A所示,3D图像装置/相机 100 包含一个第一成像设备102,一个第二成像设备104和一个图像处理模块106。偏振滤镜108与第二成像设备相连。

 

 

产生立体色差图

在第一和第二成像设备观察112和114区域,如上图标记,观察的物体图形具有一定偏移量,所以接收的图像有着轻微的差别。如第一成像设备102的112区域在垂直,对角或水平方向上与第二成像设备104有一定偏差,或更靠近或更远离我们的观察点或平面。第一、第二成像设备观察区域112和114产生的偏移能对产生立体色差图和获取深度信息提供有用数据。

 

可选深度探测技术:LIDAR, RADAR和Laser

如图FIG.1A标示,第一成像设备102发射电磁波,通过捕捉物体反射回的电磁波获取物体110的近似距离。

在第一个方案中,第一成像设备是一个光探测和距离传感器。LIDAR传感器发射激光脉冲,在物体表面反射回,再由传感器探测反射信号。LIDAR传感器通过测量激光脉冲的发射和接收信号间的时间延迟计算与物体间的距离。其他方案则利用其他类型的深度探测技术,如红外线反射,RADAR,激光探测和测距等类似器件。

 

利用微透镜

Apple的专利会在他们的3D照相机中使用微透镜,这种微镜头含有很多聚焦偏振光的子滤镜。微透镜可由任何合适的材料制成,通过光导来传输、散射光。此外,光导包含反射材料、高透明度材料、光吸收材料、不透光材料、金属材料,光学材料和/或任何其他功能性材料集合,提供额外的光学性能修正。

在第一个方案中,微透镜是凸状且是圆形的。其他方案中会有不同的形状。如在第一个方案,微透镜是圆锥形,没个微透镜顶部是一个点。

其他方案中的微透镜是所谓的顶端截平了的锥体,其顶端是一个平坦的表面。此外,在一些方案中,微透镜是凹状表面,而不是凸状的。

众所周知,微透镜的形成需要很多技术,包括激光切割技术和/或微加工技术如金刚石车削。在微透镜形成后,电化学加工技术用于镀膜和/或使微透镜增长寿命或增强/添加需要的光学特性。

 

色差和亮度传感器

提及的3D相机中的传感器还包括使用一个第一色差传感器(202)和一个亮度传感器(204)。亮度传感器用来捕捉进入的光的亮度成分。此外,每个色差传感器用来捕捉进入光的色彩成分。在第一个方案中,色差传感器202,206会感应一幅图中的R(红)、G(绿)、B(蓝)成分,并处理这些成分获得色差信息。

其他方案中会用于感知其他的色彩成分,如黄、蓝绿、洋红等。并且在一些方案中,使用两个亮度传感器和一个色差传感器器。比如说某一方案会使用一个第一亮度传感器、一个色差传感器和一个第二亮度传感器,所以两个亮度图像的偏差将产生立体视差(如,立体深度)图。

面部和表情识别

在第二个方案中,3D成像装置用来识别面部表情。面部表情包括(不限于)笑、扮鬼脸、皱眉、眨眼等等。在第一个方案中,这些会通过表面几何数据探测多种面部肌肉方向来实现,如嘴、眼、鼻、额、面颊等等,并将这些探测得到的方向数据与多种面部表情结合。

 

旋转物体形成3D模型

在第二方案中,3D成像装置会扫描物体,合成物体的3D模型。这个方案可以通过在物体旋转时拍摄物体的多张照片和视频实现。当物体旋转时,图像传感器将捕获很多表面几何形状,用这些几何形状合成物体的3D模型。

在第二方案中,图像传感设备会跟着物体移动,并拍摄多张照片或视频用于合成物体的3D模型。例如,使用者在穿过住宅时对着住宅拍摄视频,图像传感设备将使用计算出的深度和表面细节信息来合成一张住宅的3D模型。从多张照片和视频中得到的深度和表面详细信息将会匹配起来构建成无缝的合成3D模型,并与每个照片和视频中的表面和深度信息结合。

3D革命来临的第一次讨论是在我们的一篇报告名为“Intel‘s CES Keynote2010,Apple和iLife3D”中。Intel 称其将会推出8到16个核心处理器来推动3D的消费级应用。用其装备一台相机真是绝妙。

 

Apple的专利申请最初是在2011年第三季度由Brett Bilbrey、Michael Culbert、David Simon、Rich DeVaul、Mushtag Sarwar和David Gere提交,并于今天由美国专利与商标局公布。

Via:patentlyapple


http://www.niftyadmin.cn/n/1612947.html

相关文章

threejs加载模型挤压变形_铝型材挤压模具模拟技术交流与应用

导 读厚德载物,传递能量;喜欢就点击最上面分享“交流平台” 吧。挤压模具模拟是什么?在挤压模初步设计的基础上,根据事先拟定的工艺试验方案,利用计算机仿真整个挤压成形过程,获得挤压变形体内的应力、应变…

[暑假]浅识Date

首先声明 MDN文档中也有详细介绍, 此处仅仅讲述常用的方法,以及牵涉的知识点 1.UTC是协调世界时(Universal Time Coordinated)的英文缩写. UTC相当于本初子午线(即经度0度)上的平均太阳时.其中需要注意的是, 北京时间比UTC时间早8个小时. 2. Date对象常用的是字符串类型 其中 …

视频流媒体播放器EasyPlayer.js如何实现在FLV直播流断流恢复后自动重连?

背景分析 EasyPlayer-Android播放器是一款可针对RTSP、RTMP、RTSP&RTMP协议进行过优化的流媒体播放器,其中我们引以为傲的两个技术优势就是起播速度快和播放延迟低。最近我们遇到一些需求,其对播放画面要求非常苛刻,于是我们再把代码捡起…

Android设备无法彻底删除用户资料

如今智能机在市场大行其道,更新换代也越发频繁,当你的爱机容颜不复当年,一定得谨慎处理。君不见陈大师当年何等的轰动,虽是一台手提电脑惹的祸,但要相信你手上的智能机同样有此威力。打算处理掉自己Android手机的童鞋注…

python基本算法面试_python笔试面试项目实战2020百练1二分查找法(虾皮面试题)

基础 假设你要画一个包含16个格子的网格。image.png 1.一次画一个 一种方法是以每次画一个的方式画16个格子。记住,大O表示法计算的 是操作数。在这个示例中,画一个格子是一次操作,需要画16个格子。 如果每次画一个格子,需要执行多少次操作呢?image.png…

做医疗直播之前,要先做好规划吗?

众所周知,做直播之前,主播或直播团队都需要做好相关的规划才能顺利进行直播。那么医疗机构做直播也是需要做好规划吗?答案是肯定的。下面我们一起来看看做医疗直播之前的规划吧。 2.png 1、明确直播目标 在做医疗直播前,先要清…

[暑假]Js的数组学习

1.数组创建的方式 一共有两种: 第一种: 利用数组字面量 第二种: 利用new Array() <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge">…

安防4G摄像头视频流媒体服务器EasyNVR关于视频集成自我展示web端嵌入视频广场的流程

背景分析 随着互联网基础设施建设的发展&#xff0c;4G/5G/NB-IoT各种网络技术的大规模商用&#xff0c;视频随时随地可看、可控的诉求越来越多&#xff0c;互联网思维、架构和技术引入进传统监控行业里&#xff0c;成为新形势下全终端监控的基础需求。因使用区域受限、实施成…