WiMi微美全息/商汤/旷视科技AI+3D+AR技术创新多应用场景

2020-01-20 李思绮 IT之家
浏览

人工智能浪潮席卷全球,层出不穷的AI前沿技术在寻找落地场景,而传统企业与AI的深度融合也成为一大趋势,人工智能即将迎来应用爆发期

而“产业AI化”是指如何把AI和实体经济以及传统产业更进一步地进行结合,让AI作为一个基础的使能技术赋能实体经济、传统产业,推动和实现整个产业的革新、升级,生产力的释放,这应该是一个万亿级规模的市场。

刚刚,苹果公司又申请了一个专利。具体说来:把整个车的前挡风玻璃变成一个大的AR屏幕,当你开车时,视线前面的路况等所有的信息,都会通过3D和AR的形式栩栩如生的映射在你前挡风玻璃上,无缝隙的跟你体验结合起来。

根据市场预测显示,预计2022年全球3D市场规模将达到3892亿美元,3D产业正在迅速崛起。人工智能技术的爆发加速了人机交互方式的变革,更加“人性化”的机器与人类的交互方式变得更加自然、流畅、智能。

而这项超前的技术专利,在旷视科技云事业部高级副总裁吴文昊看来,智能化+3D结合在一起,会对我们每一分钟的生活改变将是完全不一样。再高度概括或者展望一下,未来,一个由AI和3D共同驱动的深度人机交互世界即将诞生。

旷视基于对行业的深刻洞察和手机3D创新实践,于业界首次发布“软硬一体”的移动端3D感知全栈解决方案,从算法创新、应用开发、设备制造到解决方案打造四个层面,阐释旷视最新、最全面的“AI+3D”发展脉络。

在旷视发布的软硬一体移动端智能3D产品解决方案中,最上面一层是3D应用层,往下依次至AI算法、解决方案,最后到摄像、传感等硬件设备制造上。布局3D领域,是旷视实现AI+IoT赋能手机的最新举措,也是打造未来数字化、智能化世界的重要一步。

在上世纪70年代,工业界开始运用3D视觉技术测量和扫描物件,提高生产效率。最近10多年,家用游戏机厂商将3D体感外设带入大众视野,带来了新奇的体感游戏。近三年,越来越多的智能手机开始配备3D传感器,并在AI的加持下,开拓出了更多更具想象空间的应用场景。未来10年,AI+3D将无处不在,给我们的生活和工作带来深远影响。

目前,商汤科技已经将AI技术广泛地应用于3D感知的各个领域,开发了基于ToF等3D感知硬件的技术与产品,包括人脸与人体3D重建、物体重建、3D全身关键点跟踪、3D Avatar驱动工具、AR测量、AR场景互动、AR导航、3D人脸认证、3D摄影等等,均体现了AI+3D的显著优势。

随着越来越多的智能手机配备3D感知硬件,AI算法的作用也越加凸显,只有两者的紧密协作,才能够将完美的影像体验带给最终用户,缺一不可。为此,商汤科技一直积极与合作伙伴携手共进,将AI+3D相关产品和技术充分应用于手机等智能终端当中。

比如,通过AI+3D进行“物品重建”。用户只需拿手机沿着物体360度环绕扫描,就能将其扫描成数字模型,并用于3D打印、3D/AR相册预览、短视频直播内容生成,或植入到游戏、电商商品展示等场景。特别是后者,它可让顾客通过翻转方式查看物品外观,告别翻看照片的麻烦。

AI+3D让手机就能成为体感设备。玩家可低成本地畅玩体感游戏,而内容创作者则借助商汤的Avatar技术打造自己的虚拟形象,例如虚拟主播、虚拟讲解员或者虚拟教师,通过表情、动作进行驱动,这会为互动娱乐、文旅乃至教育打造新的发展模式。

放眼汽车行业,AI+3D技术能够实现更加精准的车外人、车、物识别和距离感知,有力推动自动驾驶的发展。商汤科技也正以“摄像头为主、多传感器融合”的解决方案,研发L4级自动驾驶解决方案。而在泛工业领域,AI+3D可以为机械臂赋予3D感知能力,准确判断物体所处的位置、尺寸、形状等,从而进行精准的抓取,或是进行自动化的品质检测。

作为国内知名的全息AI的企业,微美全息WIMI专注于计算机视觉全息云服务。据介绍,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。其商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。

全息技术是利用干涉和衍射原理记录并再现物体真实的三维图像的记录和再现的技术。其第一步是利用干涉原理记录物体光波信息,此即拍摄过程:被摄物体在激光辐照下形成漫射式的物光束;另一部分激光作为参考光束射到全息底片上,和物光束叠加产生干涉,把物体光波上各点的位相和振幅转换成在空间上变化的强度,从而利用干涉条纹间的反差和间隔将物体光波的全部信息记录下来。记录着干涉条纹的底片经过显影、定影等处理程序后,便成为一张全息图,或称全息照片;其第二步是利用衍射原理再现物体光波信息,这是成象过程:全息图犹如一个复杂的光栅,在相干激光照射下,一张线性记录的正弦型全息图的衍射光波一般可给出两个象,即原始象(又称初始象)和共轭象。再现的图像立体感强,具有真实的视觉效应。全息图的每一部分都记录了物体上各点的光信息,故原则上它的每一部分都能再现原物的整个图像,通过多次曝光还可以在同一张底片上记录多个不同的图像,而且能互不干扰地分别显示出来。

微美全息以“眼界即视界”为使命,公司建立了全球顶级、自主研发的深度学习平台和超算中心,并且研发了一系列AI技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。

例如,深度学习AI技术的突破将使全息AR设备能够以更加无缝的方式集成由摄像机捕获并由计算机模拟的内容,从而为用户提供更加身临其境的体验。5G网络的广泛采用将使本地设备和互联网之间的实时数据传输成为可能,从而大大增强了内容的多样性。

微美领先的全息AR内容制作功能围绕图像采集、对象识别、自动图像处理和计算机视觉技术而构建。微美的软件工程团队和可视化设计团队紧密合作,不断推进这些可视化相关技术,并利用它们设计和生产创新的全息AR内容。通过提供精确姿态估计的实时计算机视觉算法,能够在几秒钟内执行场景识别和跟踪。这种尖端算法还允许微美以像素为基础执行照片级真实高分辨率渲染的可视化。Frost&Sullivan表示,虽然大多数同行公司可能会识别并捕获特定空间单位内的40到50块图像数据,微美可以收集的数据块数量达到500到550;微美的图像处理速度比行业平均水平提高了80%,从而提高了运营效率。在场景重建过程中,微美的自动图像处理工具可以对最初拍摄的图像进行噪声清除和特征增强,从而能够创建具有业界领先模拟度的同类最佳全息AR设计。

未来,人机共存将更加普遍,机器也更具智慧,如此,AI结合3D改变机器传统的2D平面世界认知方式,让机器建立对现实世界全面深刻的三维信息感知和理解,将变得尤为重要。

今天的5G、云计算、大数据、人工智能,推动着物理世界向信息化、智能化发展,撬动了各行各业的市场活力和无限创意。其中5G,是演进更是变革。

机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、I/O卡等)。一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。

5G网络是第五代移动通信网络,具有接入量大、高速率、低延时的传输优势,有助于可穿戴设备实现云端计算后直接推送,让设备更加袖珍小巧,方便人们日常使用。正因如此,未来将在沉浸式通信等方面发挥巨大作用。