玄铁筑基,含光入道:阿里AI芯片三剑齐至的背后

2019-09-28 欧阳倩 懂懂笔记微信公众号
浏览

7月25日“玄铁”落地;8月29日“无剑”出鞘;9月25日,“含光”惊现。

“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”25日的云栖大会现场,达摩院院长张建锋手持含光800AI芯片郑重说到。

去年的云栖大会上,阿里巴巴旗下“平头哥半导体有限公司”亮相,一年多时间埋头磨砺后,平头哥在90天内接连发布了三款芯片系列产品。从7月底的“玄铁”到近日的“含光”,阿里的芯片战略版图也逐渐浮出水面。

“玄铁910”重在芯片基础单元处理器IP,“无剑”意在SoC开放设计平台,而含光800剑指云端AI芯片算力输出。在懂懂看来,这种不卖芯片的造芯之路,应该是“平头哥模式”对技术和商业发展路径的抉择。

从含光的命名来看,作为上古三大神剑之一,其特质是无痕无迹。《列子汤问》中所述,含光视不可见,泯然无际,经物而物不觉。可以说,从玄铁到无剑再到含光,蕴含的是遵循规律、启承大道的内涵。而在AI、云计算、芯片研发乃至AIoT时代的发展进程中,阿里希望探索的道又是什么?

从重剑无锋到含光入道

“含光800主要通过阿里云对外输出云端AI的算力,更多的企业可以通过阿里云获取含光800的算力。基于含光800的阿里云性价比提升了100%。”对于含光800的价值,张建锋如是说。

正如阿里方面所强调的,含光800并不会专门用于出售,而是通过阿里AI云服务输出算力,与购买云计算服务异曲同工。目前,阿里已经完成了芯片设计链路的全覆盖:“玄铁910”帮助企业设计制造高性能端上芯片,无剑SoC平台助力企业降低芯片设计门槛,含光800发力AI云端算力的输出。

目前,平头哥的端云一体全栈产品系列已经初步成型,而其涵盖处理器IP、一站式芯片设计平台和AI芯片的服务能力,究竟会帮到哪些企业,又将如何帮助他们?

“AI无处不在,不只在云上,还有终端。在端上面的AI需求以每年40%的复合率在增长,所以端上AI也非常重要。阿里AI的能力可以用于云上,也可以推到端上,所以叫做端云一体,这是从云上到端上的整体布局。“阿里巴巴集团副总裁、平头哥半导体公司总经理戚肖宁在采访中首先解释了端云一体化的概念。

戚肖宁介绍,平头哥在两个月前发布了玄铁CPU系列,可以帮助开发者开展芯片原型设计架构的创新。而上个月底在上海发布的无剑SoC平台,则可以助力企业大幅提升芯片设计的进程。

“所谓开放平台,指的是对特定领域的SoC已经做好了80%的设计准备,因此当用户客户面对完善的基础单元处理器IP以及开放式设计平台时,只要做好定制化设计需求,就可以研制出符合自身领域需要的芯片产品。这样可以帮助企业大幅减少开发周期、降低研发成本。”目前端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端的含光800芯片进行协同。

除了满足上述的需求,对于有云端算力需求的用户,则要依靠含光800来大展拳脚,“在端上我们的布局是建立一个完整对的生态,帮助用户更快更好的上云,而要释放普惠的算力,则需要有一个强大的AI算力来做支撑。”戚肖宁强调。

从阿里方面提供的数据来看,作为全球最强AI芯片,含光800在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比目前业界最好的AI芯片性能高出4倍;能效比500 IPS/W,是第二名的3.3倍。戚肖宁介绍,含光800系列从技术上来说属于视觉类芯片,其强大功能主要提现在视觉上面,“你可以看到的分类如检索分类,在自动驾驶方面的目标检测,还有分割处理,以及淘宝很多的检索应用场景等等。”

戚肖宁强调,这种强大的算力突破得益于软硬件的协同创新,通过部署在云端,含光800的算力将会帮助到更多的用户,使得阿里云的能力更加普惠,让更多人都能够使用到这种能力。

让更多的人能够用到,正是“普惠芯片”的理念之一。

普惠芯片“惠及”何方?

早在2018年4月,阿里全资收购中天微公司时马云就曾经对外提及“普惠芯片”的思路,“我们相信芯片行业正在改变,所以我们需要廉价的芯片、有效的芯片、普惠性的芯片,它可以被应用在任何领域。”他在一次演讲中着重强调了一点:阿里巴巴做芯片不是为了竞争,它是普惠性的,任何人任何地点任何时候都可以获取。

平头哥成立一年多来,没有采取传统芯片研发制造企业的传统思路——通过横向扩展产品线,覆盖低端到高端芯片产品线去“造芯卖芯”。实际上,平头哥采取的是从基础IP、(开放)芯片设计平台能力,到云端AI芯片算力输出的模式,这样的技术路径和发展思路主要基于什么样的原因和目的?

“我们对于AI的顶层设计,就是推动AI落地,实现产业的价值,而要实现这个顶层设计,就要不断地细分我们每个部门的分工。”阿里云副总裁、产品与解决方案管理部总经理马劲介绍,阿里巴巴的AI每天调用次数超过了一万亿次,每天在处理的图像超过10亿张,处理的视频超过120万小时,语音超过55万小时,自然语言超过5千亿句。“这是我们服务全球十亿用户所积累下来的数据,我们是不知不觉中一步一步成为了最大的AI企业。”

如今,这种AI能力要通过云计算、芯片、AI和算法等等手段,输出到有更多需求的企业手中。这里面就涉及到了马劲所提及的“分工”,据他介绍,在实际分工运作中,最下面的一层是阿里的云计算、边缘计算、设备(AI芯片)等基础设施层,上面一层则是平台层,面向开发者提供各种开发工具、云端资源和不同的计算能力。

“在开发平台的上面,则是AI服务和产业应用,这两层是密不可分的。我们把视频的算法、文字的算法、语音的算法、分析的算法、自动驾驶的算法训练出来,变成原子化的服务,可以在产业实践当中快速组合成新的应用。”马劲强调,在产业应用方面,达摩院的科学家一方面在强化阿里巴巴自身的应用场景,另一方面则是和不同行业的客户一起,解决问题、创造新的能力。“我们内部和外部的产业之间,都希望相互交织融合,目标就是推动AI落地,实现更大的产业价值。”

显然,平头哥的目标是打造面向家电、汽车以及更多行业的芯片设计平台及芯片设计能力,同时输入出云端的AI算力,而非单纯的设计芯片、销售芯片产品。从这个角度来看,其与英特尔、英伟达等芯片大厂有着完全不同的发展思路。

在内部而言,“含光800”芯片会部署到阿里云的数据中心、边缘服务器上面,为阿里巴巴集团内部场景提供技术支撑;对外而言,目前阿里云的客户除了可以高效、低成本的研发AI芯片,还可以通过云计算获取AI算力的强大支持,加速业务创新。

观察平头哥的端云一体化,可以看到在端侧其拥有7款自研嵌入式CPU IP核,授权客户已经达到上百家(销售规模超过十亿颗),在机器视觉、工业控制、车载终端、移动通信和信息安全等领域都开始了广泛应用;同时,玄铁处理器以及无剑SoC平台已经服务于人工智能企业云天励飞、芯片企业炬芯科技等客户,并在越来越多的行业用户及开发者群体中得到了认可。而含光800的算力,未来更会在阿里云原有的电子政务、城市大脑、智慧城市、智慧医疗等领域得以充分释放。

AIoT时代需要“芯”玩法

目前平头哥在端云一体化的芯片生态建设方面,已经取得了阶段性成果,但是从行业发展规律来看,这或许仍是万里长征的第一步。

从平头哥官方公布的信息可以得知,未来其在芯片产品形态方面还会有进一步完善举措,包括云上AI训练芯片和端上的AI推理芯片。据悉,平头哥目前正在研发用于阿里云神龙服务器的SoC专用芯片,以满足更多场景的算力需求。

除了上述产品形态的进一步完善,平头在AI芯片领域也将面临众多挑战。当前,全球科技巨头都在积极布局AI,其中谷歌、亚马逊、苹果、微软、Facebook都在抓紧研发AI芯片,原因很简单:这些巨头都拥有大量的数据以及丰富的应用场景,通过自主研发AI芯片,他们可以在更多的应用方面提升更高的效率。

在5G和AIoT逐渐普及的大趋势下,这种紧迫感尤为明显,不仅是对阿里,对所有行业用户都是如此。

在懂懂看来,在AIoT时代,企业面对的将是全球数十亿甚至上百亿台智能终端设备,以及海量且复杂的AIoT应用场景,这些场景需要新的计算架构,需要安全、在线和智能等新的特性,所有置身于AIoT环境下的芯片都面临升级,这无疑会在芯片行业引起一波全新的技术革命和产业浪潮。

更重要的是,AIoT市场具有强应用驱动和场景碎片化等特点,如果芯片公司按照传统的方式设计芯片,显然无法适应未来市场的需求。从这个角度来看,平头哥希望通过端云一体芯片生态为各行业提供普惠算力,是一种独特且必然的发展路径。

“未来二十年企业所需要的80%的信息都会来自于智能设备在物理世界的感知和认知,未来80%的企业都需要有一个自己的AIoT的平台。”阿里云智能产品管理部总经理何云飞强调,这是企业迈向AIoT时代的真正关键特征表现,也是智能社会真正将物理世界在线化、数字化、智能化的过程。

何云飞指出,阿里巴巴在设备智能化以及应用智能化这两侧分别提供了AIoT操作系统以及边缘计算能力,在云端提供智联网的平台以及AI一站式应用开发能力。“结合阿里巴巴的网络能力、安全能力,将会形成一个全面聚焦AIoT的整体基础设施,加速企业进入AIoT时代。”显然,所有基础设施中的关键一环,必然是在芯片层面,尤包括以含光800为代表的神经网络芯片。

同样,全球科技巨头都在分秒必争,于AI芯片市场发力抢跑。2017年谷歌正式发布的第二代TPU处理器,已经大幅提升了机器学习和推理方面的能力;苹果主打低功耗优化和机器学习的A13芯片目前已经亮相,并可以实现每秒1万亿次的计算能力;与此同时,微软为下一代HoloLens研发的AI芯片,亚马逊为搭载Alexa硬件产品研发的AI芯片也都在不断推进。

面对行业的需求变化以及市场的挑战,阿里的优势在于对芯片、AI和云计算进行深度融合、协调发展。未来将人工智能算法集成到芯片,用集成算法的专用芯片为云服务提供更强性能,通过云计算的普及加速人工智能应用的大规模落地,正是平头哥看准的方向。

AIoT时代的挑战,是全行业共同的课题,也是阿里巴巴的重要课题。作为横跨电商、金融、物流、云计算、大数据、全球化等场景的重要经济体,以及拥有世界上最挑战、最丰富计算场景、网络场景、机器学习场景的AI企业,阿里巴巴在芯片关键领域进行基础性技术的研究投入,既是责任担当,也是面对生存发展规律的勇敢抉择。

大道之理在于遵规律、顺自然,由玄铁至含光的思路,到端云一体化的产品形态,可以看出阿里在AIoT时代已经窥得大道之门径。