美图秀秀让你变美的背后,是这些技术在起作用
长久以来,一提到 “美图公司”,大家能想到的都是 “美图秀秀”、“美颜相机”、“美拍” 这些美颜类产品,而为这些产品提供 AI 技术支持的美图影像实验室(以下简称 MTlab)一直鲜为人知。成立于 2010 年的 MTlab,早已不止是一个实验室 —— 它在美图产品线背后扮演着 “大脑” 的角色。在 MTlab 的工具箱里,深度学习模型和 TensorFlow 是最有效的利器。
美图各个产品的功能决定了,MTlab 会大量使用到计算机视觉技术。
“2013 年开始,MTlab 就用机器学习做计算机视觉方面的研发。最早做的是人脸相关技术,以及美颜算法。”MTlab 负责人万鹏飞告诉 PingWest 品玩,“那时开源工具还没有现在这么丰富,很多算法和工具需要自己手动实现。”采用传统机器学习来做计算机视觉的好处是,整个训练过程完全透明,允许研发人员更好地评估训练出来的算法,是否在训练环境之外依然有效。但不足的地方是,人工提取特征的工作量大,而且鲁棒性差。万鹏飞对 PingWest 品玩表示,当时他们面临的主要技术挑战,正是“算法在各种极端用户使用场景下的鲁棒性”。利用深度学习的卷积神经网络模型,能很好解决这个问题。“深度学习这种数据驱动的方法,在鲁棒性方面比传统计算机视觉算法有明显优势。”万鹏飞说。决定采用深度学习后,他们最早使用的框架是 Caffe。这个深度学习框架于 2013 年在 Github 上发布,作者是加州大学伯克利分校的贾扬清博士。2015 年,Google 发布深度学习开源框架 TensorFlow,“MTlab 马上就去了解这个工具”。2016 年,MTlab 开始在项目中尝试用 TensorFlow。
万鹏飞介绍道,MTlab 用 TensorFlow 最早做的是图像去噪,整体感觉比较灵活,对自定义的网络结构比较友好。一个灵活的深度学习框架对于算法自研很重要,因为很多实际的问题需要通过一些创新的方法解决,而一个好用的深度学习框架无疑能提高计算机视觉算法研发的效率。很快,TensorFlow 凭借着灵活的特性成为了他们主要的深度学习框架。2016 年 MTlab 在用深度学习做人像分割功能时,初期使用 Caffe 实现自定义的卷积神经网络层不太方便,需要自己实现前向 / 反向传播算法。Debug(调试)操作起来也比较麻烦。“后来使用了 TensorFlow,其基于 dataflow graph(数据流向图)的计算结构对于自定义的深度学习操作很友好,也便于 debug。” 万鹏飞说,“另外对循环神经网络的支持也比较好,大大提高了研发效率。”如今,TensorFlow 已经被应用在美图旗下产品多个功能的网络训练中,如肢体关键点检测、五官分析、人像分割、图像画质增强、天空分割。万鹏飞对 TensorFlow 评价颇高:“TensorFlow 的分布式训练能力,大大提高了深度学习网络的训练效率。”万鹏飞同时还提及 TensorFlow 社区对 MTlab 的帮助。完善的官方文档说明、丰富的课程、以及对新手友好的互助氛围,都吸引着更多开发者加入 TensorFlow 社区。
TensorFlow 官方也在努力促进社区的壮大。在今年的世界人工智能大会上, TensorFlow将举办“智在启无限”主题论坛,邀请国内外不同领域,数十位重量级嘉宾,共同探讨机器学习如何在商业中应用,帮助企业和开发者解决现实生活的问题:
TensorFlow 全球产品总监将深度解析机器学习的内核;通用电气贝克休斯高级总监将分享如何确保安全生产、预测组件寿命和系统异常、避免意外停机;网易严选算法总监将分享如何实现季节性商品销量预测、提升用户点击、节约仓储和供应链成本;腾讯医疗大数据科学家将分享如何优化用户意图理解、为医院、医生和病人提供更优质的服务。还有一些前沿的机器学习研究者们也将来到本次论坛,分享机器学习在文化和艺术领域取得突破的经验。