时间:2019-11-08 | 栏目:业界 | 点击:次
在Alexa变得潮流之前,我就开始使用它了。在我浏览亚马逊购物网站准备购买新扬声器的时候,一个横幅广告俨然展示在我面前,于是我在第一代Echo发布的几个月后就购买了。在它到货后,我当时的室友,谷歌的一名软件工程师,急切地将Alexa的功能与她的Google Assistant进行了比较。Alexa并不是真的天衣无缝的。但就我而言,它实现了我想做的一切:它播放着我最喜欢的歌曲,在早晨成为叫醒我的闹钟,时不时地告诉我天气和新闻。
五年后,亚马逊的雄心壮志使我朴素的欲望黯然失色。Alexa现在遍布各地,能够控制超过8.5万种智能家居产品,从电视到门铃再到耳机。它可以执行超过10万个“功能”和计数。它每周处理数十亿的互动,形成关于你的大量数据,包括你的日程安排、你的偏好以及你的行踪数据。Alexa已经变成了一个帝国,但亚马逊才刚刚开始。
在接受采访时,Alexa的首席科学家Rohit Prasad现在透露了Alexa下一步走向的更多细节。该计划的关键在于将语音助理从被动交互模式转变为主动交互模式。Alexa不是等待并响应请求,而是预测用户可能想要什么。这个想法是把Alexa变成一个无处不在的伴侣,积极地塑造并安排你的生活。这要求Alexa需要比以前更好地了解你。
事实上,Prasad已经向世界展示了这种转变可能会是什么样子的,并且在晚些时候,Prasad将在葡萄牙里斯本的WebSummit会议上概述他对Alexa未来的展望。在6月份的re:Mars大会上,他演示了一项名为Alexa Conversations的功能,并展示了如何使用该功能来帮助您计划晚上外出。您只需要开始对话,而不是手动操作,就可以为晚上的每个部分发起一个新的请求——例如,预订电影票。Alexa随后会跟进询问你是否也想预订餐厅或叫一辆Uber。
为了推动这种转变,亚马逊需要硬件和软件的支持。今年9月,亚马逊推出了一套“on the go”Alexa产品,包括Echo Buds(无线耳机)和Echo Loop(一种智能戒指)。所有这些新产品都可以让Alexa记录你生活中大量的数据,从而更好地根据你的行踪、行动和偏好为你提供帮助。
从软件的角度来看,为了实现这些能力,Alexa需要使用新的方法来处理和理解所有不同的信息源。在过去的五年中,Prasad的团队致力于培养它对人工智能基础知识的掌握,如基本的语音和视频识别,并扩展其自然语言理解。在此基础上,他们现在已经开始发展Alexa的智能预测和决策能力,以及越来越多的更高层次推理的能力。换句话说,我们的目标是让Alexa的AI能力在几年内变得更加复杂。
一个更聪明的Alexa
下面的一个场景是Alexa的软件更新组合在一起来执行夜间计划。为了满足电影票的请求,并给出晚餐和Uber车辆服务的提示,一个神经网络通过一周数十亿的用户互动来进行学习,以识别彼此之间常用的功能。这就是智能预测发挥作用的方式。当有足够多的用户在看完电影后预订晚餐时,Alexa会将这些技能打包在一起,并联合推荐给客户。
但是,要知道何时预订Uber,需要进行推理。考虑到你和电影院的位置、电影开始时间和预期的交通,Alexa计算出什么时候汽车应该来接你,才会让汽车准时到达那里。
Prasad设想了许多其他可能需要更复杂推理的场景。你可以想象一种功能,例如,当你站在Whole Foods超市时,你可以问你的Echo Buds哪里有西红柿。Echo Buds需要登记一下你现在在Whole Foods超市里,访问它的平面图,然后告诉你西红柿在第七个过道。
再说说另一种情况,如果你的航班遭到延误,你可以通过公共家庭Echo要求Alexa向你发送一条通知。但可能要发送通知时,也许你已经在开车了。Alexa需要意识到你,而不是室友或家庭成员,需要这一则通知——并且根据你启动的最后一个Echo设备,明白你现在在你的车里。因此,这则通知应该送到你的车里,而不是你家。
这一级别的预测和推理还需要考虑到视频数据,因为越来越多的Alexa兼容产品包含摄像头。比方说你不在家,一个女童子军敲你家的门卖饼干。Amazon Ring上的Alexa是一个配备摄像头的门铃,它应该通过视频和音频输入记录谁在你家门口,以及为什么在你家门口,知道你不在家,在附近的Alexa设备上给你发一个留言,询问你想要多少饼干,并代表你去订购饼干。
为了实现这一点,Prasad的团队现在正在测试一种用于处理用户命令的新软件体系结构。它涉及到通过更多层过滤音频和视频信息。首先,Alexa需要登记用户在大约10万个可用功能中选择尝试哪个功能。接下来,它必须在用户是谁、这个用户正在使用什么设备以及在哪种情境下理解该命令。最后,它将需要根据用户先前表达的偏好来细化最后的响应。
Prasad说:“这就是我认为未来几年将会变成的:推理并使之更个人化,更依据相应的背景。这就像是把所有东西放在一起,做出这些重大决定。”
触不可及的技术
从技术角度来看,所有这一切都将是一项令人难以置信的成就。Prasad所说的——将各种数据源和机器学习方法结合起来进行高级推理——几十年来一直是人工智能研究人员的研究目标。
然而,从消费者的角度来看,这些变化也具有关键的隐私影响。Prasad的愿景实际上是假设Alexa可以随时随地跟随你,在任何时刻对你都有很多的了解,并成为帮助你协调生活的主要工具。在底线上来说,这需要收集大量关于你生活的私密细节。有些人担心亚马逊最终会通过你的数据,向你推销和推送广告,从而远远超出这一底线。“这最终是关于将个人和群体的日常生活货币化的事情,”位于华盛顿特区的消费者隐私倡导组织数字民主中心的执行主任Jeffrey Chester说。
当被追问到这一点时,Prasad强调他的团队已经让用户更容易定期自动删除他们的数据,并选择退出人工审查。然而,这两个选项都没有阻止这些数据在Alexa的机器学习模型上被使用。事实上,Prasad提到了正在进行的研究,Alexa的训练过程转变为只要有新的用户数据,模型就可以快速更新的过程,或多或少保证了这些数据的价值在被处理之前就会被捕捉到。换句话说,自动删除您的数据只意味着一旦更新了训练算法,它就不会再用于训练未来的模型;对于当前的模型,您的数据将以大致相同的方式使用。(在后续请求中,亚马逊发言人表示,该公司不会将Alexa收集的数据出售给第三方广告商或定向广告,除非用户通过Alexa访问服务。)
斯坦福大学法学院互联网与社会中心的隐私主管Jen King说,这些数据控制方式太肤浅了。“如果你想给人们有意义的控制,那么你必须尊重他们完全退出的决定,或者在如何使用他们的数据方面给他们更多的选择,”她说。“在特定位置向某人提供功能性帮助可以用一种极其隐私保护的方式完成。我不认为这种情况本身就有问题。“
在实践中,King设想这意味着几件事。首先,亚马逊至少应该让用户选择加入,而不是选择退出数据的使用。其次,亚马逊应该更加透明地说明它的用途。目前,当你删除你的数据时,公司可能已经对它做了什么还不清楚。她说:“想象一下,你家里有一台人工智能监控摄像头,但你忘了它是开着的,而你却光着身子在房子里走来走去。作为消费者,当你删除这些文件时,如果系统已经使用它们来训练正在使用的任何算法,那么了解这些就变得非常有用。”
最后,亚马逊应该为用户提供更多关于何时何地可以使用他们数据的灵活性信息。例如,用户可能乐意放弃自己的数据,但同时希望自己的孩子不受限制。“科技公司倾向于设计这些产品,认为要么全有要么全无,”她说。“我认为这是一种非常有误导性的做法。人们可能想要这些东西的一些便利,但这并不意味着他们想要它们出现在生活的每一个方面。“
Prasad的终极愿景是希望Alexa对每个人都有用。即使在发展中国家,他也设想了人们可以在智能手机上访问到的更便宜版本。“对我来说,我们正在将认知的重担转移到日常任务上,”他说。“我想让Alexa成为一个生产力的增强者。真正无处不在,对每个人都有用。”