还以为人工智能只能帮你定闹钟吗?它早就升级了

2020-08-06 欧阳倩 IT之家
浏览

这年头,谁手机里没几个人工智能?

苹果Siri、小米的小爱同学、OPPO的Breeno……来自手机厂商的人工智能正在接管你的生活。除了手机品牌,诸如亚马逊、阿里巴巴、百度等互联网巨头也在以智能音箱或者APP嵌入智能语音等形式,推出各自的语音助手。

但在传统的认知里,这些智能助理能帮你干什么呢——

定闹钟:“明天早上八点叫醒我”

查天气:“今天天气怎样?”

写记事本

开灯关灯

讲个故事

导航到某个地址

……

这是一些典型的使用场景。在这些工作中,智能助理是通过理解你的语音命令,去执行某项手机系统中的功能(比如闹钟)、调用内容库中的功能(放音乐)或是控制某个已经在协议当中的电器设备(比如电灯或者空调)。

作为“工具人”,为我们的生活带来了不少便利。

当然,这些功能都需要做好万全的准备——为助理适配尽可能多的功能,“她”才能理解更多的指令。掌控范畴、指令的理解能力和稳定性,成了不同助手间的核心竞争点。

从“工具人”到“代理人”

在2018年,人工智能助理获得了一项新技能——那年5月,谷歌为旗下的人工智能助理添加了一个概念性的新功能:帮助机主给餐厅打电话预约座位。谷歌将这个功能命名为Duplex,意为“双向数据传输”。

Google助手说:可以帮我预定一个周二的座位吗?(图:Google)

这是一个里程碑。智能助理说着人类的语言,接管了你与其他人沟通的任务。人工智能成为人与人交流的“代理人”,而不只是从前的“工具人”。

“双向数据传输”这个名字,可能也来源于这个AI的新技能。原本的人工智能,人负责说,它负责听;现在,人工智能不仅要听,更要与人类完成对话沟通了。

在人工智能领域,有一个著名的“图灵测试”:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么这台机器具有类人的智能。

想必Google这个会打电话的AI一定能蒙混过关图灵测试。

让人工智能帮你说话,这个概念非常诱人。你设想一下,现在的人工智能,除了手机上的任务,它都可以帮你去跟别人打交道了,这能帮我省下多少时间?更何况,现在很多人根本不喜欢去打那些热线电话。

但事实上,Google Duplex的发展速度并不快。截至目前,仅有七个国家的已登记在册的商户,可以接收来自谷歌智能助理的电话。自2018年发布后,谷歌很少再提及这项功能的进展,仅计划让它来学习自动填充网页搜索框——比如我输入“蛋糕”,它猜我要搜索“蛋糕的做法”——这种无需模拟人类沟通的场景。

相比接管人类沟通任务的凌云壮志,这实在不太诱人。

让AI作为“代理人”的技术,一发布就引来质疑。著名科技媒体The Verge的作者Natt Garun看到Duplex的展示就怀疑人生:怎么人类服务业从业者就成了谷歌智能的实验对象?

也有人推测,AI助理可能诱发消费者与服务者之间的情绪对立——毕竟,让智能助理去预定座位,几乎没有人会对人工智能说“请”和“谢谢”,久而久之,人们也许不再对真正的人类服务员说“谢谢”。

餐馆服务员被Google助手吓到(图The Verge)

但事实上,Duplex发布一年后,上面这位科技媒体作者再因Duplex采访餐厅服务员时发现了一个很有趣的变化:尽管有些服务员接到谷歌助理语言怪异的电话时受到惊吓,但也有服务员认为,与智能助理沟通预定事宜,比与人沟通更轻松——它的表达很清晰,并且永远没有着急、愤怒等负面情绪。

“礼貌”成了AI代理人类交流的副产品。Garun这样总结道。

“代理人”还能用在哪?

AI电话目前还远没有成为主流方式——一方面是技术和社会环境还不支持大规模的智能语音代理通话,另一方面则是语音通话用得少了,统计数据表明,中国手机用户的电话通话时长持续下降。

科技圈有一个段子,从3G时代一直讲到了5G时代:

3G可以支持视频通话,以后就是视频电话的天下了!

4G可以支持高清视频通话,以后就是视频电话的天下了!

5G可以支持低延迟视频通话,以后就是视频电话的天下了!

……

事实上,视频通话一直都没成为主流,甚至语音也成了让某些人头疼的事情——的确,很多时候用语音下指令是轻松的,因此手机搭载的Siri、小爱同学,以及高德地图和手机淘宝里的语音助手备受追捧;但听语音可不怎么受人待见,比如在微信里收到60秒语音的年轻人们估计都得做一番心理准备才能点开收听。

先行者谷歌选择电话作为智能助手代理交流的接口,但实事求是地说,语音可能不是一个好选项。因此,将语音直接转化成文本,反而成了很多公司和产品的关键功能。

如果让AI帮你转录文本,它应该出现在手机的什么地方?

答案当然是输入框。打字比通话占用了你更多时间。

微信聊天和发朋友圈都得打字输入、玩转微博离不了评论与转发,甚至买个东西都会被提醒无数次“你该写评价了”。

在输入法里加入智能助理,协助用户完成沟通任务,产品思路顺理成章——语音转文字,如今成了输入法的标配功能;而更进一步,就是辅助用户组织语言,把话说得更好听。

搜狗输入法今年五月推出的智能汪仔“帮你聊”功能,就是辅助用户聊天的独家首创功能。“帮你聊”的操作设计非常简单,只需要用户输入一个词,AI汪仔就可以根据语境自动补全成句,风格千人千面。

在此前,搜狗输入法AI智能助手“汪仔”已经获得了表情推荐、妙语推荐、资讯推荐、天气推荐等功能。据搜狗公司透露,在今年一季度,智能汪仔每周使用次数峰值增至9亿次,人均使用次数环比增长2倍。

谷歌助理学会打电话,是智能助理的里程碑;输入法引入智能助理,本质上,这些功能都是为用户补充更丰富的信息、帮用户说话,这也是输入法产品的里程碑。

作为连接人与机器的关键接口,输入法承载着将用户意图迅速转化为确切信息的工作——这个工作,最开始的竞争力在于词库、词频与自动调整,在搜狗输入法中,则是在很多年前的世界杯时,引入了“罗纳尔多”这样关键的名字,而这些当年的产品创新与初步的智能功能,已经成为现在所有输入法的基本操作;到了人工智能时代,围绕用户输入,理解语义、感知环境,针对性地优化输出成了新的技术“护城河”。

在这里,人工智能同样成为了人与人沟通的代理人。

从帮你聊到帮你写,搜狗输入法的再次进化

互联网文化里有个老梗,“在互联网上,没人知道你是一条狗”。而搜狗输入法的“帮你聊”功能戏剧性地callback了这句话,你可能真的在用一只“智能汪仔”跟别人聊天斗图。

但除了聊天,你还会有一些需要写些什么的场景,适用于聊天的内容,发朋友圈可能就差点意思。

在上线“帮你聊”仅仅两个月后,搜狗输入法在最新的10.13版本中将其再次升级为具备“帮你写”能力的「AI写作助手」——相比“帮你聊”时天马行空地写诗,局限在具体场景的“帮你写”,则会更多考虑成句合乎场景、通顺易读。

当使用AI写作助手时,你写出一个句子的关键词或者开头,AI汪仔就会帮你自动补齐整个句子,或根据所处APP为你推荐符合使用环境的灵感语句。它主要有两个小功能:购物时的“AI评价助手”以及“AI朋友圈助手”,场景不同,续写的句子内容、风格也不相同。

在电商平台购物时,“AI评价助手”可结合用户的宝贝关键词智能联想评价,帮助用户生成不同的、多样化的、符合用户输入语境的评价内容。例如,只需输入“衣服”,就能自动生成“衣服质量很好,做工精细,尺码标准,穿着很舒服,很满意。”

当你想发朋友圈时,“AI朋友圈助手”功能就会自动激活,为你准备适合发朋友圈的“灵感语录”——深夜发,就有晚上专属的文案。也可以用“AI帮你写”,让汪仔用你写下的开头组装出一句精彩的“名言”。

谁需要这些功能?搜狗输入法“AI写作助手”功能上线初期,首先覆盖庞大的网购群体与朋友圈用户。在这个年代,别的可能不说,好看的朋友圈的确刚需。更重要的是,作为一个输入法的加分项,写作助手并没有喧宾夺主,它只在合适的场景里出现,自动触发。

输入法是一个典型的工具软件,“简单好用”就是一个不变的金标准。

智能沟通,一“狗”当先

为什么是搜狗输入法在AI聊天上一“狗”当先?输入法与智能助理的天然契合,只是产品上的因素,而搜狗“用领先科技,让表达和获取知识更简单”的愿景,则是其重注人工智能的根本原因。

早在移动互联网时期到来之前,搜狗建立的“三级火箭”模型,即输入法、浏览器、搜索,将搜狗成功送上纽交所。

而在手机上,搜狗输入法将这“三级火箭”三项功能融合进同一个App中。现在的搜狗输入法,以文字输入为基点,打通相关的语音、翻译、搜索等相关领域,使其成为了涵盖输入、搜索、资讯推荐等功能的强大工具。

如今这些工具都离不开人工智能——输入法里,已经用了很多年的语音个性识别和最新版本的“AI写作助手”都是人工智能;在资讯阅读中,千人千面的信息流是人工智能;而在搜索中,AI赋能的搜索成了搜狗发力医疗健康与百科领域,进行差异化竞争的关键。

全力投入AI,搜狗实力到底如何?

举个有数据支持的例子。在语音识别领域,搜狗专门开发的AI智能录音笔,提供了速记、翻译甚至同声传译的强大功能。这个成立不久的全新业务,在今年的618电商节中斩获京东、天猫双平台录音笔类目销售额冠军——要知道,录音笔可是由传统声学巨头把持的领域,搜狗与同行发力智能录音笔,仅仅一两年就让整个行业都发生了不小的变化。

但这还不是终点,王小川在近期的采访中表示还想做更多,“我们也在考虑唇语输入,现在已经有demo版了。”

集全公司之力All in人工智能,搜狗输入法首家推出全新的“AI写作助手”就成了顺理成章的事情。尽管作为一项全新的功能,AI语料和对情绪、语气的拿捏仍然略显怪异,但在强大的机器学习下,相信经过用户们的使用与调教后,汪仔也能写出更精彩、更以假乱真的文案。

以后和你聊天的还真不一定是“人”。那你猜,会不会有人工智能永远也说不出来的话呢?