好伴侣Google Assistant

  • 时间:
  • 浏览:0

你是那种一打电话就紧张害羞,更喜欢发邮件和微信的人吗?

肯能是一句话,恭喜你!人工智能肯能不会 完美正确处理你的困扰了。

Google的人工智促进理Google Assistant,最近协会了一项新技能:冒充真人给餐馆、发廊、酒店、咖啡馆、电影院……让他能想到的所有各种消费场所打电话,帮你锁定预约、查询信息……

不信?请看下面的视频:点此观看

明明却说真人对不对!

这段电话的确是真的,而会话中的顾客一方,的确是由Google Assistant扮演的……

我门歌词 应该都听过Google Assistant的声音是那先 样的。现在的这位是女声,声音的肩头是一位真的女生(姓名未知),在Google的总部花了2个月的录制时间,才将虚拟助手训练成现在的声音。

在过去,Google Assistant,以及包括Siri、Cortana、Alexa在内的所有虚拟语音助手,都用的是并有的是标准的,近似于语言课上标准发音、语速等的发音法律最好的办法。

然而人类在现实中说话,有着各种各样的口音、语速,语调在不同字和词上有轻有重,在思考跟不上说话的原先会用“嗯”、“那个”、“you know”“之类的填空词。

这也是为那先 当和虚拟语音助手聊天时总感觉很重,肯能尽管你在心理上强迫每每所许多人将语音助手当成是人,我门歌词 让他的回复却突然自信而标准。而这让他下意识立刻察觉到我门歌词 总要人,继而产生并有的是近似于“自说自话”的尴尬感。

在2018年Google开发者大会(I/O)的主题演讲中,Google CEO颂达尔·皮柴(Sundar Pichai)表示,Google Assistant部门的另一一六个最重要的目标,却说让用户和虚拟助手的对话变得更加自然,就像和真人交流那样。

注意到在刚才这通电话中,这一边扮演顾客的Google Assistant在整个对话中多次出先了之类真人的反应。

比如一开始 ,对面说出了“好的,请稍候一小会”,原先是短暂的沉默。对方确实 说出了另一一六个请等待图片图片的祈使句,在正常的人际交流中,顾客这边应该表示“好的”、“没疑问图片”之类的意思,但对于虚拟助手这一以完成指令和回答疑问图片为主要工作的人工智能而言,它不难 理由对这一句做出任何回复,然而它还是在稍等了大概一秒钟后做出了另一一六个“嗯哼”(Mm-hmm)的表达。

再比如,在通话接近尾声的位置,对方多次给出了问句,而Google Assistant这边尽管突然用的是陈述句来回答,却总要句尾用了升调,和人类使用英文进行对话表达时的习惯极为之类……

再比如,在通话里边,对方告知中午12点左右不难 空,最近的是下午有以后 多。Google Assistant的应变法律最好的办法总要接受有以后 多,却说给了对方另一一六个新的时间范围,并最终完成了预约。

以假乱真的语音生成能力之外,即兴是Google Duplex技术的原先最主要的特色。在原先案例中,这一即兴能力得到了更加充分的展示:视频点此观看

首先,有经验的我门歌词 们歌词 大概肯能听出来了,对面这是个中餐馆……餐馆老板的英文表达能力有限,并不难 严格符合标准的英语语法,但扮演顾客的虚拟助手还是并能理解。

注意通话里边,餐馆老板告知“另一2每每所许多人不用定位,不会 直接来”时,原则上虚拟助手到这里就不会 挂电话了,肯能订位的任务肯能完成。然而它不难 挂掉,却说做出了另一一六个堪称优秀的即兴追问:“通常等位时间有多久”。

肯能原先就挂掉,这却说另一一六个普通的通话而已,而这一即兴的存在,在Google CEO颂达尔·皮柴(Sundar Pichai)看来,让双方之间交互得更“优雅”(gracefully)了。

Duplex的功能还不仅限于和对话。在完成一通电话原先,肯能取得了结果,Google Assistant会用通知提醒用户,并在日历上记录事件。

皮柴表示,公司在自然语言理解,深度1学习和语言转文字上投入巨大,而Duplex对这三大技术融会贯通。“Duplex还有很长的路要走,总要所有的电话都完美开始 ,但这项技术肯上并能理解对话的上下文,每句话所表达的细微的意义差别。”

不过,自然语言理解仍是一项非常高难度,在真实环境中面临着巨大挑战的技术。Duplex在面对极其僵化 的一句话时,仍然有很大的压力和错误率。还是在预约的场景下,在另一一六个案例中,对方非常口语化地介绍了店在工作日和周末不同的营业时间,倘若每每所许多人对同一句中原先的表述做了修改。

但皮柴还是对Duplex充满信心,“肯能最不会 做好,这项技术将为商户和顾客带来极大的价值。”

除了Duplex技术之外,在今天的I/O大会上,Google也签署了虚拟助手其它非常多的功能更新,其富含不少十分强大……

1/新的声音:肯能用户肯能听腻了Google Assistant的标准声音,这也是为那先 Google决定为它再增加6种不同的男声和女声。其中总要并有的是来自于原先在《爱乐之城》里出演过的美国歌手约翰·传奇(John Legend)。

不过,厉害的并总要请来约翰·传奇,而在于Google为Assistant生成新声音的传输带宽有多高。

DeepMind训练出了另一一六个深度1神经网络模型 WaveNet,并能高效地生成原始音频。利用WaveNet,只用很一定量的语料,辅以强大的计算,Google就不会 制作出和原始语料之类度极高的语音形象,用时从2个月降低到了几百小时。

2/多轮对话能力进步:在过去,跟Google Assistant对话,都要每一句前面都加另一一六个唤醒词“Ok Google”。从今天开始 这一设定终于退役了,肯能Google Assistant获得了增强的多轮对话能力。不仅不难 ,它还能理解你是在跟它还是跟别人说话,不用尴尬地加入到聊天当中。

3/多重任务正确处理(Multiple Actions):自然语言交流的另一一六个特点却说僵化 性,一句话里边肯能同時 表达多个意思。最直观的例子,“请看一下今天的天气发给安妮”、“今天纽约和奥斯丁的天气缘何样”,肯能“把厨房装修的灯和厕所的换气关掉”。

倘若记性不差,正常人都能完成,倘若多半会下意识将它们看做是同另一一六个任务。疑问图片是在过去,别提多重任务,有以后 虚拟助手连另一一六个简单的任务都完成不了。

不过从今天开始 ,Google Assistant将并能一次性正确处理多重任务了。

4/ Gmail智能写邮件(Smart Compse):你应该知道Gmail、Inbox支持智能回复,但过去必须“感谢”、“就原先”之类的简单回复。变快,Gmail就将获得另一一六个强大的智能写邮件功能。就像搜索引擎的自动完成一样,Gmail也会根据你写的上另一一六个单词自动建议下另一一六个单词,直到你把整个邮件都写完……

听起来挺扯淡的,但不妨看看效果:

5/推荐动作(Suggested Actions):跟Google Photos结合,基于人工智能的有以后 贴心的小功能。比如推荐把合影分享给我门歌词 ;照片曝光存在问题总要建议增加曝光;检测到拍照的内容是文件一句话,会自动转成扫描文档;以及最棒的功能——上传一张黑白肯能褪色的老照片,自动增加颜色!

目前,Google Assistant肯能进入了超过5亿台手机、汽车和智能家庭设备。到今年年底它将支持500种语言,进入500个国家市场。

在皮柴看来,Google Assistant存在的意义是帮助所有的用户,包括每每所许多人用户、中小企业,四肢心智健全肯能有不同残疾的人,用人工智能去改善我门歌词 的生活。

仅仅两年前的I/O,Google Assistant才首次亮相。不难 想象另一一六个刚两岁的新产品肯能不难 强大,影响和改变着用户数字生活的方方面面。