【{$randkws}】智能音箱技能不断增加,多轮交互问题亟待解决 - {$web_name} 谷歌CEO Sundar Pichai曾强调

来源:不好意思网 | 栏目:热点 | 2026-06-14 21:27:04
  导读:3月8日,谷歌为其含有Google Home Hub、Lenovo Smart Display、JBL Link View和LG XBOOM AI ThinQ WK9在内的带屏智能音箱添加了持续对话(多轮交互)能力。

  3月8日,谷歌为其含有Google Home Hub、秋季预测DC电影Lenovo Smart Display、JBL Link View和LG XBOOM AI ThinQ WK9在内的带屏智能音箱添加了持续对话(多轮交互)能力。以解决使用者在与智能语音助手交互时需要多次使用唤醒词开展唤醒的难题。

  据悉,这一特性是谷歌在2018年5月I/O大会上针对Google Assistant与“打电话”技能一同亮相的技能。在亮相会上,谷歌CEO Sundar Pichai曾强调,他期盼谷歌的智能助手可以自然地与人开展交谈。“使用者如今可以与Google Assistant对话时,假如你想问一个难题,你可以不断询问,折叠屏智能手机而无需反复说出「Hey Google」唤醒词。”

  据雷锋网知晓,这一特性此前已然使用到谷歌的Google Home、Google Home Mini和Google Home Max不带显示屏的智能音箱上。在启动时,先是针对美国智能音箱使用者开展了参数。具体特性方面,谷歌权威给出的阐释是:Google Assistant在听闻唤醒词或回复使用者难题后,将维持唤醒状态等待8秒。

  智能音箱技能不断增多,行业出货稳步上升

  智能音箱走过五个春秋,全部行业着手稳步增长。

  在技能方面,智能音箱已然基础能够做到与使用者的日常交互,含有查天气、讲历程、清醒文案解读 听音乐,乃至带屏智能音箱也能够加入影像类特性。

  依据Voicebot统计资料显示,2018年谷歌的智能语音助手Google Assistant启动给美国使用者的技能数量为4253项;Alexa启动给美国使用者的技能数量为56750项。

  在境内,据阿里天猫精灵在2018年3月春季亮相会上公开信息显示,天猫精灵操控系统中,当下已然拥有356款技能,有6500名开发者在围绕天猫精灵做新使用的开发;据百度在2019年2月小度战略亮相会上公开的资料显示,DuerOS语音技能数量1000+,开发者数量达到27000+。

  由此可见,智能音箱在拥有的技能方面已然逐步涵盖使用者日常日常、休闲,乃至若干进修的需求。

  也由此,快速邓紫棋快报智能音箱也得以卖个好出货。据此前行业调研企业Strategy Analytics公开的2018年第四季度全球智能音箱行业报表显示,2018年第四季度,全球智能音箱行业出货总量为3850万台,环比增长95%。其中,排名前五的依然为亚马逊、谷歌、阿里、百度、小米,出货量依次为1390万台、1150万台、280万台、220万台、180万台。

  智能音箱“变种”频生

  智能音箱的行业向好也带来了诸多“变种”,从最初的智能音箱,到带屏智能音箱,再到融合电视场景。

  相较而言,智能音箱被视为入口级设备,也是巨头玩家争夺的战场。含有境内诸如阿里、百度在内的巨头品牌方,已然明确售价补贴的打法,腾讯、华为尽管起步在这一领域起步较完,但也已然启动自家智能音箱。含有国外巨头品牌方在2018年启动智能音箱时,定价策略也略有改动。

  与此另外,智能音箱的变种变成一种常态。以含有亚马逊、谷歌、阿里、百度等境内外巨头均已布局的带屏智能音箱为例,在经过近两年的行业使用和使用者感受,行业反馈已然从最初的质疑转向普遍接纳。

  雷锋网在针对此类带屏智能音箱开展长时间的使用和感受后察觉,实际上带屏智能音箱在特性上与平板电脑计算机的「娱乐」特性为主略有差异,带屏智能音箱如今仍以语音、影像类特性为主,更趋向「休闲」调性。

  另外,以便强调语音特性和培养使用者使用语音的习惯,诸如影像类使用也与平板电脑及计算机略有各异,舍弃了相应键鼠操控特性,更多依赖语音控制。以小度在家1S上的爱奇艺界面为例,舍弃了诸如侧栏的导航栏,VIP账户登陆也需要经由移动电话扫码开展授权登陆。

  智能音箱的另一类变种是结合电视使用场景的魔盒。2018年5月,阿里巴巴达摩院AI评测室和优酷联合启动天猫精灵魔盒;2018年9月,百度与爱奇艺、歌华有线联合启动歌华小果;2019年2月,百度亮相小度电视伴侣。

  以最近亮相的小度电视伴侣为例,权威给出的特性阐释标签为「Hi-Fi家人影院+高表现4K机顶盒+高端AI音箱」三合一。电视开启时,可以身为语音控制的机顶盒对电视开展语音控制;电视退出后,小度电视伴侣也可以身为「智能音箱」开展使用,含有查询天气、播放音乐等基础特性。

  这些智能音箱的“变种”身为同样以语音特性为核心能力的智能设备,最核心的需求自然也是理解能力,以及流畅的交互能力。

  多轮交互难题亟待解决

  在这样的商品推动和行业使用下,智能语音操控系统也在逐步使用。而被视为下一代交互方式的智能语音操控系统实际上当下尽管已然能够做到基础的交互特性,但是在交互的流畅性,尤其在多轮对话能力上尚待提升。

  实际上,各大品牌方也早就这一能力开展开发和适配。据雷锋网知晓,在谷歌之前,亚马逊于2018年3月为其智能语音助手Alexa添加了名为「后续模式」(Follow-Up Mode)的新技能,也正是用于解决这样的难题,经由后续模式,Alexa会在回复使用者难题后维持唤醒状态等待5秒,看使用者是否有其他难题;强行让Alexa重新进入待机状态可以使用「thank you」或「stop」这两个词来落幕对话。

  相对而言,境内智能音箱的多轮交互能力稍有滞后,据雷锋网此前对多个牌子智能音箱开展适用,某些牌子音箱也只是针对若干难题在回答后会等待第二轮交互,多数状况下,仍需多次使用唤醒词开展唤醒。可是,据此前景鲲透露,百度本年晚些时候会亮相DuerOS针对交互能力的能力提升,针对如今需要频繁使用“小度小度”唤醒词才能唤醒的智能音箱,交互感受将会进一步得到改进。

  智能音箱假如想要变得更智能,先是要解决都就是沟通障碍难题,如何经由语义理解,使得智能音箱更好理解使用者难题,并在适当时候等待下一轮交互,从而做到更自然的沟通则是如今亟待解决的难题。

  毕竟,唤醒词这东西,用多了也是很烦的……

上一篇:ChinaJoy最硬展台:AMD AI+游戏,为热爱全力以赴!

下一篇:《数码宝贝:绝境求生》高清截图曝光 2019年上线

相关文章