本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】为什么国内智能音箱难敌Amazon Echo和Google Home?(2)

时间:2016-10-09 03:25来源:香港现场开奖 作者:j2开奖直播 点击:
举一个例子,语音唤醒,国内总喜欢标榜超过了Alexa,然而,如果真拿指标这件事情说事,国内的产品虚警率飘高,莫名其妙的就误唤醒,这蛮讨厌,突然

  举一个例子,语音唤醒,国内总喜欢标榜超过了Alexa,然而,如果真拿指标这件事情说事,国内的产品虚警率飘高,莫名其妙的就误唤醒,这蛮讨厌,突然间一个音箱说话回应你一个莫须有的问题,这种事情偶尔发生也是受不了的。至于工艺设计方面,每个人都有一个审美标准,很难评判Echo和Home为何看着舒服,但是至少要比垃圾桶的音箱造型好看一些。

  精心打磨一个生态链产品,除了需要考虑多方面的细节,j2直播,还需要集中自家的优势资源。比如说语音交互, 国外巨头不断收购相关公司壮大实力,而国内公司总是喜欢自家组建小团队搞定一切,试问精力如此分散如何才能超过国外的巨头?何况语音交互压根也不是搞搞深度学习就能解决的,这本身就需要对声学和智能都有深刻的理解和长期的积累才能做好。

  |语音交互的现场感和即时性是关键因素,但是目前还是欠点火候

  语音交互毋庸置疑是继键盘、鼠标和触摸屏之后的主流交互方式,但是距离真正走入千家万户还总是差那么一点。

  这里面有很多因素,比如说厂商总觉得语音交互根本没有智能,事实确实也是如此。世界上还没有任何一家公司能让语音交互做到不傻,语音智能的水平仍旧停留在关键词的内容识别和上下文分析,所谓的语法和语感学术界都还没有清晰的思路。这需要长久的研究突破,不仅限于当前火热的机器学习和大数据,更需要考虑物理世界的概念和模型,最起也要明白婴儿学习语言的过程。从这个思路来看,j2直播,现在的人工智能距离实现真正的智能语音交互还差着十万八千里。

  很多时候我们给予大数据和深度学习过高的赞誉,反而让众多的研究人员犯了懒,这个世界从来不是搞搞数据就能明白的,对物理世界的探索,对人类哲理的思考,才是推动社会进步的力量。

  上述或许只是个共性,Amazon Echo其实也面临同样的困境,甚至还有很多人批评Echo的语音合成也不够好,因为人类总希望自己的话语能得到类似的回应。不能说Amazon不重视这个问题,事实上Amazon强化了另一层面,不是语音合成的自然程度,而是语音回答的反应速度。语音合成当前确实很难做到如同人类一样自然,但是距离这个目标也不太遥远。上个月Google发布WaveNet引起语音合成领域的震动,这是一个新的思路。在此之前,语音合成已经很长时间没有任何实质性的进步,无非就是参数化和拼接式两种方法。这几种方法笔者在《如何评价谷歌的语音合成WaveNet和微软的语音识别“里程碑”?》做了对比分析,不过,事实上这不是现阶段用户关心的重点。

  

报码:【j2开奖】为什么国内智能音箱难敌Amazon Echo和Google Home?

  事实证明,Amazon Echo的押注选择是正确的,用户更为关心的是人机对话的现场感,从指标上来分析,其中一个重要参数就是 机器的响应速度,Echo刚开始是5秒,后来压到1.5秒,再后来就是1秒以内,注意这是平均响应时间,而不是国内的峰值指标。

  人机对话的现场感挺有意思,有时候也会说成沉浸感,这从人类语言对话的发展历程可以窥得一斑。我们知道,语言交流是人类交互最主要的方式,是人类交换信息、学习知识最主要的途径,但是由于语言太过时效性,记载功能太差,与之伴随逐渐就形成了文字。由于语言的时效性,所以语言交流往往是面对面即时完成的 当然,现在人类拥有了电话,但是即便有了电话之后,语言交流仍然保持着即时性。也就是说, 电话其实就是人类语言交流的距离拓展,但是没有改变语言交流的即时属性,所以电信和互联网的发达本质上来说仍然是在享有这种红利

  

报码:【j2开奖】为什么国内智能音箱难敌Amazon Echo和Google Home?

  当然了,电信和互联网的技术还很难做到人类语言交流的水平,很多时候破坏了这种即时性。技术上常常称为单工或者双工模式,单工的时候对话者的语言是“互斥”的,不会出现声音的重叠和打断。显然,以Siri和Echo为主的人机语音交互,就是这种 单工模式。单工模式无法提供面对面交流时的畅快感和现场感,也就缺少一部分“对话”的体验。双工模式实际上是希望改变这一点,但是目前来看与人类还是有不少差距的,这些都是需要技术去克服的难点。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容