本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:【j2开奖】【专访】黄学东:CNTK是我们的秘密武器

时间:2016-10-21 03:57来源:本港台直播 作者:开奖直播现场 点击:
编者按:看过昨天关于 的报道,你是不是也有问题想问参与这一项目的研究员?这里转载微软首席语音科学家黄学东在9月底接受《机器之心》采访的节选,听他分析人与机器的最大区

编者按:看过昨天关于的报道,你是不是也有问题想问参与这一项目的研究员?这里转载微软首席语音科学家黄学东在9月底接受《机器之心》采访的节选,听他分析人与机器的最大区别在于人的鲁棒性非常好,以及CNTK如何帮助微软团队持续完善语音识别技术,他同时认为人工智能研发从整体而言目前仍然处于从感知到认知的过渡阶段,前面还有很长一段路要走,不知这一判断算不算悲观?……如果你的好奇心还没得到满足,欢迎留言继续提问。

  

报码:【j2开奖】【专访】黄学东:CNTK是我们的秘密武器

黄学东

  记者:词错率从十年前的50%到今年9月的6.3%,这十年来您觉得这个速度是快还是慢,语音识别最终可能会达到人类水平,在这之后技术未来的发展方向是什么?

黄学东:这个速度还是相当惊人的。过去20 年,基本上每年错误率都会较上一年下降15%左右,按照这样的速度推下去,语音识别达到人的水平指日可待。但是人的鲁棒性比机器好很多,比如我们可以隔很远说话,人听起来没有问题;或者在鸡尾酒会大家都在谈话,人的耳朵可以很灵敏,要想听什么东西,他可以听什么东西。但是机器这个能力相对比较差,在高噪音、有口音、小孩儿说话或出现不熟悉的内容的情况下,机器6% 的水平可能会变成20%30%

这是人和机器的最大区别,人的鲁棒性非常好,一个新的课题过来,他可以通过会话的方式跟你沟通,也能得到很好的结果。而机器对噪音的抗噪性不够强,对新的课题会话沟通能力比较差。最重要的一点是,语音识别并没有理解你的语义。理解语义是人工智能下一个需要攻克的难题,这也是我们团队花很多时间和精力正在做的事情。

  要做好语音识别需要更好的语义理解,这是相辅相成的。因为你没有知识,你就听不懂别人讲的话。比如我讲一个很高深学问的问题,如果听的一方没有对我说的话题有足够的知识,基本上是对牛弹琴。

  记者:您从1993 年加入微软,到现在差不多20 年了,这期间语音研究思路上有哪些变化?微软在语音产品的思路上又有哪些变化?

黄学东:变化非常大。微软1995 年第一次在Windows 上推出了语音识别的APISpeech API,简称SAPI),非常具有历史意义。SAPI 是工业界第一个完全基于PC API,也正是由我的团队推出来。过了二十年,微软认知服务(原牛津计划)再次推出,是以云为先的语音API。很凑巧从1995 年到2015 年,20 年完成了从PC 端到云端的变化。现在微软认知服务包括21 个不同的API,其中语音识别、语言处理等部分都由我现在的团队负责。

所以我很感慨,20 年的风风雨雨,微软从PC 电脑为中心完全转型为以云为中心,其中没有变的就是人工智能。不管当时PC 为中心还是今天云为中心,人工智能都是中心的中心。

微软再往前走,云中心之后应该是以智能云为中心。人工智能没有大数据、没有强大的计算能力,就不会有很大的智能。

今天的人工智能为什么能够脱离过去几十年人工智能的寒冬,最主要的原因是两个,一是现在的数据量变大了,一是计算机运算能力提高了。有足够的计算能力,计算机“死记硬背也会显得好像很聪明。其实深度学习、神经网络这些东西早就有了,但那时计算能力不够,数据量也不够大,所以没有太多用。

现在看来深度学习能把以前不能做的事情做到了,我们每个人都在说深度学习怎么怎么牛,但最主要的不要忘了,因为现在有计算能力,有大的数据,才达到了以前我们没有达到的水平。

微软有一个开源的深度学习工具CNTKCortanaBingHoloLens AI 的训练等都是在CNTK 上实现的,不仅仅这个6.3% 的语音识别技术是在CNTK 上跑的,直播,我们的Cortana 的识别、产品系统都是在这上面跑。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容