本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】讲堂|黄学东:微软是如何利用人工智能技术做好语音识别的(3)

时间:2017-04-22 07:22来源:本港台现场报码 作者:开奖直播现场 点击:
微软在人工智能方面有四个重要的技术。(1) 计算 非常重要,以Azure为代表,我们在基础架构上有很高的投入;(2) Service 方面,我们提供了很多如微软

微软在人工智能方面有四个重要的技术。(1)计算非常重要,以Azure为代表,我们在基础架构上有很高的投入;(2)Service方面,我们提供了很多如微软认知服务、微软认知工具包等服务和工具,大家可以使用它们创造各自的人工智能应用;(3)我们的应用都会利用微软的认知服务来增强它们的智能特质;(4)我们认为人工智能最有标志性的是对话,所以在对话里我们有几个具有代表性的Agent。

刚才提到的微软认知服务,它包括了20多个人工智能领域的API,我们将其打包,以云服务的方式提供。如果你是一个开发人员,那么你不需要掌握人工智能、计算机视觉、机器翻译等等的技术知识,只需调用API就可以了。通过这种形式,微软为广大的应用开发人员提供了一个良好的服务。

而源自于中国团队的微软小冰,其语音合成基本上达到了非常高的水平。小冰的自然度、情绪表达能力已经很接近人类水平了,比业界其他的合成系统有一个很大的提高,这也是得益于深度学习。

另外,微软的研究使得语音识别在Switchboard达到了很高的水平,但是跨领域的语音识别performance还是一个问题,所以微软提供了一个可以量身定制的语音识别系统。微软的自定义语音服务(Custom Speech Service)在每个人的应用场景里都可以完全量身定制语音识别系统。这是微软把人工智能普及化的最好案例之一。

接下来,讲讲我们团队在机器翻译里的进步。微软机器翻译其实做了很长时间,目前机器翻译我们可以同时支持100个讲不用语言的人使用。如果我的演讲PPT是英文,我要把它翻译成英、法、日、德等,只要用手机下载了Microsoft Translator应用,照一张相就可以翻译成你需要的语言。Microsoft Translator可以支持60种语言的翻译,所以当到任何地方去,只要用Microsoft Translator,就可以消除所有的语言障碍。

Microsoft Translator的现场翻译功能是一个非常有意义的使用案例,也是用深度学习来达到一个非常高性能指标的成功案例。它用的神经网络语言模型是联合模型,不仅仅是原语言、目标语言的dependency都可以用神经网络来训练,它用的语言模型也是LSTM。以前统计机器翻译的运作方法和语音系统非常类似。现在最新的神经网络机器翻译,atv直播,其实非常简单,它就是有一套输入系统,用的是LSTM,有一套输出系统用的也是LSTM,LSTM输入系统有一个最后的状态,这个状态通过一些加权,可以通过解器的方法产生输出的语言句子,基本的架构就是这样。

  

wzatv:【j2开奖】讲堂|黄学东:微软是如何利用人工智能技术做好语音识别的

和传统的机器翻译相比,神经网络机器翻译像语音识别一样,有了一个大幅度的提高,涨了四个点。做机器翻译研究的应该都知道,这是一个很了不起的历史性的进步。目前,语音识别在有计算资源的情况下可以达到人的水平,我相信,机器翻译也指日可待。

尽管我们语音识别达到了历史性的水平,但是语音理解还有很长的路要走。微软在智能客服方面做了很多工作,现在微软产品的客服上已经使用了有深度学习的人工智能,这个功能目前已在微软美国上线了。

如果,用户有关于微软产品线的问题需要相关的支持,这时就是微软人工智能在帮忙回答问题。这里涉及的是有深度的,也很有挑战性的客服问题,是需要有深度训练的人工智能。比如,问-怎么样才能升级Windows?人工智能回答-你现在的Windows是什么样的产品?用户-XP。然后它会给你具体的建议,如果不满意,那么可以点击一个链接,这时候就有真实的客服人员帮你解决问题。智能客服的经济效益是极大的。

微软用最先进的人工智能帮用户解决问题,而这也是微软的人工智能和其他人工智能最不同的地方,理念的不同,产品思路的不同。

刚刚讲了好几个案例,从语音识别到语音合成到智能客服,他们都得益于深度学习的进步。其实我们最大得益于的是微软有一个自己开源的认知工具包,叫Computational Network Toolkit(CNTK)。它为我们提供了强大的计算力量。有人会问,强大到什么地步?大家都知道谷歌有一个TensorFlow,它非常流行,大家谈到深度学习一定会觉得TensorFlow很强大。此前英伟达做了一个评测,这个评测是图型越高越好。黄色是谷歌的TensorFlow,蓝色是微软的CNTK,可以看出不仅仅是一个GPU、两个GPU、四个GPU、八个GPU,微软是全线超越最流行的深度学习工具包。

  

wzatv:【j2开奖】讲堂|黄学东:微软是如何利用人工智能技术做好语音识别的

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容