本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】专访“流利说”首席科学家林晖:如何用机器学习帮中国人说好英语(4)

时间:2016-11-13 12:03来源:本港台直播 作者:开奖直播现场 点击:
林晖 :它是今年7月发布的,但是研发其实时间挺长的。我们一开始想的是通过这种碎片化的内容,就是比较轻量级的。当然这也是我们的一个特点,就是

林晖:它是今年7月发布的,但是研发其实时间挺长的。我们一开始想的是通过这种碎片化的内容,就是比较轻量级的。当然这也是我们的一个特点,就是说你用户因为这个进来了,流量有了,但是其实里面有很多用户其实是有这种诉求是说,我希望比较系统的提升我的英语能力,而不是只练发音。

这就是为什么懂你存在。懂你是不管你水平怎么样,先进来给你做个定级测试,你的英语水平是一级还是二级还是三级。

PW:那个级别是统一的标准,还是你们自己定的?

林晖:我们跟欧标是匹配的,就是相当于我们有一个严格的匹配。我们现在大概分了七个还是八个级别,八个级别,每个级别都对应欧标的比如说A1、A2、B1、B2这种,这个我们做了对应表,这个做了严格的对应。这个课程在全方位的帮你提升英语水平,不单是发音。

PW:所以其实你们是从2012年到今年主要做的事情是积累数据,加来做这些具体的产品。

林晖:对,整个脉络就是工具、社区,现在开始做服务。一开始是工具。

PW:工具、社区就是用来搜集数据的。

林晖:对,在这个过程中我们搜集了非常多的数据,技术其实也在演进。产品和商业模式也在演进,产品的进化的路径就是工具。我们先用一个工具的方式切入,人来了,他要练发音,练口语,进来了,怎么绑住他们?社区。怎么样变现?那就是服务,其实是这个脉络。但是技术上是从跟读再到识别,再到这种,除了发音以外所有纬度的评测。

其实懂你英语里面还有我们核心技术的另外一块,就是所谓的自适应的学习的部分。就相当于你可以认为之前的识别是听觉,评测也是听觉,感知,但是人工智能需要认知和决策。你到这个教学里面的话,它就是要能够懂你,为什么叫懂你英语。懂你英语不单是能听懂你,它要知道你的知识点的缺陷,你的各种能力,你的技能都掌握到什么程度,它要懂你这个内容,和内容能够帮你提升什么。

有了这些以后,那它的另外一个技能就是它做决策,怎么样一个方式来教你是能够最适合你的,最能帮助你提升你的水平的。这里面是我们叫自适应学习的技术。它也用到了深度学习的一些进展。

PW:能不能大概讲一下这个自适应是怎么样运作的,以及它达到的目的。

林晖:现在在线教育这一块,自适应其实还蛮火的,大家都在说做自适应。它本质上要解决的问题就是千人千面,个性化教学,因材施教。每个人的学习路径是不一样的,那怎么做到这一点?自适应是这么做的,就是通用做法。其实也不难理解,一句话来说就是缺啥补啥。我要知道你缺啥,我要知道我这一块内容是补啥的,那我就给你什么,这是最简单的一个解释,其实比这更复杂,但是基本的思路是这样的,缺啥补啥。

一个学英语的人,他会说英语,他可能真的不知道什么语法,他可能不知道什么是定冠词,什么是不定冠词,这个东西其实不确定。

另外更大的原因是说,你有了这个知识体系以后,你还得把你的内容挂上去,这件事情是非常繁琐的。你想象,比如说如果你有一千个,你要更细的话一万个,甚至十万个知识点,你要把你的内容都跟这个做对应,这个工作量大,比你编写这个教材的工作量要大得多得多。这件事情其实我们觉得不太靠谱。

所以我们决定还是用以前的思路,也就是数据加深度学习。如果我们能够有不断的数据进来,我们再结合深度学习技术,是不是能够来解决这个问题,那其实你想想,知识点的作用是什么呢?它其实就是解决了一个把学生和内容关联起来这件事情,缺啥补啥。

机器要知道这种关联性,需要大量的数据,这个我觉得OK呀,我们产品上线,用户在用,所以数据就源源不断进来。

这个数据是什么?这个数据其实是我觉得互联网产品最神奇的地方。比如说Google的搜索,它的数据其实也是源源不断来的,但是这个数据很有价值,因为它来自用户点击。用户的点击行为就能够教到机器说用户喜欢什么,这个我们在术语叫做带标签的数据。

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容