本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

wzatv:【j2开奖】重磅 | 亿万词汇构建神经网络,Facebook提出语言模型训练新算法(3)

时间:2016-10-26 17:44来源:本港台直播 作者:118开奖 点击:
正如表格 2 中显示的,我们的小模型在几天内就达到了 43.9 的 perplexity 值。我们的大模型在 6 天内达到了 39.8 的 perplexity 值。目前最好的 perplexity 值(越小

正如表格 2 中显示的,我们的小模型在几天内就达到了 43.9 的 perplexity 值。我们的大模型在 6 天内达到了 39.8 的 perplexity 值。目前最好的 perplexity 值(越小越好)是 30.0,由 Jozefowicz 等人在 2016 年达到。这个结果是他们用 3 周的时间,使用了 32 个 GPU 达到的。他们也声称使用 18 个 GPU 训练的更小模型,达到了数值为 44 的 perplexity 值。我们的小模型的速度为 180 毫秒/批,并在一个迭代(epoch)后(迭代时间大约为 14 小时)达到数值为 50 的 perplexity 值。不使用 cuDNN 加速库,小模型的速度为 230 毫秒/批,这比之前只慢了 30%。

©本文由机器之心编译,转载请联系本公众号获得授权

  ?------------------------------------------------

加入机器之心(全职记者/实习生):[email protected]

投稿或寻求报道:[email protected]

广告&商务合作:[email protected]

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容