本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

【j2开奖】AI 战略剑指GPU,英特尔Nervana 平台将推首款深度学习芯片(3)

时间:2016-11-19 04:14来源:118图库 作者:本港台直播 点击:
这种灵活性进而将允许转化器在执行命令之前,对必要的重塑或重组进行推断。另外,这些推断的张量轴排序随后在整个计算图上会被进行优化, atv ,用

  这种灵活性进而将允许转化器在执行命令之前,对必要的重塑或重组进行推断。另外,这些推断的张量轴排序随后在整个计算图上会被进行优化,atv,用于对潜在的运行时间和硬件平台的推断进行排序,来在本地对Cache 和运行时间或执行时间进行优化。

  这些能力突出了ngraph的一个原理,就是能在一个足够高的抽象层中运行,其中转化器能在不需要一个“足够高效的智能编译器”的情况下执行命令,同时也能允许用户和前端更加容易地把这些块(block)组合在一起。

  前端

  绝大多数应用和用户并不需要ngraph API 所提供的全部的灵活性,所以我们还推出了一个更高水平的neon API,它会给用户提供一个可组合的接口,另外还有多个常用的构建模块,用于搭建深度学习模型。其中包括东西的有:常用的优化器、权值以及层类型,比如线性、批处理规范、卷积和RNN。

  我们还用在MNIST数字、CIFAR-10图像和 Penn Treebank 文本语料库上训练神经网络的例子,呈现具体的使用。

  下一代neon深度学习API,加上ngraph后端机械,最终将取代我们当前的neon库,同时仍然提供与此前一样领先世界的性能,以及广泛的开放模型目录。当性能,稳定性,可用模型和工具匹配当前可用的模型时,我们将进行此转换。预计这将在未来几个月内实现。

  我们还意识到,用户现在已经知道并使用现有框架,并且可能希望继续使用/组合在其他框架中编写的模型。为此,我们演示了将现有TensorFlow模型转换为ngraph的能力,并使用ngraph转换器执行它们。这个输入者(importer)支持今天的各种常见操作类型,并将在未来版本中得到扩展。我们还计划在不久的将来实现与其他框架的兼容,敬请关注。

  此外,我们希望强调,因为ngraph提供了深度学习计算和多个高性能后端的核心构建块,所以添加前端是一个简单的事情,对后端(或新后端)的改进自动利用所有现有和未来的前端。因此,用户可以继续使用他们喜欢的语法,同时受益于共享编译机制。

  转换器

  考虑到现有技术模型都要使用数百万甚至数十亿的参数和数周的训练时间,所以确保模型以最小的内存消耗快速执行是至关重要的。鉴于我们建立和维护最快的深度学习库的经验,我们对现代深度学习的复杂性感到庆幸:

内核融合/复合

高效缓冲区分配

训练与推理优化

异构后端

分布式培训

多个数据布局

新硬件提升(例如:Nervana Silicon Technology)

  考虑到这些现实情况,我们设计了ngraph转换器,通过干净的API,把从前端获得的细节进行自动化和抽象,在允许强大的用户空间同时调整所有事物的情况下,但又不限制模型创建过程中抽象的灵活性。

  在ngraph中,我们相信实现这些目标的关键在于站在巨人的肩膀上,吸取现代编译器设计的经验。在选择编译器优化的设置和顺序时,用于转换器时,可以提高灵活性。

  这些操作原则增加了我们工具的灵活性,同时降低了复杂性。这使得贡献者更容易添加后端代以支持外来模型,而不需要理解或修改系统中其他地方做出的假设。

  每个ngraph转换器(或LLVM术语中的后端)都针对特定的硬件后端,并且被当成是一个接口,来将一个ngraph编译到一个计算机中。用户会把其看成是一个函数句柄评估,来进行衡量。

  今天,ngraph带有用于GPU和CPU执行的转换器,未来,我们计划采用异构设备转换器,支持分布式训练。

  一个简单的例子

  

【j2开奖】AI 战略剑指GPU,英特尔Nervana 平台将推首款深度学习芯片

  现状与下一步的工作

  由于这是一个预览版本,我们有很多工作要做。

  目前我们包括以下示例:

使用MNIST和CIFAR-10的MLP网络。

使用MNIST和CIFAR-10的CNN。

使用Penn Treebank的基于字符的RNN。

  在Nervana被英特尔收购之后,我们拥有一个快速增长的世界级专家团队,涵盖编译器,分布式系统,系统软件和深入学习等项目。我们正在积极努力:

  1.几个性能方面的努力:

关于融合/复用和存储器共享的进一步工作

并发操作执行

流水线数据加载

  2. 图形序列化/反序列化。

  3. 进一步改进图形组合性的可用性/优化。

  4. 为更受欢迎的前端添加额外的支持。

  5. 分布式,异构后端目标支持。

  6. 具备互操作性的C API,用其他语言也能够创建/执行图形。

  7. 现代的,云原生模型部署策略

  8. 支持增强学习的网络架构前端

  :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

  简历投递:j[email protected]

  HR 微信:13552313024

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容