加入收藏 | 设为首页 | 会员中心 | 我要投稿 厦门网 (https://www.xiamenwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 访谈 > 正文

专访马子雅:英特尔开源BigDL,推进AI民主化

发布时间:2017-06-07 15:03:00 所属栏目:访谈 来源:站长之家用户
导读:作为 AI 民主化计谋的重要实践之一,英特尔在2016 年 的最后一天,开源了基于 Apache Spark 的漫衍式深度进修框架 BigDL。最近,英特尔公司软件与处事奇迹部副总裁、体系技能和优化部分大数据技能总监马子雅密斯接管了新智元的专访,泛论了BigDL 的特点、

马子雅:Jason Dai是我们大数据技能环球 CTO,他在 BigDL 的架构构建和工程开拓方面施展了重要的率领浸染。在开源后 BigDL 项目获得了全天下很多开源社区用户的起劲参加:譬喻在 BigDL 开源不到两个月后,InfoWorld 就在其对深度进修趋势的猜测中,将 BigDL 与 TensorFlow、Caffe 等一路并列为今朝最风行的深度进修框架;Jason 和他在上海及硅谷的团队,基于全天下 BigDL 社区用户提供的反馈,以及和我们环球的客户/相助搭档的密合适作,为 BigDL 项目拟定了未来的蹊径图(包罗新成果、可用性、可扩展性等方面)。我们的下一个版本将在第一季度末阁下宣布,首要更新包罗:增进对 PythonAPI 的支持,提供更好的可视化体验(操作 Notebook 和 TensorBoard),增进对 macOS 的支持,提供更富厚的 RNN 支持(如对LSTM 、GRU等算法的支持)等等。

Intel-analytics 的其他开源库及对种种深度进修使命的支持

新智元:除了 BigDL,我们知道 Intel-analytics下面尚有其它的开源库:好比 SparseML等;您是否可以较量一下,这些开源库别离有什么特点?应用于哪些场景?

马子雅:BigDL 能为那些拥有大量数据、以及已建(或将建)大数据集群的用户,提供构建基于深度进修(和人工智能)的大数据说明的最优处事。BigDL 生成就可以运行在现有尺度的大数据平台(Hadoop/Spark)之上,操作民众的数据基本架构,在数据收罗、特性提取、传统呆板进修和深度进修事变负载等方面,为客户提供同一的和无缝集成的完备体验。它支持大局限的深度进修和呆板进修,并提供自动容错和自动动态弹性资源打点。

对付具有极高模子维度和大量很是稀少数据(譬喻,百亿到千亿级此外实习样本,十亿级乃至百亿级别特性)的用户,SparseML 可以明显地为他们进步呆板进修的可扩展性。很多互联网公司必要从大量的十分稀少数据中进修模子,他们面对的挑衅是现有的呆板进修办理方案无法处理赏罚大量数据或高维度模子;通过操作数据稀少性,对漫衍式呆板进修数据布局、收集通讯和算术运算的优化,SparseML 可以比现有开源的呆板进修算法(譬喻Spark Mllib)提供更高的可扩展性。

新智元:可以看出,Intel-analytics 在全力形成一个支撑各类应用场景的完备生态。那么,请应承我问一个较量详细的题目:假如我但愿举办深度进修的图像分类,应该怎样从英特尔的产物组合中选择呢?可能我要处理赏罚的数据内里既包罗图像又包罗音频,又该怎样选择呢?

马子雅:我们的方针是为呆板学惯用户和开拓职员提供从硬件到软件的最轻盈、最完备和最高效的体验。

为了选择最吻合的办理方案栈,您必要评估一些工作:(1)您是否已有了现有的基本架构,并但愿操作它来构建图像分类?(2)您最大的需求是什么:从现有的漫衍式文件体系/存储中直接会见数据存储,以实现快速的呆板进修尝试周期(turn-around time)?是与您现有的说明事变流程或平台轻松集成?照旧可扩展性(处理赏罚大量实习样本或高维特性的手段),高资源操作率,低总拥有本钱,实习机能等等?按照您对这些题目的答复,您可以选择差异的办理方案。

在硬件层面,我们有各类产物可供选择,譬喻:Xeon,Xeon phi,FPGA。未来我们还会有LakeCrest(Nervana silicon);您可以挑选最得当您的必要的产物。

在深度进修框架层面,我们正在敦促 Neon 并将英特尔优化的MKL应用于深度进修框架,好比 Caffe,TensorFlow,Theano 和 Torch 等。假如您喜好行使这些优化的框架,您可以直接行使它们或通过英特尔深度进修SDK来行使它们。

假如您已经有了大数据(Hadoop/Spark)集群或大数据说明事变流,那么您很也许更倾向在现有的大数据基本架构中来举办深度进修。我们正在敦促以 Spark /Hadoop 为数据说明和人工智能的同一平台,来支持端到端的进修事变流,包罗从数据打点,特性打点,特性工程,模子实习到最后的功效评估;那么,BigDL 将会极大地得当你的需求。

从开源到 AI 民主化

新智元:英特尔在人工智能规模所提供的产物组合已经很是富厚了,个中包罗了很多我们本日提到的开源项目,那么叨教马密斯,在英特尔人工智能的财富机关中,是怎样熟悉“开源”这件事的意义呢?将来是否会有打算推出更多的开源项目呢?

马子雅:开源项目有许多缘故起因:

1.成立一个更大的开拓社区,可以检讨我们的计划息争决方案(好欠好?那边好?那边欠好?……)。好的开拓职员喜好与好的开拓职员相助,与好的项目相助。假如我们的项目风行得足以吸引到外部职员来孝顺力气,那么我们就相等于建设了一个倍增的开拓职员社区,辅佐我们事变得更快更好;

2.加快客户行使:跟着我们的项目开源,它辅佐更多的用户和客户从我们的事变中受益;他们的乐成反过来会影响其他客户和用户行使这些办理方案。来自这些快速扩张的用户群的反馈也可以反过来影响我们的蹊径图和计划,以更好地处事用户的需求;

3.开源项目也是我们为行业和社区支持AI的理睬做出的最好的展示。

跟着我们与行业客户和相助搭档的继承相助,确定新的需求规模,我们将继承敦促新的项目开源,就像我们这次为 BigDL 所做的。英特尔致力于开源协作,确保我们的客户和相助搭档在英特尔硬件上拥有最佳、最轻盈、最完备的 AI 体验。

新智元:在英特尔的人工智能计谋中,Democratize AI 是一个很是重要的构成部门。叨教英特尔是怎样界说本身在人工智能规模的“ democratize ”的?筹备采纳什么设施来处事企业级用户和开拓者?同时,又筹备怎样更好地处事已经风俗行使CPU来做深度进修项目标用户,好比高校、研究机构中的研究职员?

马子雅:英特尔致力于将我们的技能提供应我们的社区,为客户和开拓职员开释AI在IA上的所有潜力。

我们将与开源社区普及相助,以便让更普及的受众可以操作我们的事变。在DL框架级别,我们敦促开源 Neon,并将英特尔优化的 MKL 应用于开源框架譬喻 Caffe,Tensorflow,Theano,Torch等(一个例子是英特尔和谷歌客岁公布计谋同盟,以加快呆板进修的应用,譬喻加快英特尔处理赏罚器上的 TensorFlow 机能,将高机能库如 Math Kernel Library (MKL)集成到 TensorFlow)。我们还开源基于大数据和 Spark 的深度进修框架好比 BigDL。英特尔深度进修 SDK 让客户和开拓职员易于行使和会见这些框架,以便客户可以或许更好地专注于真正增值的呆板进修事变。

(编辑:厦门网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读