加入收藏 | 设为首页 | 会员中心 | 我要投稿 厦门网 (https://www.xiamenwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业

发布时间:2019-10-21 03:35:17 所属栏目:移动互联 来源:张金梁
导读:10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,1000家机构的代表、8000余人参展参会。百度首席技术官王海峰在会上发表题为《深度学习平台支撑产业智能化》的演讲,分享了百度关于深度学习技术推动
副标题[/!--empirenews.page--]

10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办,本届大会以“智能+引领社会发展”为主题,1000家机构的代表、8000余人参展参会。百度首席技术官王海峰在会上发表题为《深度学习平台支撑产业智能化》的演讲,分享了百度关于深度学习技术推动人工智能发展及产业化应用的思考,并深度解读百度飞桨深度学习平台的优势,以及与百度智能云结合助力产业智能化的成果。

产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业

 以下为演讲实录:

     各位专家,各位来宾大家上午好!非常荣幸有机会参加世界计算机大会,非常感谢中国计算机学会及大会的邀请。今天我跟大家分享的题目是《深度学习平台支撑产业智能化》。

    我们都知道,从18世纪60年代开始,人类已经经历了三次工业革命。第一次工业革命为我们带来了机械技术,第二次带来了电气技术,第三次带来了信息技术。我们回顾这三次工业革命的历史会发现,驱动每一次工业革命的核心技术都有非常强的通用性。虽然它可能是从某一个行业开始,比如机械技术最开始从纺织等行业开始,但最后都会应用于生产生活的方方面面,有非常强的通用性。除了通用性以外,这些技术都会推动人类进入一个新的工业大生产阶段,而支撑这个工业大生产的技术有几个特点:标准化、自动化、模块化。而我们现在正处于第四次工业革命的开端,人工智能则是新一轮科技革命和产业变革的一个核心驱动力量。人工智能会推动我们人类社会逐渐进入智能时代。

    回顾人工智能技术的发展,人工智能技术的发展阶段有很多分类维度,我理解大概可以归结为:最早期更多都是在用人工的规则,我26年前进入这一行的时候,其实也是在用人工规则来开发机器翻译系统;后来逐渐开始机器学习,尤其是统计机器学习,在很长的一段时间里占主流地位,也产生了很大的影响,带来了很多应用产业的价值;深度学习是机器学习的一个子方向,现在,深度学习逐渐成为新一代人工智能最核心的技术。

产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业

     举几个例子,文字识别OCR技术早期是用规则+机器学习的方法来做,那时候,一个OCR技术系统可能会分为几部分,从区域检测、行分割、字分割、单字识别、语言模型解码、后处理等一步步做下来。加入深度学习技术后,我们开始使用大数据进行训练,而且阶段目标也很明确,我们找到一些深度学习的特征,这个时候一个OCR系统就简化到只需要检测、识别两个过程,典型的基于深度学习的OCR系统大概是这样。随着深度学习技术进一步发展,我们开始在OCR里面进行多任务的联合训练、端到端学习、特征复用/互补,这个时候,甚至这两个阶段也不用区分了,而是一体化地就把一个文字识别的任务给做了。

     我们再看机器翻译。26年以前我进入人工智能领域就是在做机器翻译,当时我们用数以万计的规则写出一个翻译系统,其中包括很多语言专家的工作。20多年以前,我们做的这个系统曾得到全国比赛的第一,但是这个系统想继续发展,进入一个大规模产业化的阶段,仍然面临着很多问题。比如说人工规则费时费力,而且随着规则的增加,冲突也越来越严重,挂一漏万,总是很难把所有的语言现象都覆盖到。后来,统计机器翻译在机器翻译领域占据最主流技术的地位,像百度翻译八年以前上线的第一个版本的系统,其实就是统计机器翻译。统计机器翻译的过程当中,仍然要一步一步来做,比如说先做统计的词对齐,然后做短语的提取,再做结构的对齐等等,其中也涉及到人工特征的提取、定向的优化,仍然很复杂。大概四年多以前,百度上线了世界上第一个大规模的、基于神经网络的翻译产品,这时候我们可以进行端到端的学习了。当然了,这样一个神经网络,或者说是深度学习的系统,也有它的不足之处,现在真正在线上跑的、每天服务数以亿计人的翻译系统,其实是以神经网络的机器翻译方法为主体,同时融合了一些规则、统计的技术。

    刚才说起,随着深度学习的发展,这些技术越来越标准化、自动化。大家可以看到深度学习有一个很重要的特点,就是通用性。我们之前做机器学习的时候,有非常多的模型大家都耳熟能详,比如说SVM、CRF等等。深度学习出现以后,人们发现,几乎我们看到的各种问题它都能很不错的解决,甚至能得到目前最佳的解决效果,这和以前的模型各有擅长不一样,它具有很强的通用性。

    深度学习所处的位置,一方面它会向下对接芯片,像我们开发的深度学习框架,也会跟各个芯片厂商联合进行优化,前天我们还跟华为芯片一起做了一个联合优化的发布;向上它会承接各种应用,不管是各种模型,还是真正的产品。所以我们认为深度学习框架会是智能时代的一个操作系统。

     我们真正把深度学习大规模产业化的时候,也会面临一些要解决的问题,比如说,开发这样一个深度学习的模型或者是系统,实现起来很复杂,开发效率很低,也很不容易;而在训练的时候,我们在真正工业大生产中用的这些模型,比如说百度的产品,都是非常庞大的模型,进行超大的模型训练很困难;到了部署阶段,还要考虑推理速度是不是够快,以及部署成本是不是可控合理。

    针对这几个方面,我们开发了百度的深度学习平台“飞桨”,英文我们叫PaddlePaddle。我们认为它已经符合标准化、自动化、模块化的工业大生产特征。

产业智能化的百度经验:飞桨结合智能云,让AI赋能千行万业

    飞桨底层的核心框架包括开发、训练、预测。开发既可以支持动态图,也可以支持静态图;训练可以支持大规模的分布式训练,也可以支持这种工业级的数据处理;同时可以有不同版本部署在服务器上、在端上,以及做非常高效的压缩、安全加密等等。核心框架之上有很多基础模型库,比如说自然语言处理的基础模型库、计算机视觉的基础模型库等等。同时也会提供一些开发的套件,再往上会有各种工具组件,比如说网络的自动训练、迁移学习、强化学习、多任务学习等等。此外,为了真正支撑各行各业的应用,我们提供很多使用者不需要理解底层这些技术、可以直接调用的服务平台。比如EasyDL,就是可以定制化训练和服务的,基本上可以不用了解深度学习背后的原理,零门槛就可以用它来开发自己的应用;AIStudio则是一个实训平台,很多大学也在用这样的平台上课、学习;当然,还包括端计算模型生成平台。

    飞桨是一个非常庞大的平台,我们着重在四方面发力、且具有领先性的技术。

(编辑:厦门网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读