2018年最具影响力的20篇数据科学研究论文,盘它!
一个非常有趣的案例:卷积神经网络和执行坐标转化方法的失败 深度学习里几乎没有别的概念像“卷积”那样大的影响力了。对包含像素或空间表征的任何问题,普遍的直觉就是试试看CNNs。这篇论文通过一个看似微不足道的坐标转化问题展示了一个反直觉的案例,也即单纯要求机器在坐标(x,y)笛卡尔空间和一个热像素的空间之间学习一个映射。虽然CNNs似乎很适用于这个场景,来自Uber的作者们证明了卷积神经网络法最终失败了。这篇论文展示并仔细检验了这个失败案例。 下载链接:https://arxiv.org/pdf/1807.03247.pdf 反向传播法的演变 反向传播算法是深度学习的基石。尽管其非常重要,但很少有方法尝试调整其算法。这篇论文展示了一种发现新的反向传播方程变式的方法。来自Google的作者使用了一种领域专用语言,将升级的方程描述为一系列原始方程。基于进化的方法被用来发现新的反向传播原则,该原则在一系列最大训练次数后能够最大化泛化能力。这个研究发现了一些升级方程,相较标准的反向传播算法在较少次数内训练得更快,并在收敛时有与标准反向传播算法近似的表现。 下载链接:https://arxiv.org/pdf/1808.02822.pdf 在深度卷积神经网络学习时代里,物体探测领域近来的发展 物体探测就是对于特定类别图片,比如车、飞机等进行探测的计算机视图任务 ,它在过去五年里在人工智能领域里吸引了非常多的关注。这些关注,既源于该领域在实际应用的重要性,也是因为自从CNNs时代的到来,它是人工智能领域里现象级的发展。这篇论文是对近来使用深度卷积神经网络学习方法的物体探测领域著作的一个全面回顾,也对近来这些发展进行了深刻的透析。 下载链接:https://arxiv.org/pdf/1809.03193.pdf 语言交互式AI的神经网络法 这篇论文对近年来发展出的语言交互式AI中神经网络方法进行了调查。语言交互式AI可被分为三个类别:1. 回答问题的机器人2. 以任务为导向的对话机器人3. 自动化语音聊天机器人。针对每个类别,文章使用特定系统和模型为案例,展示了领域最前沿的神经网络方法,并将其与传统方法比较,讨论其进步之处和仍面临的问题。 下载链接:https://arxiv.org/pdf/1809.08267.pdf 可撤销的循环神经网络 循环神经网络(RNNs)在运行序列数据上表现最优秀,但训练起来更占用内存,也就限制了RNNs模型的灵活性。可撤销的循环神经网络,也就是“隐藏对隐藏”的转化能被撤销的RNNs,提供了减少训练所需内存的一个路径,因其隐藏状态无需存储,从而能够在反向传播算法中被重新计算。这篇论文展示了完美可撤销RNNs从根本上就是受限的,因为它们依然需要记住隐藏状态。随后,为了实现能够忘记隐藏状态的完美可撤RNNs,文章提供了存储少量bits的方法。作者这个方法达到了传统模型的近似效果,同时减少了活动内存成本约10-15个百分点。 下载链接:https://arxiv.org/pdf/1810.10999.pdf 相关报道: https://opendatascience.com/most-influential-data-science-research-papers-for-2018/ 【本文是51CTO专栏机构大数据文摘的原创译文,微信公众号“大数据文摘( id: BigDataDigest)”】
戳这里,看该作者更多好文 【编辑推荐】
点赞 0 (编辑:厦门网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |