前言
这个项目是我们尝试构建的一个有关深度学习的新型教育资源。我们的目标,是利用 Jupyter notebooks 的优势,将文字、图片、公式、以及(非常重要的)代码呈现在一起。如果这个尝试能够成功,其成果将会是一个极好的资源,它既是一本书、同时也是课程材料、现场教学的补充,甚至有剽窃价值的代码库(此处附上我们的“祝福”)。据我们所了解的,目前仅有很少的资源旨在教授(1)全方位有关现代机器学习的概念,或(2)一本引人入胜的教科书并搭配可运行的代码。相信这次尝试最终能够告诉我们,这种空白是否情有可原。
这些年机器学习社区和生态圈进入一个令人费解的状态。二十一世纪早期的时候虽然只有少数一些问题被攻克了,但当时我们自认为理解了这些模型运行的方式 及原因(以及不少的坑)。对比现在,机器学习系统已经非常强大,但却留下一个巨大问题:为什么它们如此有效?
这个新世界提供了巨大的机会,同时也带来了浮躁的投机。现在研究预印本被标题党和肤浅的内容充斥,人工智能创业公司只需要几个演示就能获得巨大的估值,朋友圈也被不懂技术的营销人员写的小白文刷屏。这的确是个看似混乱、充斥着快钱和宽松标准的时代。
于是,我们精心打磨了这套深度学习教程项目。
教程的组织方式
目前我们使用下面这个方式来组织每个具体教程(除背景知识介绍教程):
在这套教程中,我们会穿插介绍相应的背景知识。为了保证教程的流畅性,有些时候我们会将某个深度学习的模块视作一个黑箱。这种情况下,我们仅简要介绍该模块的基本作用,而将它的详细介绍放在稍后的篇章。举例来说,虽然深度学习需要使用某个特定的优化算法,但我们在一开始介绍某些深度学习方法时并不会对其中所使用的优化算法做具体展开,而是会在稍后的篇章里详细描述和讨论这些优化算法。这样一来,读者可以在不关心具体模块细节的情况下,用最短的时间掌握深度学习的主要框架和基本脉络。从业者也可快速了解自己需要使用的模型并简单粗暴地将教程里的代码直接应用在解决自己的实际问题中。
独特的学习体验
这套深度学习教程将为大家呈现以下独特的学习体验。
易用高效的MXNet
我们将使用MXNet作为这套教程所使用的深度学习库,并重点介绍全新的高层抽象包gluon。我们选用MXNet是因为它兼具易用和高效的优点。无论对研究者还是对工程师而言,无论是在科研机构还是在工业界,工具的易用与高效将从各个方面显著提升生产效率。
双轨学习法
在介绍大多数机器学习模型时,我们既会教授大家如何从零开始实现模型,也会教授大家如何使用高层抽象包gluon实现模型。从零开始实现模型有助大家深入理解深度学习底层设计。使用高层抽象包gluon将把大家从繁琐的模型模块设计与实现中解放出来。
通过动手来学习
许多教科书在介绍深度学习时,都极尽所能地呈现所有细节。例如Chris Bishop的经典教材,《模式识别和机器学习》,将每个课题都讲解得极为详细,以致于阅读至线性回归的一章就需要巨大的工作量。当我(Zack)首次接触机器学习时,便发现这种讲解方法并不适合作为一本入门读物。而多年后重读它时,我热爱它精确而缜密的讲解,但仍不认为这是一本初次学习时应该使用的教材。
我们坚信,学习深度学习的最好方式就是动手实现深度学习模型。
游戏之所以好玩,是因为游戏给玩家提供了及时反馈:提高属性立即就可以虐怪、打个怪立即就可以升经验值、捡个包裹立即就多了装备。学习之所以枯燥,是因为很多时候我们并没有在学习过程中获得及时反馈。
这套教程通过描述深度学习模型是如何一步步实现的,为大家提供了宝贵的动手实践的机会。因为教程里实现的代码都是可执行的,读者可以根据自己所学和思考课后问题运行或修改代码而得到及时的学习反馈。每个人可以通过及时反馈不断实现自我迭代,从而加深对深度学习的理解。
评论