
【这是三年前的一篇“老”推文,坦白而言,三年前我们在经管圈谈论“机器学习理论”之时,还有太多圈内人不接受。但是,仅仅三年,一切都“翻天覆地慨而慷”的感觉,总之,百年未有之大变局的时代,每个中国人一定要心胸开阔,不断努力】
在开始讨论之前,我解释一下 “经管类学生”指的是哪类人?
我主要指的是国内主要财经类的高校的学生。比如我们首都经济贸易大学,就是一个非常典型的财经类高校。这类高校的特点非常明显。
这类学校的学生对“机器学习理论”(Machine Learning),是非常陌生的。
今天的推文,我们并不打算诸如现有网上的关于《机器学习理论》的科普,展开讨论,我们更愿意把最核心的一些问题在这里说一下,进行一个“另类”科普。我们完全站在“财经类”院校的视角来说说《机器学习理论》,而不是现在互联网上《机器学习理论》的科普,因为这类介绍都是计算机系的学生和老师写的,他们的视角还是“深深”的工科思维和计算机科学思维。
我们今天重点说说以下几个问题:
”机器学习理论“(Machine Learning)是人工智能领域的理论核心课程。任何学科,包括经济学、金融学要想成为一个学科,它必须得和数学(或者统计学)发生亲密接触,建立基于数理(英文该是quantitative,也就是量化)的理论大厦才能算是一个真正的科学学科。人工智能也是如此,机器学习理论是人工智能学的理论学科。
对于初学者,希望你们不要过多的纠结于一些国内翻译上的差异,专注于核心知识。初学者可以认为“机器学习理论”基本上和“统计学习理论”是一回事,当然实际上“机器学习理论”的内涵和外延比“统计学习理论”大。
人类的知识是有很多层次的。学习知识关键是应该学“内核型”的知识,也就是重理论,不要过于偏重于虚无缥缈的“概念”。
现在很多热的概念,比如:互联网金融、大数据金融、互联网+、云、物联网、区块链,甚至人工智能+各种概念更像是商业炒作。这些都是非常外围的知识,各位同学,必定,大学阶段学习还是扎实点好。学点真知识比较好,少些花架子。
机器学习理论就是属于内核型知识。学好了机器学习理论,你就能识别那些是虚无缥缈的“概念”,因为虚无缥缈的概念学太多除了让你“迷糊”和你自己的时间被浪费外,其实什么都学不到。
学好机器学习理论需要什么背景呢?
其实,具备基本的数理统计知识就够了。
经管类学校的学生还是开设了不少数理统计的课程。浙大的那本数理统计作为先导课程,其实对于学习《机器学习理论》是够用的。
任何介绍《机器学习理论》的书籍、网站会告诉你,现在机器学习理论包括三大理论:
其实初学者用以下的思维记忆机器学习理论的概念就可以了:
监督学习和无监督学习都偏统计学领域。
增强学习理论要学好,对于财经类院校的学生,你可以搞点高级宏观经济学的理论书籍看一看,会更好。主要原因是,增强学习理论最常用的数学工具包括:动态规则、最优控制、马尔科夫过程与蒙特卡罗模拟,这些都是高级宏观经济学非常喜欢的数学工具。
其实前面也说了,《机器学习理论》是“内核型“知识,区分民科和受过正规高等教育训练的专业人员之间,其实差的就是“内核型知识”的掌握(和训练)。这个区分民科和高等教育者之间的判别“定理”,也算是放在哪个学科都是适合的。
特斯拉的老总Elon Musk说过,他说这个时代所有的商业概念(他指的应该是诸如什么互联网+大数据这样的忽悠不明真相的吃瓜群众的概念)都是前菜(starter),真正的主菜是人工智能产业的兴起。而《机器学习理论》却是人工智能领域的核心理论知识。因此,机器学习理论重要吗?公道自在人心,我们无需多废话,多解释了!至于该不该学,你自己决定嘛!你懂的!

我有一个高校的好朋友,算是个在计量经济学领域有建树的年轻学者。他有次在一个高校计量经济学会议上说,现在本科的计量经济学教材有点与时代脱节,他建议使用麻省理工Joshua Angrist的《基本无害计量经济学》又或者是Angirst写的《功夫计量》,很多高校老师是同意他的意见的,据说他这个建议还在高校某论坛上被转载了。下图是麻省理工的Joshua Angrist,和他的宝书《完全无害计量经济学》。我们推文曾在一两年前,以前分享过他的介绍,因为年代久远,我找不到了。


可喜的事情。国内普遍高校已经在用新的《计量经济学》的课本了。我有同事说,陈强老师是个默默突然改变了国内计量经济学教育的男人。至少无意间,至少让普遍高校学生的“计量意识”提速15年,至少是从刀耕火种的原始社会时代进化到了前工业文明时代。该书秉承了当代计量经济学的思想-------因果推论!!!

我说这些什么意思呢?我想说两点:
第一、当代主流的计量经济学的思想是Joshua Angrist教授的计量思想。这在国内学术圈已无争议。这种思想是什么样的思想呢?说白了,就是重解释“因果推论”。基于因果推论,当代计量经济学也建立起来了严密的分析讨论和分析方法(说俗点就是:套路深深,如果你不认真学习,哪怕你是学统计出身的,也会有很多科研细节搞不懂。搞不懂!那就没法发学术文章了!)。而传统的计量经济学本科教材(我不点名)基本上是一本基于最小二乘法的统计教材,说白了就是......目标不明确,你到底要干嘛?是要搞预测还是要搞解释。搞预测,人工智能领域的学者认为你太不专业。搞解释吧,当代计量的学者认为你的东西太老太过时。传统的计量经济学本科教材的第二部分,一般就是写了些时间序列的知识,然后又无法说清楚具体应用场景,财经类高校很多学生的智力认知水平停留在了”格兰杰因果检验“,然后就没有然后了............
这些传统老套的计量经济学知识,在当代计量经济学者眼里是被摒弃的,所以学生拿着格兰杰因果检验那点认知去发学术文章是基本没啥戏,基本属于直接被鄙视的对象。 如果把传统计量经济学的知识,拿到现实世界中呢?
哎!这个.....哎!更悲催。业界的人基本不“了”你!
下面说说我想说的第二点!
《机器学习理论》是干什么的呢?
统计学生出了两个”娃',一个是《计量经济学》,一个是《机器学习理论》。统计学其实最会干两个事情!
第一:解释,也就是因果推论,这也就是当代计量经济学干出了“丰功伟绩”的事情!!!
第二:预测!!!这就是《统计学习理论》干的事情。
小结一下,现实世界,业界其实关注的是“黑猫白猫,捉到老鼠就是好猫”的生存原则,这个世界喜欢这样的生存法则。说白了,我们重视理论或者模型的预测结果!!!
要是你的模型预测准,也许我们并不知道为何会如此,内部的因果关系为何?但we like it, we love it,we use it.
所以,现实世界,实务界,人人都爱《机器学习理论》。
财经类高校学生,你们是时候学点《机器学习理论》了。
前面其实基本解释清楚了机器学习理论和计量经济学的关系。
当然还需要强调一下,《机器学习理论》的增强学习理论,应该不算统计学的范畴。
经济学里面有两种研究方法:一种叫结构型(structural form)研究方法,一种叫简约型(reduced form),简约型基本都认为就是利用计量经济学的方法研究(可以认为是统计学范畴),而结构型比较特殊,其实如果我们要类比,不妨这么类比:
监督学习和无监督学习类似于经济学的简约型。
而增强学习理论类似于结构型研究方法。
这也就是我前面为何建议各位如果,如果是经管类的学生想学习增强学习,为何不妨结合高级宏观经济学模型一起研究的原因。
当然,对于初学者,尤其是财经类高校的学生,你可以也可以这么简单记忆。
不妨认为:机器学习理论关注预测,而计量经济学(乃至整个经济学)关注解释。
第一步,买书,买以下这本书。特别说明一下,学习这本书,不需要计量经济学的背景知识,也许初级计量经济学的知识对你反而是有害的。该书背后的案例使用R语言实现的,建议你们学习Python。

第二步,学习Python。安装Anaconda软件。具体安装说明可以见以前的推文。
【总0195-量化讲堂085】如何安装Python?
第三步,学习sci-kit软件包。sci-kit软件包是Anaconda里面自带的。
然后访问Sci-kit的主页,该主页上有教学和案例。
http://open.163.com/special/opencourse/machinelearning.html
第四步,学习吴恩达的公开课。当然这步可以和前面几步结合起来。
吴恩达的公开课在网易公开课里面有。
http://scikit-learn.org/stable/user_guide.html

当然你要是能一边学习《机器学习理论》又一边学习《高级计量经济学》,我觉得国家需要的复合型人才,一定就是你!民族实现复兴指日可待,何愁大业不成。
当然你可能要问,“深度学习理论”该去哪里学?
你先学好基础好不好,学好了基础,你再去攀登科研高峰嘛!
先把这些基础知识学了,下一步可以学习深度学习理论(如果你真想搞懂,而非仅是用用某个软件包,跑点软件包里的案例,然后把结果放在网上,装装大神。)
当然你可能还要问,学好了以上我推荐的《机器学习理论》后到底算个啥水平?
客观而言,算是顶级高校的本科大三、大四水平吧!一般国外高校的研一水平。
不要灰心。必定世界很大,能人很多。
如果你认为你未来的人生是星辰大海,那么第一步,你要做的是:
Keep Calm and Believe in Yourself.同时还要


要学的东西很多,所以发展路径和学习路径最好不要错,这也是我写这个推文的目的。

我写这个文章耽误了我两小时做科研,对我自己的福利是一种损耗,写推文也不计入高校科研考评,但是我觉得,作为高校老师,需要把正确的知识推广出去,让足够多的年轻人知道该知道的正确知识,这对我们这个国家是有利的。不管如何,看到这个文章的年轻人,一定会有一些收获的,所以写这个“口水型”文章对社会整体的福利是有那么一点提高的,不是完全是无用的。
所以我还是决定写了这样一个文章,希望对你们年轻人有帮助。
如果年轻人,你们觉得好!就请把文章转出去,让更多的年轻人知道(该如何规划你们大学的学习时间)。
最后如果有对宏观经济学,尤其是结构型经济学研究感兴趣的同学,我可以推荐几本书。其实以前也推荐过。这是另外一个“世界”另外一个“平行宇宙”,虽然数学理论都那么相似。






