陈强老师开设现场班以来,每期课程都收获了不少好评:
目前陈强老师亲授的课程除了高级计量经济学与Stata(五一,十一开班)
还有Python机器学习(寒暑假开班)和计量经济学(线上视频,随报随学)
分别于1992年与1995年获得北京大学经济学学士与硕士学位,2007年获美国Northern Illinois University数学硕士与经济学博士学位,现任山东大学经济学院教授,博士生导师,泰岳经济研究中心副主任(主持工作)。主要研究领域为计量经济学、经济史。
已独立发表论文于Oxford Economic Papers (lead article),Economica,Journal of Comparative Economics,《经济学(季刊)》、《世界经济》等国内外期刊。
陈强老师著有畅销研究生教材《高级计量经济学及Stata应用》(第2版,高教社,2014),以及《机器学习及R应用》(高教社,2020)与《机器学习及Python应用》(高教社,2021)。陈强老师特别擅长深入浅出、直指人心地介绍数据分析原理,深受广大学生们的喜爱,其现场班常常人满为患、好评如潮。
陈强老师2023年培训计划
占座ing
能够迅速掌握高级计量与Stata的真谛、游刃有余地进行实证分析
大道至简至易,直指人心,洞明计量原理与实操
培训时间 2023年4月29-5月2日(四天)
培训地点 北京市海淀区(开课前10天发送交通住宿指南)
授课安排 上午9:00-12:00;下午2:00-5:00;答疑5:00-6:00
特色 #1 通过四天心无旁骛的学习,全面而深入地了解高级计量经济学的体系及其Stata实操。这是其他短期培训所无法比拟的。
特色 #2 在夯实计量理论基础的同时,迅速将学员们拉到当代计量实证研究的最前沿,使学员们可以先知先觉、决胜未来。
特色 #3 现场班全程由经典教材《高级计量经济学及Stata应用》的作者陈强教授主讲。你或许知道该书因条理清晰、通俗易懂、深入浅出而好评如潮,但只有上过陈强老师课的学生才能体会到,陈老师的现场授课所具有的直指人心之独特魅力,帮助学员立刻进入高级计量的境界,融会贯通,恍然大悟。
本次高级计量经济学及Stata现场班,将根据多次现场班的反馈进一步完善。在课程内容的设计上,主要指导思想是在较短时间内,将高级计量及Stata的精髓及核心内容,以最通俗生动的语言以及大量的案例交给学员。在夯实计量理论基础的同时,特别注重因果推断的具体应用,迅速将学员们拉到当代计量实证研究的最前沿。
由于学员的基础不同,本课程仅对学员背景做最低要求,即假设学员知道概率统计及少量线性代数,但不要求学过计量经济学或Stata操作。因为“大道至简至易”,初级计量与高级计量的本质是一样的,学子们最需要的是能够直指人心地洞明计量原理与操作工具,然后得心应手地用于实战(而非完成习作)。
经济及社科类青年教师、博士生、硕士生、高年级本科生。
掌握高级计量经济学的核心方法及Stata操作,不再茫然,知其然而知其所以然,迅速成为处理数据及定量分析的高手。
课程PPT、数据集、do文档及相关论文。
第一讲,OLS理论。
着重介绍小样本与大样本OLS,以及相应的普通标准误、异方差稳健标准误、异方差自相关稳健标准误、聚类稳健标准误、自助标准误。深切理解OLS的原理与适用条件,是一切计量原理的基础。
第二讲,OLS应用。
包括虚拟变量,调节效应,交互效应,中介效应(机制检验),核心变量与控制变量的区别(控制变量的内生性),广义最小二乘法(GLS)。
案例:改革开放的结构变动;红薯与旱灾的交互效应;校外学习机会的代理变量。
第三讲,Stata快速入门。
及时地介绍Stata知识,以OLS在Stata的实现作为入门,体会Stata的简单与强大。
案例:美国电力企业的规模效应。
第四讲,工具变量法。
由于双向因果、遗漏变量、度量误差的普遍存在,内生性是实证研究的常见难题,而工具变量法是解决内生性的利器,包括2SLS,LIML,GMM。
案例:殖民者死亡率与制度;出生季度与教育年限;经济增长与非洲内战;国企改革的作用;警察与犯罪率;美国年轻男子的教育回报。
第五讲,二值选择模型。
被解释变量为虚拟变量的二值选择模型有着广泛的应用。包括Probit,Logit,QMLE等。
案例:美国妇女的就业。
第六讲,静态面板。
面板数据由于能控制个体异质性(heterogeneity),缓解遗漏变量偏差,在实践中越来越重要。静态面板是最常见的面板,包括个体固定效应、随机效应、时间固定效应、双向固定效应、个体时间趋势、交互固定效应(interactive fixed effects)等。
案例:美国交通死亡率,nlswork数据。
第七讲,动态面板。
经济现象常具有某种惯性或部分调整,即被解释变量的滞后值出现在方程右边。动态面板也因为可自带工具变量而应用广泛。包括差分GMM、水平GMM与系统GMM等。
案例:美国工人的工资决定。
第八讲,非参数与半参数估计(Nonparametric and Semiparametric Estimations)。
非参与半参方法由于其稳健性而日益进入标准的计量工具箱,包括核密度估计、核回归、K近邻回归、局部线性回归、局部多项式回归、半参数回归等。
案例:摩托车撞击实验;美国电力企业的规模效应。
第九讲,随机实验与自然实验。
实验方法因其可信度而日益兴起,成为实证研究的“黄金标准”,包括随机实验、第一类与第二类自然实验。
案例:劳动力市场的三个经典田野实验;最低工资立法与劳动力需求;越战老兵的长期收入。
第十讲,双重差分法(Difference-in-Differences,简记DID)。
双重差分法利用面板数据的优势,可克服部分内生性,是研究政策或项目处理效应(treatment effects)的常用工具。内容包括双重差分法、渐进DID、平行趋势检验、三重差分法、广义DID、DID分组异质性,组群DID(Cohort DID)等。
案例:伦敦霍乱的自然实验;最低工资立法与劳动力需求;银行管制放松与收入分配(Big Bad Banks);茶叶价格与性别比例;废除科举与革命起义;人工智能与国际贸易。
第十一讲,匹配估计量(Matching Estimators)。
匹配估计量是反事实因果推断的重要方法,包括倾向得分匹配(Propensity Score Matching),双重差分倾向得分匹配(PSM-DID)等。
案例:就业培训的处理效应;最低工资立法与劳动力需求;PSM-DID的多个案例。
第十二讲,断点回归(Regression Discontinuity Design)。
由于在断点附近存在局部随机分组,故断点回归的效力接近于随机实验,日益为研究者所青睐。内容包括精确断点回归、模糊断点回归、密度(操纵)检验、稳健性检验等。
案例:淮河以北冬季燃煤取暖与人均寿命;扶贫政策的效应;买房落户与户口价值;美国参议院选举的在位者优势。
第十三讲,合成控制法(Synthetic Control Method)。
在评价某处理地区的政策效应时,将控制地区进行最优的线性组合,以构造合成控制地区进行对比,这是估计处理效应的新兴强大方法。包括合成控制法的原理、算法与安慰剂检验等。
案例:马里矣尔船运(Mariel boatlift);西班牙巴斯克地区恐怖活动的经济后果;加州控烟法的成效。
第十四讲,回归控制法(Regression Control Method)。
与合成控制法类似,但回归控制法使用回归法来构成反事实的控制地区(Hsiao et al., 2012),比合成控制法更为简便易行。分位数控制法(quantile control method)。
案例
:中国香港回归以及与中国内地经济整合的效应;德国统一的效应;四万亿经济刺激的效应;上海与重庆房产税试点的效应;安庆房票政策的房价效应。
第十五讲,异质性工具变量法。
依从者(compliers)的局部平均处理效应(Local Average Treatment Effect,简记LATE)。
案例:就业培训项目的不完全遵守(imperfect compliance);越战老兵的长期收入。
面向所有行业与学科的人士、老师与学生(包含经管社科、医学卫生等领域)。本课程的最大特色在于“一站式服务”,从机器学习的原理、数学推导,到Python命令与经典案例,无不精心设计、丝丝入扣,理论联系实操,让学员们迅速理解机器学习的精髓,并掌握最为流行的数据科学软件Python操作。独家讲授机器学习在经管社科的学术应用!
培训时间:
2023年7月(五天),具体时间待定
培训地点:上海现场班, 开课前提供交通住宿指南
授课安排:9:00-12:00, 14:00-17:00, 答疑
授课方式:思想原理+ 数学精髓 + Python经典案例
第1讲机器学习引论
(1)什么是机器学习
(2)机器学习的分类与术语
(3)案例:垃圾邮件过滤;手写体数字识别;图像识别;自动驾驶
第2讲Python语言快速入门
(1) Why Python?
(2)安装Python与Spyder
(3) Python的模块(module)
(4) Python的对象(str, bool, list, tuple, dict, set)
(5) Python的函数(function)与方法(method)
(6) Numpy(ndarray), pandas(Series, Data Frame)
(7) sklearn(机器学习)与keras(深度学习)
(8) Python画图(Matplotlib, pandas, seaborn)
(9) Python面向对象编程
第3讲数学回顾
(1)梯度向量
(2) 方向导数
(3)梯度下降
(4)向量微分
(5)最优化
第4讲线性回归
(1) OLS
(2)过拟合与泛化能力
(3)偏差与方差的权衡
(4)交叉验证
(5)Python案例:多项式回归的过拟合;波士顿房价
第5讲逻辑回归
(1) Logit
(2)几率比
(3)灵敏度与特异度
(4) ROC与AUC
(5)科恩的kappa
(6)Python案例:泰坦尼克号旅客的存活
第6讲多项逻辑回归
(1)多项Logit
(2)Python案例:识别玻璃类别
第7讲朴素贝叶斯
(1)朴素贝叶斯(Naive Bayes)
(2)拉普拉斯修正(Laplacian Correction)
(3)Python案例:垃圾邮件的识别
第8讲惩罚回归
(1)高维回归的挑战
(2)岭回归(Ridge Regression)
(3)套索估计(Lasso)
(4)弹性网估计(Elastic Net)
(5)Python案例:前列腺癌的影响因素
第9讲K近邻法
(1)回归问题的K近邻法
(2)分类问题的K近邻法
(3)Python案例:摩托车撞击实验数据;鸢尾花品种的归类;威斯康辛乳腺癌的诊断
第10讲决策树
(1)分类树(Classification Tree)
(2)分裂准则(错分率、基尼指数、信息熵)
(3)成本复杂性修枝
(4)回归树(Regression Tree)
(5)Python案例:波士顿房价;葡萄牙银行市场营销
第11讲随机森林
(1)集成学习(Ensemble Learning)
(2)装袋法(Bagging)
(3)随机森林(Random Forest)
(4)变量重要性(Variable Importance)
(5)偏依赖图(Partial Dependence Plot)
(6)Python
案例:波士顿房价;声呐信号的分类
第12讲提升法
(1)自适应提升法 (AdaBoost)
(2) AdaBoost的统计解释
(3)梯度提升法 (Gradient Boosting Machine)
(4) XGBoost算法
(5)Python案例:波士顿房价;过滤垃圾邮件;识别玻璃类别
第13讲支持向量机
(1)最大间隔分类器(Maximal Margin Classifier)
(2)软间隔分类器(Soft Margin Classifier)
(3)支持向量机(Support Vector Machine)
(4)核技巧(Kernel Trick)
(5)支持向量回归(Support Vector Regression)
(6)Python案例:模拟数据;过滤垃圾邮件;识别手写数字;波士顿房价
第14讲人工神经网络
(1)人工神经网络的思想
(2)感知机(Perceptron)
(3)前馈神经网络(Feedforward Neural Network)
(4)激活函数(Activation Function)
(5)反向传播算法(Back-propagation Algorithm)
(6)随机梯度下降(Stochastic Gradient Descent)
(7)神经网络的过拟合与正则化
(8)卷积神经网络(Convolution Neural Network)
(9)深度学习的发展
(10)Python案例(sklearn与Keras):波士顿房价;过滤垃圾邮件;模拟数据;路透社新闻主题分类,手写数字数据集MNIST
第15讲(Bonus Lecture) 机器学习在经管社科的应用
精读几篇在经管社科顶刊发表的经典机器学习论文
高级计量现场班(4天):5200元 /4800元(全日制在读本科和硕士优惠价)
机器学习现场班(5天):6000元 /5400元(全日制在读本科和硕士优惠价)
提供电子版发票及开课通知,纸质版结业证书
→ 授课与答疑均是陈强老师本人
→
根据缴费顺序安排座位
尹老师
电话:13301322952
WeChat:jg-xs6