7月15日上午
主讲人:王非
课程安排:数据清洗与描述
1、公式化数据清洗,使纷繁庞杂的数据处理变得异常清晰
2、经验研究的拨乱反正:数据描述不只是一张表
3、常用数据清洗与描述的实战演示
7月15日下午
主讲人:王非
课程安排:工具变量
1、工具变量经典方法与步骤系统化梳理
2、寻找工具变量的具体方法
3、应对弱工具变量的具体流程
4、二元内生自变量及非线性模型中工具变量的应用方法
5、工具变量经典论文的结果复制
7月16日上午
主讲人:王非
课程安排:断点回归
1、断点回归经典设计思路与实践步骤系统化梳理
2、断点回归发展前沿及实际应用
3、断点回归最新前沿论文的结果复制
7月16日下午
主讲人:王非
课程安排:合成控制及最新实证方法补充
1、合成控制经典步骤及最新发展的系统化梳理
2、合成控制最新前沿论文的结果复制
3、置换检验在合成控制等方法中的应用及误用
4、因果识别方法最新发展的补充介绍
7月17日上午
主讲人:司继春
课程安排:线性回归与Stata基础
1、线性回归模型基础
2、系数的解释与模型设定:平方项、交叉项的解读与使用
3、系数的解释与模型设定:加权最小二乘以及权重的使用
4、线性回归中固定效应的使用
5、控制变量的选择
6、统计推断:异方差稳健标准误与聚类标准误
7、跨方程假设检验
7月17日下午
主讲人:司继春
课程安排:线性面板数据模型
1、面板数据的基本设定
2、随机效应模型与混合最小二乘
3、一阶差分模型与固定效应模型
4、不同估计量之间的关系和选择
5、线性面板数据中的时间固定效应与时间趋势
6、交互固定效应模型
7月18日上午
主讲人:司继春
课程安排:双重差分模型及其新进展
1、双重差分模型的基本设定及共同趋势假设
2、双重差分模型的标准设定
3、多期的双重差分模型设定
4、平行趋势检验的方法
5、三重差分模型、回归控制法简介
6、模糊双重差分模型(Fuzzy DID)
7、带有异质性的动态处理效应的估计(Sun、Abraham, 2020; Callaway、San’t Anna,2020)
7月18日下午
主讲人:司继春
课程安排:面板二元选择模型
1、基本的Probit、Logit回归简介
2、二元选择模型中系数的解释和汇报
3、随机效应Probit、Logit回归
4、固定效应Probit、Logit回归
7月19日上午、下午
主讲人:王子
课程安排:结构模型方法论与理论建模、模型求解与估计、量化政策分析
1、结构模型的意义和理论基础
2、结构模型的具体实施步骤,以Eaton and Kortum (2002)为例
3、结构估计和反事实分析使用的数值计算方法(算法和Matlab编程)
4、量化政策分析的具体实施过程,以Caliendo and Parro (2015)为例(算法和Matlab编程)
7月20日-21日
主讲人:邓建鹏
课程安排:结构模型在国际贸易中的应用:从微观数据到宏观分析
1、为什么选择Eaton Kortum and Kramarz (2011):一个简略的文献综述
2、 如何看数据:从引力模型到企业层面数据(Stata绘图)
3、“搭积木玩乐高”:EKK模型详解
4、结构估计和模拟矩方法/Structural Estimation and Simulated Method of Moments (算法和Matlab编程)
5、反事实分析(算法和Matlab编程)
7月22日上午
主讲人:邓旭东
课程安排:Python语法入门
1、Python跟英语一样是一门语言
2、数据类型之字符串
3、数据类型之列表元组集合
4、数据类型之字典
5、数据类型之布尔值、None
6、逻辑语句(if&for&tryexcept)
7、列表推导式
8、理解函数
9、常用的内置函数
10、os路径库
11、内置库csv文件库
12、常见错误汇总
7月22日下午
主讲人:邓旭东
课程安排:数据采集
1、网络爬虫原理
2、网络访问requests库
3、pyquery库解析html网页
4、案例 1:豆瓣小说
5、 json库解析json网页
6、案例 2:知乎
7、案例 3:微博
8、案例 4: 批量下载文档、多媒体文件
9、案例 5:上市公司定期报告pdf批量下载
10、案例 6:api数据采集
11、区分动态网站与静态网站
7月23日上午
主讲人:邓旭东
课程安排:初识文本分析
1、文本分析在经管领域中的应用
2、读取文件中的数据(txt、pdf、docx、xlsx、csv)
3、数据清洗re库-从文本中抽取姓名、年龄、电话、数字等各种信息
4、案例 7:如何将多个文件中的数据整理到一个excel中
5、中文jieba分词
6、案例 8:词频统计、制作词云图
7、案例 9:共现法扩展情感词典
8、案例 10:词向量word2vec扩展情感词典
9、案例 11:中文情感分析(无权重词典法)
10、数据分析pandas库快速入门
11、案例 12:使用pandas对excel中的文本进行情感分析
12、案例 13:使用tf-idf进行情感分析(有权重词典法)
13、案例 14: 从文本数据中构造可用的社交网络数据
14、案例 15: 对社交网络数据进行可视化
7月23日下午
主讲人:邓旭东
课程安排:机器学习与文本分析
1、了解机器学习
2、使用机器学习做文本分析的流程
3、Scikit-learn机器学习库简介
4、文本特征工程-将文本转化为机器可处理的数字向量
5、认识词袋法、one-hot、Tf-Idf、word2vec
6、案例 16: 使用标注工具对文本数据进行标注
7、案例 17:在线评论文本分类
8、文本相似性计算
9、案例 18:使用文本相似性识别变化(政策连续性)
10、案例 19:Kmeans聚类算法
11、案例 20:LDA话题模型
12、案例 21: 识别图片中的文本
13、Python爬虫、文本分析、机器学习等技术在论文中的应用赏析