工作坊概览
时间安排
点击下方安排,可直接查看各位老师课程内容信息
- 2021年10月7、10日(Python数据采集与文本分析-邓旭东)
授课方式:
- 每天6小时(8:30 — 11:30;14:00 — 17:00)+ 30分钟答疑
工作坊团队:
报名费用:
-
- Python(邓旭东老师):2000元;回放10天
工作坊介绍
为推动我国经济、统计等社会科学量化研究方法学习与应用,培养和训练社会科学相关领域的青年学者、硕博士研究生,促进社会科学相关领域研究方法科学化规范化,“结构模型、Stata实证前沿、Python数据挖掘”国庆工作坊为广大学者提供了一个高水平学术交流、研究方法普及与研究经验分享的平台。工作坊采用模块式教学方法,不仅侧重经济、统计等社会科学量化基本方法的介绍,而且更加注重研究设计与研究选题训练,注重理论实践相结合,培养学员社会科学量化分析研究的综合能力。
结构模型又称为结构计量模型,是将经济学模型和统计模型结合,用于估计描述现实的深层参数,模拟现实世界,以便合理地评估政策效果的实证工具。结构模型通过建立引起因果关系的数据生成具体方式(机制)的模型来解决简化型中的问题。模型中明确地指明了一些重要的外部因素(如政策)是如何影响通过某些参数来影响参与人决策的,那么通过改变这些外部因素并结合现有数据所估计出来的参数,结构模型便可以提供一系列反事实推断,对政策的制定有重要的意义。政策评估需要建立在理解对政策不变的“深层”参数之上。在结构式方法中,理论和实证的联系是紧密的。由于其建模技术的优雅和深刻,不仅是当今经济政策评估领域的前沿,也是发展经济理论的有力武器,在世界顶级期刊中,采用结构模型建模的文章引起广泛关注和引用,为所在学科的理论发展和政策评估带来深刻影响。
实证研究过程中学者普遍面临数据获取、清洗和编码的两大问题。在前大数据时代,一般使用实验法、调查问卷、访谈或者二手数据等方式,将数据整理为结构化的表格数据,之后再使用计量分析方法,对这些表格数据进行分析。但大数据时代,网络数据成为各方学者亟待挖掘的潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于海量的网页中。那么对于经管为代表的人文社科类专业科研工作者而言,通过Python可以帮助学者解决使用Web数据进行科研面临的两大问题,即:1. 从网络世界中高效地采集数据 、2. 从纷杂的文本数据抽取文本信息。
在获取数据及文本信息后,需要使用计量方法对数据进行分析处理。Stata软件功能日益强大,理论也与时俱进**。**前沿分析固然可能会给你的Paper加分,但不理解其理论依据,会导致前沿方法的滥用, 使你的研究大为失色!
为此,本工作坊邀请五位走在计量前沿和爬虫文本分析的学者,可谓是强强联手的重磅组合,为青年教师、研究生们集中讲解前沿模型的基本思想、基于Matlab和Python实操估计。在21世纪的第3个十年来临之际,我们与致力于科学探索的您,分享最前沿的知识与技巧!我们努力给您带来最前沿计量理论与扎实操作基础并重的高质量课程!
授课内容
左翔:
王非:
邹建文:
- 结构估计实例1:居民消费行为分析(研究思路、具体实施步骤、算法和Matlab编程)
- 结构估计实例2:企业投资行为分析(研究思路、具体实施步骤、算法和Matlab编程)
邓旭东:
- 网络数据采集,网络用户行为数据采集,可自动下载文本、图片、视频、pdf等文件
讲师简介
左翔 :上海对外经贸大学国际经贸学院副教授、复旦大学博士,主要研究领域为公共经济学和发展经济学。主持国家自然科学青年基金项目、教育部人文社科基金青年项目各一项。论文发表于《经济研究》、《经济学(季刊)》、《世界经济》、《世界经济文汇》、《财经研究》等国内重要学术期刊,并获得上海市哲学社会科学优秀成果奖(论文类)二等奖和三等奖各一次。
王非:美国南加州大学经济学博士,中国人民大学劳动人事学院副教授,“杰出学者”青年学者,人大国家发展与战略研究院研究员,全球劳动组织(GLO)会员,中国就业研究所研究员。主持国家自然科学基金青年科学基金项目。主要研究领域为劳动经济学、人口经济学、主观福祉等,在 PNAS, Journal of Happiness Studies, Journal of Population Economics,China Economic Review,《人口研究》等国内外权威期刊上发表多篇论文。曾多次讲授微观实证研究方法,广受好评,《Stata简明讲义》作者。
邹建文 :华中科技大学经济学院数量经济学博士,研究领域为消费、投资等,专注于结构估计研究,在《经济研究》等期刊发表论文。撰写国内首个关于结构估计的讲义《结构估计讲义》,建立个人公众号“经济学结构估计前沿”,曾应邀在武汉大学、上海财经大学、中南财经政法大学、TIDE学会等高校和学会讲授结构估计方法论,广受好评。
邓旭东:哈尔滨工业大学在读博士,曾在多所大学分享Python,运营【公众号:大邓和他的Python】擅长Python、网络爬虫、文本分析、机器学习等内容。
stata(左翔)
10月1日上午、下午
主讲人:左翔
经济学理论实证、因果推断、反事实框架、面板数据
10月2日上午、下午
主讲人:左翔
课程安排:双重、三重差分模型、离散模型
stata(王非)
10月3日上午、下午
主讲人:王非
课程安排:Stata软件操作及工具变量法
10月4日上午、下午
主讲人:王非
课程安排:断点回归设计、合成控制及其他
结构模型(邹建文)
10月5日上午、下午
主讲人:邹建文
课程安排:结构估计入门
- 结构估计的应用(包括但不限于反事实模拟、政策分析)
10月6日上午、下午
主讲人:邹建文
课程安排:结构估计实例
- 结构估计实例1:居民消费行为分析(研究思路、具体实施步骤、算法和Matlab编程)
- 结构估计实例2:企业投资行为分析(研究思路、具体实施步骤、算法和Matlab编程)
Python(邓旭东)
10月7日上午
主讲人:邓旭东
课程安排:Python语法入门
10月7日下午
主讲人:邓旭东
课程安排:数据采集
10月10日上午
主讲人:邓旭东
课程安排:初识文本分析
- 读取文件中数据(txt、pdf、doc、xlsx、csv)
- 数据清洗re库-从文本中抽取姓名、年龄、电话、数字等各种信息
- 案例 6:如何将多个文件中的数据整理到一个excel中
-
- 案例 11:使用pandas对excel中的文本进行情感分析
10月10日下午
主讲人:邓旭东
课程安排:机器学习与文本分析
- 认识词袋法、one-hot、Tf-Idf、word2vec
- 案例 12:使用tf-idf进行情感分析(有权重词典法)
- python爬虫、文本分析、机器学习等技术在论文中的应用赏析
报名信息
参加对象
全国高等院校及研究机构从事经济科学研究的青年师生。尤其适合那些希望掌握高级实证方法,提升量化研究设计能力和国家课题申报能力的研究者。
报名时间
从即日起
缴费信息
单位:杭州国商智库信息技术服务有限公司
开户银行:中国银行杭州大学城支行
银行账户:6232636200100260588
报名咨询
欢迎咨询!