Py学习  »  机器学习算法

知乎热议:机器学习在经济学的应用前景

连享会 • 1 年前 • 340 次点击  

👇 连享会 · 推文导航 | www.lianxh.cn

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

  • 🍎 Stata:Stata基础 | Stata绘图 | Stata程序 | Stata新命令
  • 📘 论文:数据处理 | 结果输出 | 论文写作 | 数据分享
  • 💹 计量:回归分析 | 交乘项-调节  | IV-GMM | 时间序列 | 面板数据  | 空间计量 | Probit-Logit | 分位数回归
  • ⛳ 专题:SFA-DEA | 生存分析   | 爬虫 | 机器学习 | 文本分析
  • 🔃 因果:DID | RDD | 因果推断 | 合成控制法 | PSM-Matching
  • 🔨 工具:工具软件 | Markdown | Python-R-Stata
  • 🎧 课程:公开课-直播 |  计量专题 | 关于连享会
  • 最近十年中,各类因果推断方法层出不穷。令人欣喜的同时,也让很多人无所适从。虽然借助 Stata,R,Python 等软件很容易「跑出」结果,但很多人应该都经历过如下「囧境」:

  • 虽然有很多方法可以用,但由于不清楚原理,不知道该用哪个?
  • 虽然自己很努力地跑代码、看文献,但总感觉没啥实质性进展,有一种「有劲没处使」的无力感;
  • 很像看看 QJE,AER,JoE,JASA 上那些牛逼的方法,但「一开始就懵了」……。
  • 根源何在?可能是没有清晰地理解「基本概念」,比如条件期望,条件独立,无偏性以及 FWL 定理等。基础不牢,便会导致举步维艰。事实上,一旦理清基本概念和模型,后续的 Lasso,双重机器学习 (DML) 等听起来很高深的东西都不再困难,因为它们都是基础知识和理论的组合和延伸而已。

  • 庄子所言「水之积也不厚,则其负大舟也无力」也正是这个意思。

  • 为此,强基班 的目的在于巩固基础,理清 条件期望函数条件独立反事实架构选择偏差 等基本概念;理解 识别估计 和 统计推断 的差别。进而在因果推断的架构下讲解 OLS,IV,FE 以及 DID 等方法,让大家能够「选择合适的方法、做出合理的解释」。

作者:赵莹(厦门大学)
邮箱:zhaoying@stu.xmu.edu.cn

编者按:随着大数据时代的到来,机器学习在各个领域都成为了热门话题,那么机器学习在经济学研究领域是否有应用前景呢?一起来看看知乎答主们的不同意见吧。

来源:本文主要整理自知乎热议机器学习(machine learning)在经济学领域是否有应用前景? 特此致谢!


目录

  • 1. 支持意见

    • 1.1 发现新事实

    • 1.2 处理复杂性

  • 2. 应用领域

    • 2.1 理论和实证

    • 2.2 解决实际问题

  • 3. 前沿文献汇总

    • 3.1 因果推断领域

    • 3.2 行为经济学领域

    • 3.3 博弈论领域

    • 3.4 挖掘新的自变量

  • 4. 反对意见

  • 5. 参考文献

  • 6. 相关推文



温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

1. 支持意见

1.1 发现新事实

答主「李佳飞」总结了斯坦福 Jonathan Levin 教授对该问题的看法:

  • 机器学习方法强大的地方在于拟合预测模型以及对高维度的大数据进行分类。而大数据正在越来越多地被应用到经济学中,因此毫无疑问,机器学习会被越来越频繁地使用。并且,机器学习与因果推断相结合的领域在未来会得到很多关注,实证微观经济学有很大一部分是寻找不同方法来利用自然实验,而大数据的好处在于发现自然实验。
  • 除此之外,大数据能够产生出各种关于个体行为、劳动力市场、企业生产力和宏观经济层面新奇有趣的事实发现,这些会为经济理论的研究注入新能量。

1.2 处理复杂性

答主「扣小米」总结了 Varian (2014) 的观点:

  • 计算机技术现在已经深入到了经济学的研究中,如今数据量越来越大,大数据量让变量之间的关系变得更加灵活,传统计量中的线性以及大多非线性模型可能都无法满足这一要求,所以经济学家需要寻找新的研究方法。
  • 机器学习理论中的 Decision Trees(决策树),Support Vector Machines(支持向量机)和 Deep Learning(深度学习)等技术可以更加有效率地处理复杂关系。

2. 应用领域

2.1 理论和实证

答主「王也」认为机器学习在经济学理论和实证层面的应用有不同的侧重。

  • 在理论层面:机器学习的主要作用是实现预测的功能,比如估计Propensity Score(倾向得分)。现在比较热门的话题是用机器学习来估计潜在结果,预测控制组的结果,Lasso 回归在这个环节可以大显身手。另一个方向是用机器学习来看平均处理效应(ATE)的异质性。
  • 而在实证层面,机器学习往往是起到辅助的作用,比如利用分类等方法提高数据处理效率,或利用文本分析构造新的变量。Burgess et al. (2012) 通过卫星照片测量了印尼的森林砍伐率。他们先找人手动把一部分照片上不同颜色的区块归到各个类别,基于这个训练集估计一个Regression Tree(回归树),再用该模型对剩下的色块分类。

2.2 解决实际问题

答主「黄一飞」认为,机器学习在实际应用中的成功会倒逼经济学在工程性上与时俱进。

  • 商学院在这点上走在了经济系的前面,很大程度上是因为商学院的评价体系和价值取向更容易鼓励实际应用问题导向的研究。具体来说,金融、会计领域的顶级期刊上已经有很多利用文本挖掘、自然语言处理、语音识别等技术从文本、音频等非结构化数据中提取信息,来预测上市公司财务舞弊和股价等的研究。
  • 例如,搜索引擎关键词广告竞价拍卖的巨大商业价值催生了一批非常高质量的交叉学科研究和学术社区。Nekipelov et al. (2015) 研究了一个非常经典的拍卖实证问题:如何从卖拍的报价数据推断竞拍者对拍卖标的的真实估值。但是作者并不依赖拍卖结果是纳什均衡的假设,而假设竞拍者是不断地在学习最好的竞拍策略。这对于搜索引擎关键词竞价拍卖这个高频率并且拍卖利益巨大应用场景是很贴切的。

3. 前沿文献汇总

答主「meta318」总结了部分近年来经济学不同领域应用机器学习的有关文献:

3.1 因果推断领域

  • Pearl (2012) 用概率图模型进行因果推断。
  • Johansson et al. (2016) 用 representation learning 进行 Rubin 框架下的反事实推断。
  • Hartford et al. (2017) 用 deep learning 来寻找工具变量进行反事实推断研究。
  • Athey and Imbens (2016) 用树模型进行因果推断。

3.2 行为经济学领域

  • Singh et al. (2011) 用 hidden markov model 来研究用户的隐含状态对可观测行为的影响。

  • Jacobs et al. (2016) 用 Topic Modeling 来预测用户在线购买商品的行为。

  • Fader et al. (2005) 用统计学模型预测和估计顾客的终身价值。

  • Hoff et al. (2002) 用统计学模型估计网络结构上用户的传播信息行为。

3.3 博弈论领域

  • Igami (2020) 阐述了人工智能的某些算法与动态结构模型的计量经济学之间的联系。
  • Charpentier et al. (2021) 介绍了强化学习在经济学、博弈论、运筹学和金融学方面的应用。

3.4 挖掘新的自变量

  • Netzer et al. (2012) 用文本挖掘的方法分析企业所处的市场结构和竞争格局。
  • Zhang et al. (2021) 用 image mining 的方法,研究 Airbnb 上房间图片质量与用户需求之间的关系。
  • Liu et al. (2019) 用 video mining 的方法,研究 YouTube 视频对于患者康复的影响。

4. 反对意见

某「匿名答主」认为机器学习在经济学领域的应用并不乐观。

  • 机器学习的模型缺乏解释性,SVM 以及深度学习这种模型都是难以解释的。决策树类模型虽然可以给出一个清晰的分类顺序,但是树类模型往往没找到最优解,即便找到了最优解,决策树模型给出的分类法则也会出现匪夷所思的分类方法。
  • 除此之外,经济学不仅仅是分类和推断,毕竟不能指望机器学习告诉你最佳的基准储备金率。
  • 归根结底,机器学习假设了一个很低的试错成本,然而很多经济决策只有一次,直接关系了宏观经济的走势,小公司的存亡,这样的决策必须用 prescriptive modeling 来分析,在其看来这是经济学的魅力所在,也是难以被机器学习泛化的原因。

5. 参考文献

  • Athey, Susan, and Guido Imbens. 2016. “Recursive Partitioning for Heterogeneous Causal Effects.” Proceedings of the National Academy of Sciences of the United States of America 113 (27): 7353–60.
  • Burgess, R., M. Hansen, and B. A. Olken. 2012. “The Political Economy of Deforestation in the Tropics.” Journal of Economics. https://academic.oup.com/qje/article-abstract/127/4/1707/1844248.
  • Charpentier, Arthur, Romuald Élie, and Carl Remlinger. 2021. “Reinforcement Learning in Economics and Finance.” Computational Economics, April. https://doi.org/10.1007/s10614-021-10119-4.
  • Fader, Peter S., Bruce G. S. Hardie, and Ka Lok Lee. 2005. “‘Counting Your Customers’ the Easy Way: An Alternative to the Pareto/NBD Model.” Marketing Science 24 (2): 275–84.
  • Hartford, Jason, Greg Lewis, Kevin Leyton-Brown, and Matt Taddy. 06--11 Aug 2017. “Deep IV: A Flexible Approach for Counterfactual Prediction.” In Proceedings of the 34th International Conference on Machine Learning, edited by Doina Precup and Yee Whye Teh, 70:1414–23. Proceedings of Machine Learning Research. PMLR.
  • Hoff, Peter D., Adrian E. Raftery, and Mark S. Handcock. 2002. “Latent Space Approaches to Social Network Analysis.” Journal of the American Statistical Association 97 (460): 1090–98.
  • Igami, Mitsuru. 2020. “Artificial Intelligence as Structural Estimation: Deep Blue, Bonanza, and AlphaGo.” The Econometrics Journal 23 (3): S1–24.
  • Jacobs, Bruno J. D., Bas Donkers, and Dennis Fok. 2016. “Model-Based Purchase Predictions for Large Assortments.” Marketing Science 35 (3): 389–404.
  • Johansson, F., and U. Shalit. 2016. “Learning Representations for Counterfactual Inference.” Conference on Machine …. http://proceedings.mlr.press/v48/johansson16.html.
  • Liu, Xiao, Bin Zhang, Anjana Susarla, and Rema Padman. 2019. “Go to YouTube and Call Me in the Morning: Use of Social Media for Chronic Conditions.” Forthcoming, MIS Quarterly. https://doi.org/10.2139/ssrn.3061149.
  • Nekipelov, Denis, Vasilis Syrgkanis, and Eva Tardos. 2015. “Econometrics for Learning Agents.” In Proceedings of the Sixteenth ACM Conference on Economics and Computation, 1–18. EC ’15. New York, NY, USA: Association for Computing Machinery.
  • Netzer, Oded, Ronen Feldman, Jacob Goldenberg, and Moshe Fresko. 2012. “Mine Your Own Business: Market-Structure Surveillance Through Text Mining.” Marketing Science 31 (3): 521–43.
  • Pearl, Judea. 2012. “The Do-Calculus Revisited.” arXiv [cs.AI]. arXiv. http://arxiv.org/abs/1210.4852.
  • Singh, Param Vir, Yong Tan, and Nara Youn. 2011. “A Hidden Markov Model of Developer Learning Dynamics in Open Source Software Projects.” Information Systems Research 22 (4): 790–807.
  • Varian, Hal R. 2014. “Big Data: New Tricks for Econometrics.” The Journal of Economic Perspectives: A Journal of the American Economic Association 28 (2): 3–28.
  • Zhang, Shunyuan, Dokyun Lee, Param Vir Singh, and Kannan Srinivasan. 2021. “What Makes a Good Image? Airbnb Demand Analytics Leveraging Interpretable Image Features.” Management Science, December. https://doi.org/10.1287/mnsc.2021.4175.

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 机器 学习
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:论文写作
    • Semantic scholar:一款基于机器学习的学术搜索引擎
  • 专题:Stata教程
    • Stata-Python交互-7:在Stata中实现机器学习-支持向量机
  • 专题:Python-R-Matlab
    • MLRtime:如何在 Stata 调用 R 的机器学习包?
    • 司继春:Python学习建议和资源
  • 专题:机器学习
    • 机器学习如何用?金融+能源经济学文献综述
    • 知乎热议:纠结-计量经济、时间序列和机器学习
    • 机器学习:随机森林算法的Stata实现
    • Stata:机器学习分类器大全


课程推荐:计量和因果推断 · 强基班
主讲老师:司继春
课程时间:2023 年 11 月 5/12/19 (三个周日)
🍓 课程主页https://www.lianxh.cn/news/b8936ea77cced.html

New! Stata 搜索神器:lianxh 和 songbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
  . ssc install lianxh
  . ssc install songbl
👉  使用:
  . lianxh DID 倍分法
  . songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/163764
 
340 次点击