社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

研究进展:Shapley值-机器学习 | Nature Machine Intelligence

今日新材料 • 1 年前 • 334 次点击  

基于Shapley值的特征属性,常用于解释机器学习模型。然而,从理论和计算的角度来看,Shapley值特征属性的估计是复杂的。

近日,美国 华盛顿大学(University of Washington)Hugh Chen, Ian C. Covert,Su-In Lee等,在Nature Machine Intelligence上发文,报道了将这种复杂性分解为两个主要因素:去除特征信息的方法,以及易处理的估计策略。这两个因素提供了天然的视角,从而更好地理解和比较24种不同的算法。基于各种特征移除方法,还描述了多种类型的Shapley值特征属性及其计算方法。
然后,基于易处理的估计策略,描述了两种不同的方法:模型不可知和模型特定的近似。对于模型不可知的近似,对一大类估计方法进行了基准测试,并将其与Shapley值的替代但等价的特征联系起来。对于特定于模型的近似,还阐明了对线性、树和深度模型的每种方法可处理性至关重要的假设。最后,确定了文献中的空白和有希望的未来研究方向。
Algorithms to estimate Shapley value feature attributions. 
Shapley值特征属性的算法。

图1: 在实践中,广泛使用的Shapley值解释。


图2: Shapley值定义和属性。


图3: 处理缺失特征的经验策略。


图4: 对无偏的、模型不可知的算法进行基准测试,以估计单个Explicand基线Shapley值,以及具有100棵树的XGB模型基线。

文献链接
https://www.nature.com/articles/s42256-023-00657-x
https://doi.org/10.1038/s42256-023-00657-x
本文译自Nature。

推荐阅读
最新录用 | 基于半张量积的双合作博弈Shapley值计算
思维模型系列5——Shapley沙普利模型
SHAP值:用博弈论的概念解释一个模型


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/155643
 
334 次点击