基于Shapley值的特征属性,常用于解释机器学习模型。然而,从理论和计算的角度来看,Shapley值特征属性的估计是复杂的。
近日,美国 华盛顿大学(University of Washington)Hugh Chen, Ian C. Covert,Su-In Lee等,在Nature Machine Intelligence上发文,报道了将这种复杂性分解为两个主要因素:去除特征信息的方法,以及易处理的估计策略。这两个因素提供了天然的视角,从而更好地理解和比较24种不同的算法。基于各种特征移除方法,还描述了多种类型的Shapley值特征属性及其计算方法。然后,基于易处理的估计策略,描述了两种不同的方法:模型不可知和模型特定的近似。对于模型不可知的近似,对一大类估计方法进行了基准测试,并将其与Shapley值的替代但等价的特征联系起来。对于特定于模型的近似,还阐明了对线性、树和深度模型的每种方法可处理性至关重要的假设。最后,确定了文献中的空白和有希望的未来研究方向。Algorithms to estimate Shapley value feature attributions.
图1: 在实践中,广泛使用的Shapley值解释。
图2: Shapley值定义和属性。
图3: 处理缺失特征的经验策略。
图4: 对无偏的、模型不可知的算法进行基准测试,以估计单个Explicand基线Shapley值,以及具有100棵树的XGB模型基线。

https://www.nature.com/articles/s42256-023-00657-xhttps://doi.org/10.1038/s42256-023-00657-x