什么?Github的star居然都能是假的了,甚至数量达到了惊人的450万!大多数的研究人员都会将自己的项目发布到Github中,以增加曝光度。项目的star也一直被大家视作是用来检验项目热度的关键指标。但是CMU团队新近研究StarScout却实锤了Github中疑似有450万star全都是假的!很多项目存在恶意账户去刷star,以来吸引注意,甚至在对应的项目中注入恶意代码,以攻击那些想要复现项目的研究人员。现在有15%的可能性,一个获得50个star的仓库涉及star造假。论文链接:https://arxiv.org/abs/2412.13459就像著名美国心理学家Donald T. Campbell所说,「任何量化社会指标在社会决策中用得越多,它就越容易腐败,就越容易扭曲和腐败它打算监测的社会进程」。Github里高star项目这种足以风靡全球的吸引力,自然也逃不过如此规律。如下关于GitHub仓库star数据的图表,展示了从2019年8月到2024年8月期间,每月获得至少50颗星的仓库数量(蓝色折线)以及每月疑似存在虚假星级活动的仓库数量(橙色柱状图)的变化情况。
蓝色折线(#Repos>=50 star):代表每月获得至少50颗star的GitHub仓库数量。
橙色柱状图(#Repos w. Suspected Campaigns):表示每月疑似存在虚假star活动的仓库数量。