公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
Column of Computer Vision Institute
Star 量可以真真假假,但别人用不用、用得好不好最终还是要看项目本身的含金量。在开发者的世界中,判断一个项目火不火、受不受欢迎,GitHub 的 star 量是一个非常重要的指标。比如 AI 大模型宇宙的基石模型 transformers 在 GitHub 上已经获得了 100k 以上的 star。可以说,开发者在 GitHub 上创建项目,提交代码,与其他人分享交流,构建了独属于开发者的社交网络。GitHub 更是成为了开发者神器,还被戏称为「全球最大同性交友网站」。不过,根据今天 Wired 的一篇报道,GitHub 的成功同时见证了一个非常不好的现象:刷 star 量的黑市。这是怎么回事呢?原来,Wired 发现了一个公开出售 GitHub star 的圈子,它包含了在线 store 和聊天群组。Wired 以 6 美元以太币的特价通过相关的网站为一个沉寂的项目购买了 50 颗 star,短短几个小时内就生效了。Wired 表示,这些待售的可疑 star 是更大在线参与度黑市的一部分,程序员、投资者和其他技术人员在决定雇用谁、为谁工作或向谁投资时,会使用这些指标来审视哪些人或公司最有前途。Wired 还发现,除了售卖 star 量之外,在线 store 还为 Product Hunt(由硅谷著名创业者和投资人 Ryan Hoover 于 2013 年创立)上列出的项目提供支持。这些供应商似乎想要利用人们的野心或绝望的心理,为他们找到一条成功的捷径,最起码是虚假的成功。印第安纳大学社交媒体观察网站的负责人 Filippo Menczer 对此发表观点,他认为几乎所有在线操纵都是某种形式的关注度「绑架」,在获得关注度之后将其转化为金钱或权力。「GitHub 也不例外,作为一个备受关注的市场,开发者希望凭借自身项目或软件的受欢迎程度或使用范围来获得名声、影响力、声誉。」Wired 的文章里举了数据编排初创公司 Dagster 的例子,该公司的增长主管 Fraser Marlow 去年偶然踏入了 GitHub 社区,并注意到投资者似乎将该平台上的 star 量作为开源项目是否具有吸引力的信号。于是,他的团队从两个不同的在线网站上购买了 star,并利用收集到的数据构建了一个可以检测 GitHub 存储库中虚假 star 的模型。他们在 Dagster 自己的代码库中运行了该模型。GitHub 地址:https://github.com/dagster-io/dagsterDagster 的发现令人大吃一惊,加密货币项目 Okcash 违规最严重,其 759 颗 star 中有 97% 被 Dagster 的检测器标记为虚假的。此外,Dagster 竞品开源项目 Apache Airflow 的 29,435 颗 star 中仅有 1.6% 被标记为虚假。这里的分析仅限于 2022 年以后获得的 star。此后 Okcash 的创始人 Oktoshi San 做了回应,表示该项目并不关心 star 和 fork 等虚假指标,但一些社区成员推出了赠品活动,邀请人们在 GitHub 上为该项目打星以换取 Okcash 代币。可以看到,以赠品获取 star 已经成为一些初创公司宣传自身项目的常用手段了。项目存在虚假宣传,GitHub Security 就无动于衷吗?显然不是。Wired 文章中提到,GitHub Security 一直以来都意识到了虚假 star 的存在,并努力在平台上删除。但是,如何准确删除虚拟的 star 是一个大挑战。更神奇的是,在 Fraser Marlow 发表了追踪可疑 star 的博客文章之后,他花钱购买的几乎所有 star 在一周内消失了。同样,Wired 购买的 star 也在一个月内被删除了。GitHub 的反滥用团队将利用软件技术来调查不真实 star 的账户。Wired 还提到了另一家公开提供不真实指标的网站 Baddhi,它为开发者们提供GitHub star、Kaggle 点赞、关注者和在看。Wired 向其创始人 Naga Durgarao Baddhi 询问,得到的回复是该公司是光明正大的。Baddhi 还描述了刷星流程,当收到 GitHub star 或其他指标的 order 时,其 11 人的团队会从不同的云设备上点击,并补充说明这不是垃圾邮件。其实,在 GitHub 和 Product Hunt 等社区平台之外,虚假参与度在 Facebook 等领先的社交平台上更加普遍。一大原因在于,随着网络生活成为人类参与的几乎所有领域的核心,即使小众社区也会难免出现网络作弊。
原文链接:https://www.wired.com/story/github-stars-black-market-coders-cheat/转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!