使用 GitHub 的开发者可能已经发现了一些问题,GitHub 现在已经禁止在未登录的情况下搜索代码,这一决定已经在开源社区引起了争议。
在未登录 GitHub 账号的情况下,搜索代码是会提示登录并在 GitHub 上搜索代码,在访问我们的代码搜索功能前请先登录或创建一个免费账户 (Sign in to search code on GitHub Before you can access our code search functionality please sign in or create a free account.)
为什么说这事需要关注呢?因为 GitHub 托管着最多的开源项目,禁止用户在未登录的情况下搜索代码本身就是违背了开源社区的理念。
注意:这种情况并不是最近的决定,只不过现在引起了开发者们的新一轮讨论。
讨论地址:https://github.com/orgs/community/discussions/77046
GitHub 的回应:
对此,GitHub 开发者关系副总裁马丁伍德沃德 (Martin Woodward) 发布了回应,GitHub 在 2023 年 6 月 7 日发布公告宣布 GitHub 全局代码搜索功能要求登录已经扩展到存储库。
至于原因,马丁给出的原因是防止服务器被机器人疯狂抓爬导致服务器负载高进而出现稳定性原因。
引起开发者关注也很简单,有的开发者以开源社区为中心,将代码托管在 GitHub 上就是希望任何人都能轻易获取代码,而不是现在强迫用户注册一个 GitHub 账号。
当然这里也牵涉到微软收购问题,因为这些变化都是在 GitHub 被微软收购后才发生的,这难免会让人产生一些不好的联想。
GitHub 的反抓爬理由其实能说得过去,不过这也可能是 GitHub 和微软用来防止某些竞争对手抓取数据来训练 AI 模型,毕竟现在各大公司都在想方设法的限制数据抓取避免数据被人白嫖。