3月13日,GitHub CEO Thomas Dohmke接受接受海外播客No Priors的访谈,本次谈话深入讨论了AI Agent 离成为中等程序员还有多远、AI 对软件工程团队的影响、人类还要多久才能决定使用哪些 AI Agent、AI Agent时代的软件定价、AI大模型的展望等话题。
以下是 GitHub CEO Thomas Dohmke对话实录
经数字开物团队编译整理
01
AI Agent 离成为中等程序员还有多远
主持人提问:
1.最近 GitHub 上 Copilot 和新版本有什么新进展?
2.现在实现更高级的Copilot的障碍是什么?是新的模型进步、核心技术还是 UI?
3. AI Agent 离成为中等程序员还有多远?需要多长时间才能达到超人水平?
Thomas实录:
我们很高兴让 Copilot 更具自主性。几天前,我们宣布了 VS Code 中 Copilot 的 AI Agent 模式。所以,现在不仅仅是与 Copilot 聊天并获得回复,然后将代码复制粘贴到编辑器中,或者使用自动完成功能,你现在可以与 AI Agent 合作,它可以帮助你实现一个功能。当它需要安装像一个软件包时,它会向你显示命令行终端命令,你可以说,好的,运行这个。你仍然掌控一切,这是我们今天可用的这些 AI Agent 的关键部分,作为人类开发者,你仍然需要在循环中。
我们也展示了 2025 年即将到来的一个预告。我们称这个项目为 Padawan,因为它就像一个绝地 Padawan。你必须有耐心,学习如何使用原力。但我们认为,在 2025 年,我们可以达到这样一个阶段:你可以将一个定义明确的 GitHub 问题分配给 Copilot,然后它开始创建一个拉取请求草案,并概述计划,然后它按照计划工作,你可以,类似于你观察同事的方式,你可以看到它如何将更改提交到拉取请求中,你可以审查并向 Copilot 提供反馈。因此,Copilot 基本上是从一个结对程序员升级为一个同伴程序员,成为你团队的一员。
我认为第一件事是模型。我认为随着模型在推理方面变得更好,我们将越来越接近 100% 的 Sreebench(普林斯顿大学提出的一个基准测试,包含从 12 个开源 Python 仓库中提取的大约 2200个问题和拉取请求对),实际上所有的模型和 AI Agent 都要与之进行比较。所以这是第一位的,模型和 AI Agent 的结合。
我认为第二部分是弄清楚什么是正确的用户界面流程。如果你考虑开发人员的工作流程,你有一个别人为你提交的问题,用户、产品经理或你自己提交的问题。现在,你怎么知道你是否应该将 Copilot、AI Agent 分配给它,或者你是否需要改进问题以使其更具体,至关重要的是,AI Agent 是可预测的,这是一个 AI Agent 可以解决的任务。如果不是,那么你需要引导它。所以可操控性是下一件事。你要么扩展定义,要么 AI Agent 需要回来问你其他问题。然后在过程结束时,你要验证结果。因此,在我们的演示中,我们认为正确的流程实际上是 AI Agent 在拉取请求中工作,类似于具有大量提交的人类开发人员,然后你可以回滚这些提交或在 VS Code 中检出它们。
我们看到一些可用的 AI Agent 是,我作为开发人员是否真的容忍这个 AI Agent?它真的节省了我的时间还是浪费了我的时间?你越是看到它浪费你的时间,只是消耗计算周期,你就越不可能再次使用它。因此,如果你是可预测的、可操控的、可验证的和可容忍的,如果你对所有四个标准都达到一定水平,我认为我们将看到 AI Agent 的广泛采用。
我今天早上想过这个问题,不管你在想什么 AI Agent,旅行 AI Agent 或编码 AI Agent,或者也许是设计你房子的 AI Agent。根本的挑战实际上与你作为人类开发者是一样的,你脑子里有一个很大的想法,你可以在白板上画出来,但当你想开始编码时,你必须把这个大想法分解成小块工作。我认为这就是我们离 AI Agent 真正足够好还有很长的路要走的地方,它们能够接受一个非常粗略的想法并将其分解成小块,而你作为开发人员或架构师,甚至在计划你的旅行时,不断收到关于你想做什么决定的问题,什么数据库,什么云。想象一下,你给 AI Agent 一个任务,说,构建 GitHub 或构建某个东西的移动应用程序,这就像不够具体。所以这就是系统思维,我认为中等水平的开发人员不会被 AI Agent 取代。
另一方面,很多开发人员所做的只是接受问题并修复错误,找到修复错误的位置,添加一个来自客户的功能,然后你必须浏览代码库并找出你必须修改哪些文件。我认为在这方面,我们将看到今年的巨大进步。实际上,当我们为 Padawan 项目录制演示时,我们实际上让我们的一个产品经理使用一个问题,然后 AI Agent 自己创建拉取请求,通常不编码也不在代码库中编写代码的 PM 能够使用 AI Agent 创建一个真正的拉取请求,然后由开发人员审查并合并到代码库中。所以在某些方面,我们已经到了,在另一些方面,我们需要达到你足够信任它的地步,以便你每天都在使用它。
02
Copilot 的开发周期、竞争与用户反馈
主持人提问:
1. Copilot 今天的整体开发周期是怎样的?
2. 如何看待赢得开发人员以及他们在不断变化和竞争的市场中关心什么?
3. 你们有关于如何实际使用 Copilot 的丰富数据。即使从上周发布 AI Agent 模式以来,有什么让您感到惊讶的吗?
Thomas实录:
业界现在称之为 AI 工程,它扩展了后端和前端开发的完整堆栈与 AI 开发。所以,我们如何使用新版本的模型或新模型?因为我们现在在 Copilot 中有模型选择器,我们不断地处理来自多个供应商的多个模型。我们如何将其集成到我们的堆栈中?我们有一个应用科学团队来运行评估。我们有一个团队来构建这些基准测试,应用科学团队使用这些基准测试来比较模型,同时也让构建新功能的团队(如代码审查 AI Agent 或 Sree AI Agent 或 AI Agent 模式)使用这些基准测试来验证他们的工作,作为他们测试套件的一部分。所以不再仅仅是数据科学家和工程师,这些角色有越来越多的重叠,他们每天都在合作。我们做了很多 AB 测试实验,在离线测试之后,在线测试中,我们首先与 GitHub 和 Microsoft 员工一起测试新版本或新微调版本的模型,然后与部分人群一起测试。
总的来说,显然我们有一个功能路线图,我们想在一个长长的待办事项列表中构建,不仅是 Copilot,还有 GitHub。GitHub 今年将满 18 岁。自从创始人在 2007 年底开始研究它,并在 2008 年初推出以来,已经 18 年了,而 Microsoft 实际上在 4 月 4 日就满 50 岁了。所以我们有一个很长的客户反馈待办事项列表,我们正在使用 Copilot 来构建这些功能,现在在 AI Agent 模式下,加速我们的功能交付,但与此同时,市场变化如此之快,无论我们是与 Open AI 还是与 Anthropic 还是与 Google 会面,我们都会了解到新的模型版本,然后我们的路线图就会从一天到另一天发生变化。我相信你们也看到了,市场变化如此之快。我们实际上正坐在这条指数级的创新曲线上,很难跟上,你无法真正计划超过一个月或两个月的时间。
我们看待胜利的方式是,我们非常关心开发人员,这一直是 GitHub 的核心,我们把开发人员放在第一位,我们是为开发人员构建产品的开发人员。我们在 GitHub 有一句谚语,那就是我们在 GitHub 上用 GitHub 构建 GitHub,使用 GitHub。因此,我们在公司所做的一切,包括我们的法律条款、我们的人力资源政策、我们的产品管理销售、销售支持,所有这些职能都在 GitHub 问题、GitHub 讨论和 GitHub 仓库中。所以我认为这是第一位的,我们非常关心我们自己的产品,我们每天都在使用它。我早上做的第一件事就是打开手机上的 GitHub 应用程序,然后是 Slack,因为我们的很多运营,公司聊天都是通过 Slack 进行的。
第二,你提到了竞争。我的意思是,显然,开发者领域从未见过这样的情况。这是我认为开发者工具最激动人心的时刻,我已经做了 30 多年的开发者了。很高兴看到创新,每天都有新闻发布。我认为这种能量,在市场中和创新驱动,无论是在开源方面还是在闭源方面。我们不要忘记,这不是单方面的。尽管专有模型和软件上有很多创新,但开源和 GitHub 上也有同样多的创新。这种能量显然会吸引我们。我是一个一级方程式赛车的超级粉丝,这很好。有竞争是好事,因为如果有多支车队可以赢得冠军,比赛会更有趣。我认为我们对竞争的看法也是一样的。它给了我们每天醒来时做得更好、行动更快并最终以市场上最好的产品获胜的动力。
从早期开始,总是让我们感到惊讶的是 Copilot 编写了多少代码。过去 Microsoft 和 GitHub 的一些人在你的播客中说过,在早期,在我们推出 Copilot 预览版后不久,它已经编写了大约 25% 的代码。我记得在产品评审中我们看到这个数字时说,这一定是遥测中的错误。回去验证一下。它不可能编写了 25% 的代码,因为它只是自动完成,尽管这很酷,但同时,它在早期仍然犯了很多错误。但我们很快意识到,A,这个数字是真的,B,这只是软件开发人员的学习行为。你在打字,你总是会遇到需要查找一些东西的时候。所以你会打开浏览器,在 Stack Overflow、Reddit、博客或 GitHub 上找到代码,然后复制粘贴,然后无论如何都要修改它。这就像内部循环总是这样的,你写一些东西,你用编译器和调试器试一试,然后你不断修改,直到它工作。
这个数字,然后迅速上升到大约 50%,这取决于编程语言。如果你现在看看,有了这些 AI Agent,就很难衡量了,因为,你可以直接进入 AI Agent 模式,说,我想用 Python 构建一个贪吃蛇游戏,它为你编写了所有代码,它编写了多个文件,所以分母变成了零,这就像无限百分比,因为你从来没有,你唯一写的就是一个提示,两年前的 15 分钟演示现在变成了一分钟演示,我认为,在很多方面,我们已经在这条曲线上遥遥领先,这仍然令人惊讶。
然后,反过来也是正确的,你可以让它进入一个地方,它只是不断地重写同一个文件,或者删除整个文件,因为它在逻辑中卡住了,所以这也让我们认识到现实,我们还没有接近一个 AI Agent 只是自主地处理我所有的 GitHub 问题,然后为我修复所有积压的工作。我唯一真正做的就是验证并成为软件开发 AI Agent 的代码审查员。所以我们正处于这种,我们在它已经可以做多少的兴奋和它在非常简单的情况下卡住的现实之间摇摆,就像你试图找出提示,告诉它只做一件事,然后你就直接进入文件,自己更改背景颜色。
03
GitHub 的未来发展方向
主持人提问:
1.GitHub 在未来几个季度发展的其他主要领域是什么?还有其他重大推动吗,还是全部都投入到 AI 中?
2.今年大部分代码将由生成式 AI 生成,甚至在某些情况下或某些任务中,所有代码都由 AI 生成。这会如何改变测试,或者我们看待技术栈的方式?
Thomas实录:
到目前为止,我们只谈到了通用的 Sree AI Agent,你可以分配一个问题,然后它生成一个拉取请求。但如果你真的看看开发人员的生活,在大多数公司,每天,你可能只有两三个小时在实际编写代码。然后你花了同样多的时间来审查你同事的代码。虽然我们不认为从纯粹的安全和信任的角度来看,这会消失,你总是希望在将代码合并到生产环境之前,有另一个人参与进来。
与此同时,我们相信代码审查 AI Agent 和代码审查是一个 AI 可以帮助你的大课题,特别是当你与不同时区的分布式团队一起工作时,你不想等待西海岸的人醒来,以获得初始的反馈循环。所以我认为代码审查对我们来说是一个大课题。而且,AI 部分是其中的一个部分,但用户界面同样重要。理想情况下,你得到反馈,然后你可以与代码审查 AI Agent 一起处理该反馈,因为它不会总是得到完全正确的反馈,只需单击接受、接受、接受。你必须有一个用户界面,云环境,你可以直接打开它。如果你总是需要,在本地机器上克隆仓库并安装所有依赖项,切换到不同的分支,你仍然有太多的样板工作。所以转移到一个云环境,你可以试用代码审查带来的更改,并修改它们以使其工作,并拥有快速的外部循环。
在同样的安全性领域,漏洞是,我们希望你的代码扫描不仅能发现漏洞,还能修复它们。一个更简单的版本是 linter 错误,比如代码格式化和诸如此类的事情,希望你们都消失,只是 AI 修复了所有这些,而不是你浏览 100 个 linter 警告,告诉你应该在哪里放置空格和括号。但是,如果你看看任何一个像样的软件项目,它都有过时的依赖项,它有很多已知的软件漏洞,希望不是高风险的,很多是低风险的,或者有人认为现在修复并不重要,因为代码不可达,或者,我们有其他优先事项。让 AI 来减少安全积压将使开源生态系统和许多商业软件项目变得更好,因为它降低了每个工程经理在技术债务、遗留代码、安全性、可访问性、欧洲法规等等之间摇摆不定的努力。以及创新积压,两者之间并没有真正的平衡。这就像最紧急的问题是什么,最重要的问题是什么?是你的销售团队告诉你,如果你没有那个功能,我们就卖不出产品,还是安全团队告诉你,你必须修复那个问题,否则我们就会把你上报到管理层,所以,我认为这是 AI 方面的事情,但同样地,GitHub 作为一个平台需要发展,以支持并拥有所有这些 AI Agent 和 AI 的基本要素,以便与人类协同工作。
需要澄清的是,我不认为所有的代码都是由 AI 编写的。我认为未来的工作方式是,我们将有两个层次。我们有机器语言层,比如 Python 或 Rust,它们实际上是对芯片组、机器指令集的抽象,这是最后一个确定性的层,就像编程语言一样,当我编写代码时,它会完全按照我的意愿执行。而人类语言本质上是不确定的,我们三个人可以说同样的一句话,但意思却不同。因此,虽然我们将使用人类语言来描述很多我们想要构建的功能和行为,但在底层仍然会有编程语言层,我们作为工程师会来回切换,以确定 AI 编写的代码是否正确?举个例子,它是否符合我的成本预期?归根结底,我们仍然在经营企业,必须要有正的利润率。
我认为作为工程师,我们将同时拥有这两个层次,我们正在进入一个更多使用人类语言、更少使用编程语言的世界。但与此同时,我们所处的世界中,许多金融服务机构仍然在大型机上运行代码,我们还远不能将那些 30、40 年前的代码直接交给一个 AI Agent,让它神奇地转换成云应用程序。我认为这是未来的趋势,但这就像自动驾驶汽车一样,我们不知道何时会真正实现无方向盘汽车,并且可以在你所在的国家内自动驾驶,比如,Waymo 的自动驾驶在旧金山可以运行,但在从 SFO 到圣何塞的路上还不行。因此,范围会扩大,但我们距离解决所有技术债和所有遗留代码还很遥远。因此,我认为至少在未来十年左右的时间里,我们仍然会有软件开发人员从事大量的旧式 PHP 代码等工作。
关于AI 和Web 开发,随着 AI 和 Web 开发的发展,你将能够——而且我们已经做到了——比如,找一个 10 岁的孩子,给他们一个像 Copilot 或 Replit Bolt 这样的工具,让他们输入一些提示,让他们探索它是如何工作的,以及他们如何像 Stable Diffusion、Midjourney 一样,自己生成软件并进行迭代。
04
我们正在进入的 AI Agent 的未来
主持人提问:
1.你认为现在更多地使用人类语言和指令,而不是机器语言。这是否改变了你在团队中寻找或希望培养的特质?
2.当你考虑这些不同的 AI Agent 和不同的用例时,你认为它们会是同一家公司或产品提供的吗?你认为它会是一个统一的界面吗?
Thomas实录:
我们现在正在研究的是,如何才能足够具体地描述你的问题,以便 AI Agent 能够接手,基本上是软件开发中的计划和跟踪方面,也就是任务。通常,一旦你拥有一个像样的团队规模,这就是最大的挑战。一个 10 人的初创公司没有问题,而且大多数 10 人的初创公司没有产品经理。创始人就是产品经理,其余的人只是构建东西,如果你有一个问题需要解决,沟通路径非常短。如果你有一千名工程师,他们最大的问题是:你想构建什么?你如何构建它?你写这个东西的时候到底是什么意思?如果你深入研究这个领域,会发现还没有太多 AI 能帮助你。
我们自己在这方面还处于早期阶段,Copilot workspace 有一个规范和头脑风暴 AI Agent,它基本上会查看你在 GitHub 任务中写的内容,将其与代码库进行比较,并用人类语言向你描述前后的变化,然后你可以像 Notion 文档一样修改它,并基本上向规范中添加内容。所以我认为这将是一整套 AI Agent 行为,我们将把它引入产品管理领域。
对于设计师来说也是类似的,如今,很多设计都是在 Figma 中手工完成的。我认为未来,作为一名设计师,你将输入与产品经理相同的规范,然后让一个 AI 工具渲染线框的代码,然后应用你的设计系统进行规范化,使其看起来像你的产品,因此,这些学科之间的距离越来越近,如果产品经理擅长编写规范,他们将能够创建整个变更集,设计师将能够接管部分产品管理角色,而工程师如果擅长描述功能,也能够更贴近这些其他角色,并接管那部分工作。所以我认为这就是很多创新将会发生的地方,并重新思考软件工程团队中传统学科在未来几年如何演变,因为我们拥有越来越多的 AI Agent,而且它们确实擅长自己的工作。
GitHub 坚信开发者应该拥有选择权。想象一下 GitHub 是一个平台,你只能使用 JavaScript 库或 React,我们会告诉你这是构建应用程序所需的唯一开源库,会有一部分用户因为喜欢 React 而使用 GitHub,其余的人会去其他地方,因为其他平台会提供所有这些其他开源组件,在 AI 领域,我认为我们会看到同样的情况。我们将看到一系列公司提供软件开发生命周期的不同部分,开发人员会选择他们最喜欢的、有经验的、并且坚信其代表着未来的那一个,你知道,很多这都是信念体系的一部分,编程语言在很多方面都非常相似,然后如果你看看开发人员之间的讨论,你会觉得它们彼此非常不同,归根结底,它们都编译成在你的 Apple 或 Ford 芯片,或你的 Intel CPU 或 AMD 或 Nvidia 或其他任何东西上运行的指令集,
关于工具和平台的选择,所以我认为我们将拥有一系列不同的工具,并且会有一些公司提供所有工具,嗯,不是全部,因为你永远不可能只从一家公司获得所有的开发工具,想想 GitHub,我们是一个很大的平台,但你仍然有一个编辑器、一个操作系统、一个容器解决方案和一个不来自 GitHub 的云,例如,我们有 Hashicorp、Terraform 等等,或者 Vercel Next.js 作为另一个例子,随便走进湾区的任何一家公司,他们都会有不同的工具组合,因为他们相信这是目前对他们来说最好的组合。所以,我认为在这个 AI 世界中,我们会看到同样的情况。你将可以选择不同的 AI Agent。你已经可以选择不同的模型,有些人认为云模型更好,另一些人认为 OpenAI 的模型更好,你知道,现实介于两者之间,不同的场景更适合不同的模型。我认为在我们正在进入的 AI Agent 的未来,情况也是如此。
05
AI大模型的通用性与专业性
主持人提问:
五年后,你是如何看待通用性与专业性的。
Thomas实录:
这取决于我们讨论的最终状态是什么,如果奇点即将到来,那么这一切都无关紧要。
我们大约在五年前,也就是 2020 年 6 月开始了 Copilot。GPT3 确实是早期的实验,然后我们得到了这个模型,最终变成了 Codex,它是这个模型的特定于代码的版本。而今天,你知道,它不再真正存在了,今天,每个人都坐在这些更强大的基础模型之上。这就是我的观点。在某种程度上,通用性开始占据主导地位。
我可以看到这种情况发生在模型层,但这又有点像预测,你知道,我们什么时候才能真正拥有自动驾驶汽车?你知道,我们用自动驾驶和 Autopilot 以某种形式测试了 10 年,它仍然不能左转进入我的社区。我可以看到未来会发生这种情况,但我不知道那是什么时候,以及模型基本上都是什么时候,你知道,大致相同。但我认为对于软件开发人员来说,底层的重要性只有在堆栈的更高层出现差异化时才体现出来,
关于差异化和开发体验,我认为编程语言或开源库就是很好的例子,因为,你知道,如果你放得足够大,它们都是一样的,归根结底,你知道,无论你是用 Swift 还是 Kotlin 或 React Native 构建应用程序,有什么关系呢?这就像软件开发的复杂性和我们拥有的信念体系。因此,我认为差异化将体现在两个方面,即开发人员在哪里获得最佳体验,以及日常工作的效率,就像我可以在哪里,你知道,开始我的一天,选择一些我想做的事情,探索我的创造力,并以最少的挫败感和最高的投资回报率完成工作,就我可以交付什么而言,软件开发,你知道,在过去的 30 年里,或者实际上是过去的 50 年里,如果你一直追溯到 20 世纪 70 年代,当微型计算机出现时,突然之间你不再需要与其他人共享大型机,一直都是关于我如何才能把我所有比我个人实际能实现的更伟大的想法更快地实现?我不认为我们已经到达了指数曲线的顶峰。我认为还有很多事情要做。你可以问的另一个问题是,GitHub 的 CEO 什么时候才能让我的积压工作清空?我只是不相信那一刻会到来。
06
人类还要多久才能决定使用哪些 AI Agent?
主持人提问:
1. 人类还要多久才能决定使用哪些 AI Agent?
2. 关于 Copilot 和 GitHub 更广泛地对 Microsoft 产生的业务和财务指标以及影响,分享些什么?
Thomas实录:
如果看看我的团队,作为 CEO,我多久需要与他们核实一次,以确保他们正在构建的东西实际上是我在给他们任务时希望他们构建的东西,所以,第一,接手任务、功能和史诗级任务的人仍然需要与其他团队成员保持沟通,以确保他们正在构建的东西是正确的。我不认为我们可以在给 AI Agent 布置工作时足够具体,让它可以自己完成所有工作,除非任务单元非常非常小。
这个问题的另一面是,我们什么时候才能达到所有软件都是个人软件的地步?事实上,我不再从 App Store 安装应用程序。我只是,你知道,使用自然语言界面自己构建所有应用程序,所以在我的个人电脑、我的智能手机上拥有完全个人化的软件,而不是对我们所有人来说都一样的现成软件,用户界面实际上是完全个性化的,你知道,我们有科幻电影或动作电影,比如《钢铁侠》(Iron Man),Jarvis 完全是为 Tony Stark 个性化定制的。所以我认为这个未来,肯定会在未来五年内发生。只是问题是 Jarvis 会有多好,我能不能只告诉它春假快到了,同样的酒店,同样的家庭,做同样的安排,它就为我预订了旅行,我唯一需要确认的问题是,我是不是要花费 5000 美元?
除了财报电话会议上的内容之外,没有太多可以分享的。我试着回忆一下。我想我们上次分享的数字是几个季度前,有 77,000 个组织在使用 Copilot,当时付费用户数量为 180 万。从那以后我们还没有分享过更新的数字。我不能分享最新的数字,但我认为从这些财报电话会议中真正有趣的是,如果你看看 Satya 提到的公司标志数量,它涵盖了整个行业范围。不仅仅是,你知道,很酷的初创公司,不仅仅是金融服务机构,实际上是每个行业都采用了 Copilot,我认为以前没有任何一个开发工具能够在任何公司规模和任何行业中以如此快的速度在整个软件开发领域被采用。
如果你想想,与美国软件开发人员的平均工资相比,20 美元算什么,甚至不到 0.1%?然后我们谈论的是,端到端生产力提高了 25%、28%,在编码任务上提高了 55% 或更高,但正如我们之前所说,对吧,开发人员所做的不仅仅是编码。这是对所花美元的难以置信的投资回报率。我认为这就是推动这条采用曲线的原因,现在任何公司都是软件公司,他们都会遇到前面描述的同样的问题。他们有很长的积压工作和太多的工作,每次,你知道,其中一位经理去找他们的团队,问他们实现一个功能需要多长时间,这就变成了 Jim Kirk 和 Scotty 的笑话,你知道,修复曲速引擎需要多长时间,你会得到一个非常长的估计,然后就变成了一场谈判,由船长设定最后期限,而不是工程师实际估计什么是可能的。我认为这就是 Copilot 的很多商业成功所在,所有编写软件的人都对它花费的时间感到沮丧,不是因为他们认为他们的工程师不好,而是因为构建软件的复杂性。
07
AI Agent时代的软件定价
主持人提问:
当 AI 真正开始取代人力时,你认为这种定价模式会发生怎样的变化?
Thomas实录:
我认为定价将基于算力,或者某个与算力相关的衍生指标。会很低,好比你厨房里的洗碗机,它的价格并不是基于每天雇人洗碗的成本。但同时,我认为购买者不会愿意为一台机器——无论是洗碗机还是一个 AI Agent——支付与人类开发者相当的费用。我认为这实际上是正确的思路,因为我不认为 AI Agent 真的能完全取代开发者。创造性的工作、系统性的思考仍然需要由软件开发者来完成。
预测未来总是充满乐趣,也许一两年后我再来参加这个播客,你们会指出我现在的预测错得有多离谱。但就目前而言,我认为软件开发中的许多决策仍然需要由人来做出,比如选择什么数据库、使用哪种云服务。很多时候,这些决策都取决于业务模式和运营方式。你选择哪种云服务,不一定取决于云服务的成本,而是一个战略决策,通常由 CTO 或工程领导团队来决定。而且,我们越来越多地看到,很多公司会同时使用多个云服务,因为他们不想过度依赖单一供应商。这就像汽车制造商会选择多家安全气囊供应商,以避免因某一家供应商无法按时交货而导致整条生产线停工。
关于价格,我认为随着 AI Agent 的能力越来越强,它们的价格肯定会上涨。OpenAI 就是一个很好的例子,他们现在最高级别的 Deep Research 和 O1 Pro 模型定价高达 200 美元,但显然人们看到了其中的价值。要知道,两年前如果我们预测到这个价格,恐怕没人会相信。现在,人们愿意每月支付 200 美元来使用一个聊天 AI Agent。但另一方面,在软件领域,人们通常认为每月 5 美元的移动应用订阅费就已经很高了。你可以看看那些从一次性付费转向订阅模式的应用,它们的评论区里,很多人都不喜欢这种模式,因为他们觉得软件就像 CD 一样,应该买一次就永久拥有。当然,价格肯定会上涨,这是由你从中获得的价值决定的。但另一方面,人类开发者之所以昂贵,是因为他们的供应有限。而 AI Agent 的供应理论上是无限的,只会受到数据中心可用算力(GPU 数量)的限制。
08
AI 时代的软件价值与开源生态
主持人提问:
1.谈到算力供应的释放,我们一直在讨论代码生成服务的定价问题,那就是软件本身的价值会发生什么变化?
2.未来开源模型和专有模型 API 对开发者而言,各自的重要性如何?
Thomas实录:
你知道,Trabant 当时实际上要等 17 年,那已经是 80 年代末的事情了。那个候车名单现在依然存在。现在主要存在于超级跑车领域。比如,你通常可以买到一辆超级跑车,像顶配的保时捷 911 R3 之类的。然后,你会发现它的转售价格比新车价格还要高,因为你直接去经销商那里是买不到的。你必须先买 100 辆保时捷,才能获得购买那款限量版顶级保时捷或法拉利的机会。Trabant 也是一样。我父亲当年拥有的那辆,大概是在 84 年或 85 年,以高于我们购买价的价格卖给了一个邻居,因为这样可以省去 17 年的等待时间。很多父母甚至在孩子还小的时候,就已经开始为他们排队预订汽车了。这样,等到孩子成年并拿到驾照时,就可以直接提车了。
所以,回到你关于软件的问题,我认为我们会看到两种情况并存。以 Copilot 为例,对于企业用户来说,它的定价是每月每个用户 20 美元。这实际上和 GitHub Enterprise 的价格几乎一样,后者是每月每个用户 21 美元。也就是说,过去你花 21 美元/月/用户的价格,可以存储所有代码仓库、管理所有问题,涵盖整个软件开发生命周期。很多人曾经认为,对于 DevOps 工具来说,这个价格已经很高了。然后,我们推出了 Copilot 代码自动补全功能,定价是每月 20 美元。突然之间,自动补全这个软件开发生命周期中的一个子功能,就要花费 20 美元。这又回到了之前的问题,如果它真的有价值,能带来投资回报,比如提高 25% 的生产力,那么人们当然愿意为之付出更多。但如果五年前我告诉你,代码自动补全会成为一个由 AI 驱动的独立功能,而且价格会超过 GitHub 的平均售价,你肯定会觉得这不太可能。
我认为,未来我们会看到软件价格的下降。有些东西,我们可能不再需要付费购买了。比如,现在没有人会为操作系统付费,但与此同时,你在 Netflix、Office 以及其他各种订阅服务上的花费却比以往任何时候都要高。所以,我认为这两种情况会同时存在,关键在于你为企业购买的解决方案到底能带来多少价值,无论是你自己开发,还是使用由你自己管理或部署在服务器上的工具。
目前,在 Copilot 中,我们集成了 Claude、Gemini 和 OpenAI 的模型,OpenAI 自身也提供了多种不同的模型。我刚才在脑子里梳理了一下,实际上不止三个模型,包括 40、01 和 03 Mini 模型。在 GitHub 的模型目录中,我们提供了开源或开放权重的模型,比如 Llama,以及 Mistral、Cohere、Microsoft Phi-2 等其他各类模型。模型目录是 GitHub 中的一个独立功能,你可以在 Copilot 中添加模型,因为 Copilot 支持扩展,你可以通过 Copilot 直接访问模型目录。所以,如果你想快速对 Phi-2 模型进行推理,只需要在 Copilot 中使用“添加模型”扩展即可。这样,你就可以使用比 Copilot 内置模型更多的选择。
我认为最重要的一点是,开源将驱动创新。DeepSeek 就是一个很好的例子,它发布于今年早些时候,实际上就是几周前,时间并不长。确实感觉像是过了半年,而不是一个半月。我认为开源会持续推动创新。在图像生成领域,我们已经看到了 Stable Diffusion 这样的例子。现在,一家名为 Black Forest Labs 的创业公司,推出了 Flux 模型,这家公司就在德国黑森林地区的弗莱堡,离我的家乡不远。因此,我们将见证更多创新。
我认为,开源模型将推动其他供应商不断进步,开源生态与专有闭源公司之间的这种良性竞争,将加速整个领域的发展。DeepSeek 是目前最典型的例子,你可以去了解一下,它的论文是公开的,模型也是开放的,有些模型甚至是完全开源的,遵循 MIT 许可协议;另一些模型则是开放权重,你可以查看模型的权重,代码也是开源的,但权重本身可能遵循某些专有许可协议,并受到中国法律等的约束。我认为这将推动创新,开放这个领域,并实现技术的普及。因为如果你只是想体验一下模型,你不必调用商业 API,完全可以在你自己的本地机器上运行,进行尝试。考虑到孩子、学生以及科研人员,这将打开一个巨大的空间。而这,也一直是 GitHub 的 DNA 的一部分。
09
开源的未来与软件开发的“无限游戏”
主持人提问:
如果我具体到某个开发者个体,我经常听到这样一种说法:某些特定类型的开发者,通常是技术实力非常强、经验丰富的系统工程师,他们往往对 Rust 情有独钟。他们会担心,下一代开发者在构建软件时,可能无法像他们一样,对架构选择、各种权衡以及特定实现在特定数据情况下可能出现的故障,有足够深入的理解和经验。所以,他们会担心,对于那些希望在 2025 年的“Minecraft”游戏中更进一步的人来说,积极拥抱和学习 AI 显然是正确的选择。但这种担忧是否也让你产生了共鸣?当开发者不再直接编写代码时,我们是否还能在抽象层面培养出对工程技术足够深入的理解,还是说这只是一种杞人忧天的担忧?
Thomas)实录:
那么,是 iPhone 赢了,还是 Android 赢了?是 Windows 赢了,还是 Linux 或 Mac OS 赢了?我认为,我们总是习惯于在科技行业中进行这种非此即彼的二元对立式的思考,但现实情况往往并非如此,在开发者领域尤其如此。就像 React 并没有取得绝对的胜利,总会有新的框架出现。在 React 之前,有 JQuery 以及其他各种你可能喜欢的库。我认为,在 Python、TypeScript 和 Rust 之后,还会出现新的编程语言。Rust 本身在五年前也还算不上主流。未来可能会出现更接近人类语言的编程语言,更具体地说,是自然语言层面的 AI,以及将自然语言转换为 CPU 或 GPU 指令的编程语言层。所以,我认为并不存在绝对的赢家。这是一场无限游戏,就像 Minecraft。软件开发就像 Minecraft,在 Minecraft 中没有最终的胜利。你可以在局部赢得一些小的胜利,它们可能局限于某个特定的子挑战或任务,但从整体来看,我们正在构建一个越来越庞大的软件世界,总会有新的事物出现。
我不认为这是一种杞人忧天,因为这种担忧显然有一定的道理。在编程练习或 Advent of Code 这类活动中,利用 AI 作弊确实变得更容易了。随着 AI 模型变得越来越强大,那些评判谁是最佳黑客或程序员的竞赛,将不得不提升到一个全新的水平。在这些竞赛中,你必须预设开发者会使用 AI 来解决问题,否则挑战就会变得过于简单。
AI对下一代开发者的影响,如果你考虑下一代开发者,也许不是 2025 年,而是 2035 年。想想看,你提到我在东德长大,后来柏林墙倒塌,我买了一台 Commodore 64。但那时没有互联网,所以我只能买书和杂志来看。我找不到任何论坛可以提问。我每周三会去一个电脑俱乐部,直到后来俱乐部里没人能教我新东西了。但如果对比现在,现在的孩子们,以及那些想学习编程的人,他们拥有无限的知识资源。而且,还有无限的耐心。因为 Copilot 不会像父母那样感到不耐烦,我自己就是个例子。所以,对于想要学习编程的人来说,AI 的出现极大地降低了门槛。你不需要父母有任何技术背景,你只需要一个能上网的手机,以及 Copilot、ChatGPT 或其他类似的工具,就可以开始提问。你可以询问关于布尔逻辑、系统思维的任何问题,可以无限深入地钻研,并根据自己的兴趣延伸到其他相关主题。所以,我认为我们会看到新一代人,他们与技术共同成长,对他们来说,使用个人助理、个人 AI Agent是很自然的事情。他们知道如何运用这些工具,因此可以在相同的时间内取得比我们过去 30 年更大的成就,我认为这非常令人兴奋。
说到底,有哪个开发者没有自己一直想做却没时间做的游戏、软件系统或功能呢?我的工程师们更多地抱怨工作超负荷、身心俱疲,没有足够的时间来完成我、客户以及安全团队提出的所有要求。所以,我认为这就是我们所处的现状,也是我们前进的方向,这一切都将令人无比兴奋。无论是在开源领域,还是在人们想要构建的任何类型的软件中,都是如此。开源的可持续性是一个重要的话题,我们完全可以再花一个小时来讨论。
10
个人经历对 AI 转型看法的塑造
主持人提问:
你的个人经历是否会影响你对当前 AI 转型速度以及用户和人类将如何反应的看法?
Thomas实录:
我一直认为,我人生的很多方面,都深受 1989 年那个变革时刻的影响。我记得柏林墙倒塌的那天晚上,或者说,是宣布柏林墙即将开放的那天晚上,那是一个星期四。第二天,星期五,我们照常上学。星期六也上了半天课,我记得我是班里仅有的四个到校学生之一,后来学校就让我们回家了。然后,我们去了西柏林。我认为,对于经历过那段变革时期的一代人来说,最重要的是,他们再也无法回到过去了。家已经不再是原来的家,就像街角那家熟悉的商店,早已不是 40 年前的样子,学校、整个社会体系、传统,一切都融入了那个新世界。这有点像从一个国家搬到另一个国家,10 年前,当微软收购我的公司时,我也经历了这样的搬迁。
关于变革与看待未来的方式,一旦你迈出了这一步,你就会对事物产生全新的看法。我认为,这就是 1990 年的统一,以及我人生中的一系列经历,包括最终成为 GitHub 的 CEO,这些看似偶然的决定,或者说,当时感觉是偶然的决定,造就了今天的我,也塑造了我看待未来的方式。我对未来充满乐观,同时也会回顾过去,汲取过往的经验。就像现在,我和你们交流时,会回想起 90 年代,在互联网普及前后、开源兴起前后、云计算出现前后、移动互联网普及前后,用 Commodore 64 编程的感受。现在,我们又经历了 AI 时代的前后,而且,历史的车轮不会倒转。未来,如果我们愿意,AI 将融入我们生活的方方面面。当然,你也可以选择把手机扔到一边,享受没有网络的一天。
访谈发布时间:2025年3月13日
原文地址:https://youtu.be/XqvNnl2AJkosi=UKXf9kSYhUGOVezO
访谈人物:GitHub CEO Thomas Dohmke
主持人:Elad Gil 和 Sarah Guo
No Priors关注人工智能、机器学习、科技、初创企业。