关注这四个Github开源项目，你会更懂AI代理

点击上方↗️「活水智能」，关注 + 星标🌟

作者：小鱼儿

来源：原创

在大语言模型迅速发展的今天，AI代理(Agent)成为了技术圈的热门话题。但对于许多开发者来说，AI代理依然是个模糊的概念：它到底是什么？能做什么？如何开发？

今天，我想向你推荐四个开源项目，通过了解这些项目，你将更深入地理解AI代理的本质和应用。

让AI像人类一样操作浏览器：Browser-Use

想象一下，如果AI能像你一样浏览网页、点击按钮、填写表单、搜索信息，那将会如何改变你的工作方式？Browser-Use项目(github.com/browser-use/browser-use)正是为此而生，目前已经获得了惊人的45.8k颗星。

Browser-Use是一个基于Python开发的开源库，它将先进的AI技术与浏览器自动化功能深度融合。通过集成Playwright等浏览器自动化工具，Browser-Use允许开发者使用任何支持LangChain的大型语言模型（如GPT-4、Claude、DeepSeek等）来自动化浏览网页、提取信息、模拟用户操作等。

Browser-Use的核心魅力在于它让AI能够"看见"网页内容并与之交互。你只需要用自然语言告诉AI想要完成什么任务，它就能执行相应操作。例如：

"去微博首页，获取热搜榜前十的内容"
"在GitHub上搜索'浏览器自动化'相关项目并提取第一页结果"
"访问某电商网站，查找特定商品的价格并比较"

使用Browser-Use非常简单，只需几行代码：

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="访问Reddit，在搜索栏中搜索'browser-use'，点击第一篇帖子并返回第一条评论"


    
,
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

更棒的是，Browser-Use支持多种模型，不仅限于OpenAI。如果你想降低成本或使用其他模型，可以很容易地切换到DeepSeek、本地模型等。

Browser-Use的出现解锁了无数可能性：自动化数据收集、网页内容监控、复杂表单填写、网页测试等。随着项目的不断发展，未来我们可能会看到更多围绕Browser-Use构建的创新应用。

打造你的AI团队：CrewAI

你是否曾经希望拥有一个AI团队，每个成员都有特定的专长，能够协同工作完成复杂任务？CrewAI(github.com/crewAIInc/crewAI)就是为实现这一愿景而诞生的框架，已经获得超过27.2k的Star。

CrewAI是一个专为编排角色扮演、自主AI代理而设计的生产级框架。通过促进协作智能，CrewAI使代理能够无缝协作，解决复杂的业务挑战，并获得可预测、一致的结果。

在CrewAI中，你可以创建多个AI代理，每个代理都有特定的角色、目标和专业知识。这些代理可以相互沟通，协同工作，就像一个真实的团队一样。例如，你可以创建一个研究代理来收集信息，一个分析代理来处理数据，一个写作代理来撰写报告。

CrewAI的独特之处在于其"Crews"和"Flows"架构：

• Crews：代理团队，通过角色扮演协作完成特定任务，提供准确可预测的结果
• Flows：事件驱动的工作流，可以编排Crews和普通Python代码，允许构建复杂的自动化管道

与其他框架相比，CrewAI的性能也相当出色。据开发者测试，在某些任务中，CrewAI的执行速度比LangGraph快5.76倍，同时在某些编码任务中能够获得更高的评分和更快的完成时间。

来看一个简单的翻译代理实现示例：

def run():
    inputs = {
        'question': '读取test.txt文件内容，将其翻译为英文，然后写入test4.txt文件',
    }
    
    try:
        TranslationAgent().crew().kickoff(inputs=inputs)
    except Exception as e:
        raise Exception(f"An error occurred while running the crew: {e}")

通过CrewAI，你可以构建复杂的AI系统，让AI代理协同工作，实现超越单个AI能力的任务。无论是商业分析、内容创作，还是软件开发，CrewAI都能帮助你构建出强大的AI团队。

让AI拥有长期记忆：Letta

你是否注意到，大多数AI聊天机器人在对话结束后就会"失忆"？下次再交流时，必须重新解释上下文。Letta(github.com/letta-ai/letta)（前身为MemGPT）就是为了解决这个问题而诞生的框架，目前已获得14.7k颗星。

Letta是一个用于构建有状态LLM应用的开源框架。你可以使用Letta构建具有高级推理能力和透明长期记忆的有状态代理。该框架是白盒的，且与模型无关。

Letta的核心特性是它能够给AI添加"记忆"。这不仅仅是简单的会话保存，而是一套完整的记忆管理系统，让AI能够：

1. 长期记住过去的交互
2. 从外部数据源提取和存储信息
3. 基于历史记忆优化后续响应
4. 像人类一样进行上下文理解和延续

Letta的记忆架构由MemGPT支持，允许LLM存储和检索过去的交互或外部数据，类似于知识图谱或持久性记忆数据库。这使得AI代理能够提供更加连贯和个性化的体验。

Letta最大的优势在于它支持任何LLM集成，不受特定框架限制。它提供了一个代理开发环境(ADE)，这是一个基于GUI的工具，用于创建、编辑和管理LLM代理。开发者可以从一个集中平台设计工作流、定义记忆行为和调试代理任务。

通过Letta，你可以构建各种有状态的AI应用，例如：

• 个人助手，能够记住你的偏好和历史请求
• 客户服务代理，能够记住客户的查询历史
• 教育辅助工具，能够跟踪学习进度并相应调整内容
• 健康监测系统，能够记录和分析长期健康数据

Letta的开源性质意味着它不断得到社区的改进和扩展，目前已有123位贡献者参与项目开发。

终端中的AI编程助手：Plandex

最后要介绍的是Plandex(github.com/plandex-ai/plandex)，一个专为大型、真实世界任务设计的AI编码代理，已经获得了11.2k颗星。

Plandex是一个开源的、基于终端的AI编程引擎，用于处理复杂任务。它通过长期运行的代理来完成跨越多个文件和多个步骤的任务，将大型任务分解为更小的子任务，然后逐个实现，直到完成整个工作。

与一般的AI编码助手不同，Plandex的特点在于：

1. 沙盒环境：变化积累在受保护的沙盒中，用户可以在自动应用到项目文件之前查看它们。内置的版本控制允许用户轻松地回退并尝试不同的方法。
2. 高效的上下文管理：用户可以轻松地将文件或整个目录添加到上下文中，并自动保持它们更新，以便模型始终具有项目最新状态。
3. 多分支探索：分支功能允许用户尝试多种实现方法并比较结果，找出最优解决方案。

使用Plandex非常简单，只需几个命令：

# 安装
curl -sL https://plandex.ai/install.sh | bash

# 创建新计划
plandex new

# 加载相关文件
plandex load src/components -r

# 发送提示
plandex tell "添加一个新的折线图，显示components/charts.tsx中随时间变化的数量"

Plandex特别适合处理以下场景：

• 快速构建新应用或原型
• 为现有应用添加新功能
• 编写测试和自动化脚本
• 理解复杂代码库并修复错误
• 完成重复性编码任务

随着其持续发展，Plandex计划支持更多开源模型、多模态功能、VSCode和JetBrains扩展、社区插件等，进一步增强其功能。

总结：AI代理的未来

这四个开源项目代表了AI代理技术的不同方向：Browser-Use让AI能够与浏览器交互，CrewAI实现了AI团队协作，Letta为AI添加了长期记忆，Plandex则专注于复杂编程任务的自动化。

它们共同描绘了AI代理的未来：更加自主、更具记忆力、能够协作、能够与现实世界交互。这些技术的结合将极大地扩展AI的能力边界，创造出更加智能、更加有用的AI应用。

作为开发者或AI爱好者，现在正是深入了解和参与这些项目的好时机。你可以通过Star、Fork这些项目，或者直接贡献代码来支持它们的发展。

你对哪个项目最感兴趣？欢迎在评论区分享你的想法，或者告诉我你希望了解的其他AI开源项目。

活水智能成立于北京，致力于通过AI教育、AI软件和社群提高知识工作者生产力。

活水现有AI线下工作坊等10+门课程，15+AI软件上线，多款产品在研。知识星球中拥有2600+成员，涵盖大厂程序员、公司高管、律师等各类知识工作者。在北、上、广、深、杭、重庆等地均有线下组织。

欢迎加入我们的福利群，每周都有一手信息、优惠券发放、优秀同学心得分享，还有赠书活动~

👇🏻👇🏻👇🏻

↙ 点击阅读原文，立即入群