社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

关注这四个Github开源项目,你会更懂AI代理

活水智能 • 1 周前 • 9 次点击  

点击上方↗️活水智能关注 + 星标🌟

作者:小鱼儿

来源:原创


 

在大语言模型迅速发展的今天,AI代理(Agent)成为了技术圈的热门话题。但对于许多开发者来说,AI代理依然是个模糊的概念:它到底是什么?能做什么?如何开发?

今天,我想向你推荐四个开源项目,通过了解这些项目,你将更深入地理解AI代理的本质和应用。

让AI像人类一样操作浏览器:Browser-Use

想象一下,如果AI能像你一样浏览网页、点击按钮、填写表单、搜索信息,那将会如何改变你的工作方式?Browser-Use项目(github.com/browser-use/browser-use)正是为此而生,目前已经获得了惊人的45.8k颗星。

Browser-Use是一个基于Python开发的开源库,它将先进的AI技术与浏览器自动化功能深度融合。通过集成Playwright等浏览器自动化工具,Browser-Use允许开发者使用任何支持LangChain的大型语言模型(如GPT-4、Claude、DeepSeek等)来自动化浏览网页、提取信息、模拟用户操作等。

Browser-Use的核心魅力在于它让AI能够"看见"网页内容并与之交互。你只需要用自然语言告诉AI想要完成什么任务,它就能执行相应操作。例如:

"去微博首页,获取热搜榜前十的内容"
"在GitHub上搜索'浏览器自动化'相关项目并提取第一页结果"
"访问某电商网站,查找特定商品的价格并比较"

使用Browser-Use非常简单,只需几行代码:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio

async def main():
    agent = Agent(
        task="访问Reddit,在搜索栏中搜索'browser-use',点击第一篇帖子并返回第一条评论" ,
        llm=ChatOpenAI(model="gpt-4o"),
    )
    result = await agent.run()
    print(result)

asyncio.run(main())

更棒的是,Browser-Use支持多种模型,不仅限于OpenAI。如果你想降低成本或使用其他模型,可以很容易地切换到DeepSeek、本地模型等。

Browser-Use的出现解锁了无数可能性:自动化数据收集、网页内容监控、复杂表单填写、网页测试等。随着项目的不断发展,未来我们可能会看到更多围绕Browser-Use构建的创新应用。

打造你的AI团队:CrewAI

你是否曾经希望拥有一个AI团队,每个成员都有特定的专长,能够协同工作完成复杂任务?CrewAI(github.com/crewAIInc/crewAI)就是为实现这一愿景而诞生的框架,已经获得超过27.2k的Star。

CrewAI是一个专为编排角色扮演、自主AI代理而设计的生产级框架。通过促进协作智能,CrewAI使代理能够无缝协作,解决复杂的业务挑战,并获得可预测、一致的结果。

在CrewAI中,你可以创建多个AI代理,每个代理都有特定的角色、目标和专业知识。这些代理可以相互沟通,协同工作,就像一个真实的团队一样。例如,你可以创建一个研究代理来收集信息,一个分析代理来处理数据,一个写作代理来撰写报告。

CrewAI的独特之处在于其"Crews"和"Flows"架构:

  • • Crews:代理团队,通过角色扮演协作完成特定任务,提供准确可预测的结果

  • • Flows:事件驱动的工作流,可以编排Crews和普通Python代码,允许构建复杂的自动化管道

与其他框架相比,CrewAI的性能也相当出色。据开发者测试,在某些任务中,CrewAI的执行速度比LangGraph快5.76倍,同时在某些编码任务中能够获得更高的评分和更快的完成时间。

来看一个简单的翻译代理实现示例:

def run():
    inputs = {
        'question''读取test.txt文件内容,将其翻译为英文,然后写入test4.txt文件',
    }
    
    try:
        TranslationAgent().crew().kickoff(inputs=inputs)
    except Exception as e:
        raise Exception(f"An error occurred while running the crew: {e}")

通过CrewAI,你可以构建复杂的AI系统,让AI代理协同工作,实现超越单个AI能力的任务。无论是商业分析、内容创作,还是软件开发,CrewAI都能帮助你构建出强大的AI团队。

让AI拥有长期记忆:Letta

你是否注意到,大多数AI聊天机器人在对话结束后就会"失忆"?下次再交流时,必须重新解释上下文。Letta(github.com/letta-ai/letta)(前身为MemGPT)就是为了解决这个问题而诞生的框架,目前已获得14.7k颗星。

Letta是一个用于构建有状态LLM应用的开源框架。你可以使用Letta构建具有高级推理能力和透明长期记忆的有状态代理。该框架是白盒的,且与模型无关。

Letta的核心特性是它能够给AI添加"记忆"。这不仅仅是简单的会话保存,而是一套完整的记忆管理系统,让AI能够:

  1. 1. 长期记住过去的交互

  2. 2. 从外部数据源提取和存储信息

  3. 3. 基于历史记忆优化后续响应

  4. 4. 像人类一样进行上下文理解和延续

Letta的记忆架构由MemGPT支持,允许LLM存储和检索过去的交互或外部数据,类似于知识图谱或持久性记忆数据库。这使得AI代理能够提供更加连贯和个性化的体验。

Letta最大的优势在于它支持任何LLM集成,不受特定框架限制。它提供了一个代理开发环境(ADE),这是一个基于GUI的工具,用于创建、编辑和管理LLM代理。开发者可以从一个集中平台设计工作流、定义记忆行为和调试代理任务。

通过Letta,你可以构建各种有状态的AI应用,例如:

  • • 个人助手,能够记住你的偏好和历史请求

  • • 客户服务代理,能够记住客户的查询历史

  • • 教育辅助工具,能够跟踪学习进度并相应调整内容

  • • 健康监测系统,能够记录和分析长期健康数据

Letta的开源性质意味着它不断得到社区的改进和扩展,目前已有123位贡献者参与项目开发。

终端中的AI编程助手:Plandex

最后要介绍的是Plandex(github.com/plandex-ai/plandex),一个专为大型、真实世界任务设计的AI编码代理,已经获得了11.2k颗星。

Plandex是一个开源的、基于终端的AI编程引擎,用于处理复杂任务。它通过长期运行的代理来完成跨越多个文件和多个步骤的任务,将大型任务分解为更小的子任务,然后逐个实现,直到完成整个工作。

与一般的AI编码助手不同,Plandex的特点在于:

  1. 1. 沙盒环境:变化积累在受保护的沙盒中,用户可以在自动应用到项目文件之前查看它们。内置的版本控制允许用户轻松地回退并尝试不同的方法。

  2. 2. 高效的上下文管理:用户可以轻松地将文件或整个目录添加到上下文中,并自动保持它们更新,以便模型始终具有项目最新状态。

  3. 3. 多分支探索:分支功能允许用户尝试多种实现方法并比较结果,找出最优解决方案。

使用Plandex非常简单,只需几个命令:

安装
curl -sL https://plandex.ai/install.sh | bash

创建新计划
plandex new

加载相关文件
plandex load src/components -r

发送提示
plandex tell "添加一个新的折线图,显示components/charts.tsx中随时间变化的数量"

Plandex特别适合处理以下场景:

  • • 快速构建新应用或原型

  • • 为现有应用添加新功能

  • • 编写测试和自动化脚本

  • • 理解复杂代码库并修复错误

  • • 完成重复性编码任务

随着其持续发展,Plandex计划支持更多开源模型、多模态功能、VSCode和JetBrains扩展、社区插件等,进一步增强其功能。

总结:AI代理的未来

这四个开源项目代表了AI代理技术的不同方向:Browser-Use让AI能够与浏览器交互,CrewAI实现了AI团队协作,Letta为AI添加了长期记忆,Plandex则专注于复杂编程任务的自动化。

它们共同描绘了AI代理的未来:更加自主、更具记忆力、能够协作、能够与现实世界交互。这些技术的结合将极大地扩展AI的能力边界,创造出更加智能、更加有用的AI应用。

作为开发者或AI爱好者,现在正是深入了解和参与这些项目的好时机。你可以通过Star、Fork这些项目,或者直接贡献代码来支持它们的发展。

你对哪个项目最感兴趣?欢迎在评论区分享你的想法,或者告诉我你希望了解的其他AI开源项目。

 





活水智能成立于北京,致力于通过AI教育、AI软件和社群提高知识工作者生产力。

活水现有AI线下工作坊等10+门课程,15+AI软件上线,多款产品在研。知识星球中拥有2600+成员,涵盖大厂程序员、公司高管、律师等各类知识工作者。在北、上、广、深、杭、重庆等地均有线下组织。

欢迎加入我们的福利群,每周都有一手信息、优惠券发放、优秀同学心得分享,还有赠书活动~

👇🏻👇🏻👇🏻

图片

 点击阅读原文,立即入群

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180212
 
9 次点击