Github这些项目自己部署,作为企业内部使用或者个人使用,没什么问题,但如果要作为商业服务提供给客户使用,还是要详细阅读项目的开源协议。本文推荐都是带有UI操作界面开箱即用的项目。除了这些项目外,还有Github上还有很多是提供底层架构,类似LangChain、LlamaIndex,或者某个环节特定能力的。Quivr,33.4K,您的第二大脑,利用 GenerativeAI 的力量成为您的个人助理!
https://github.com/QuivrHQ/quivr比较早的项目,大概一年前就使用过,Docker安装需要下载国外的依赖包,经常会失败。功能比较简约,能处理Text、Markdown、PDF、Powerpoint、Excel、CSV、Word、音频、视频等格式。做个人知识库没问题,但官网说的类似Obsidian,没看出来。https://github.com/langgenius/difyDify 是一个开源的LLM 应用开发平台。它的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
是目前看到的功能最强大的RAG相关开源项目,定位是平台,不只是RAG流程,即使不做二次开发,通过配置也能实现很多个性化的工作流。
作为企业后台服务可以,协议有限制,不能作为SaaS服务。https://github.com/netease-youdao/QAnythingQAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。您的任何格式的本地文件都可以往里扔,即可获得准确、快速、靠谱的问答体验。目前已支持格式: PDF(pdf),Word(docx),PPT(pptx),XLS(xlsx),Markdown(md),电子邮件(eml),TXT(txt),图片(jpg,jpeg,png),CSV(csv),网页链接(html),更多格式。网易有道开源的RAG项目,功能比较纯粹,使用他们自己开发的BCEmbedding模型,支持Embedding和Reranking。部署和使用比较简单,适合个人使用。https://github.com/open-webui/open-webui以前称为 Ollama WebUI,Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线运行。它支持各种 LLM 运行器,包括 Ollama 和 OpenAI 兼容 API。别看名字叫WebUI ,实际上功能相当齐全,支持跟SD WebUI、ComfyUI和 DALL-E等图片生成工具集成。短短几个月项目的项目Star飙升很快,迭代迅速,潜力巨大。MIT协议,非常宽松。https://github.com/Mintplex-Labs/anything-llmAnythingLLM是一个全栈应用程序,您可以使用现成的商业大语言模型或流行的开源大语言模型,再结合向量数据库解决方案构建一个私有ChatGPT,不再受制于人:您可以本地运行,也可以远程托管,并能够与您提供的任何文档智能聊天。项目是JS开发的,支持云端部署,同时还有基于Electron桌面应用,支持各种操作系统。这意味着如果配置本地跑的Ollama,就是纯离线的LLM应用了。我试过AnythingLLM+Ollama+Llama3 7B,MacBook M3 pro,可以用,但处理稍微大点的文件Embedding会崩溃,还不清楚是什么原因。https://github.com/reorproject/reor一款由人工智能驱动的桌面笔记应用:它会自动链接相关笔记、回答笔记中的问题、提供语义搜索并可以生成人工智能抽认卡。所有内容都存储在本地,您可以使用类似 Obsidian 的 Markdown 编辑器编辑笔记。它可以把自动把目录下的文档Embedding,可以直接搜索和对话,UI风格也类似Obsidian。AGPL-3.0 许可证。
https://github.com/danswer-ai/danswerDanswer是连接到您公司的文档、应用程序和人员的 AI 助手。Danswer 提供聊天界面并可插入您选择的任何 LLM。Danswer 可以部署在任何地方,规模任意 - 笔记本电脑、本地或云端。由于您拥有部署,因此您的用户数据和聊天完全由您自己控制。比较纯粹的知识库应用,可以连接Slack,Confluence,Jira等对三方的应用。有个很好的特性,对检索出来的文档,可以手动选择哪些作为LLM的上下文。MIT协议。https://github.com/zhayujie/chatgpt-on-wechat基于大模型搭建的聊天机器人,同时支持 微信公众号、企业微信应用、飞书、钉钉 等接入,可选择GPT3.5/GPT-4o/GPT4.0/ Claude/文心一言/讯飞星火/通义千问/ Gemini/GLM-4/Claude/Kimi/LinkAI,能处理文本、语音和图片,访问操作系统和互联网,支持基于自有知识库进行定制企业智能客服。这是专为国内的开源项目,有很多可配制化的参数和插件,如果有这方面需求的话,使用这个项目做二次开发可以节省不少时间。https://github.com/TaskingAI/TaskingAITaskingAI将 Firebase 的简易性带入AI 原生应用开发。该平台支持使用来自不同提供商的各种 LLM 创建类似 GPT 的多租户应用。它具有独特的模块化功能,例如推理、检索、助手和工具,这些功能无缝集成以增强开发过程。TaskingAI 的统一设计确保了 AI 应用开发的高效、智能和用户友好的体验。可以创建自己的Assistant类似Dify,但配置功能没有那么强大。前后端分离,配置的Assistant可以提供出来API,有client SDK跟服务端交互,这点确实非常实用。Apache-2.0 协议,但没有限制商用,点赞。https://github.com/infiniflow/ragflowRAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。核心功能是文档的智能解析和管理,支持多种格式,并允许用户使用任何大型语言模型查询他们上传的文档。其最大特色是多样化的文档智能处理,不采用现成的RAG中间件,而是完全重新研发了一套智能文档理解系统,并以此为依托构建RAG任务。