社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

3 个令人惊艳的 GitHub 项目,诞生了!

AI有道 • 3 月前 • 329 次点击  

最近这段时间,各大互联网公司在 AI 科技圈的各种动作可谓热闹非凡,每隔一段时间就有王炸产品放出!

开源图像模型 Flux 重磅来袭,图像生成质量直逼 Midjourney;强大的 Cursor 代码编辑器再次爆火,不少开发朋友将其视为 GitHub Copilot 的替代品;各大 LLM 大厂的模型 API 额度纷纷降价,未来与 AI 互动成本将越来越低。

作为全球最大的开源代码托管平台,GitHub 在过去这段时间,也诞生了不少优质的开源应用以及有趣的项目。

今天就给大家推荐几个 GitHub 上比较热门的 AI 工具,简单易用且高效,顺便解放你的个人生产力。

颠覆传统 OCR 技术,轻松处理复杂扫描 PDF

在日常工作生活中,面对那些质量低、格式混乱的扫描 PDF 文件时,如何提取当中的内容往往让人头疼。

传统的 OCR 工具,虽然能帮助我们高效处理这些文档,但使用过发现其内容识别精确度和排版体验不尽人意。

最近,我在 GitHub 上发现一款基于 LLM 的 OCR 扫描 PDF 开源工具:LLM-Aided OCR

它通过结合 LLM 和 OCR 技术,能够将原始扫描 PDF 文件转换为高准确度、格式正确且易于阅读的 Markdown 文档。

GitHub:https://github.com/Dicklesworthstone/llm_aided_ocr

简单介绍下该工具的工作流程:

  • PDF 转换为图像:首先将 PDF 文件转换为图像,方便 OCR 扫描识别;

  • OCR 处理:然后利用 OCR 技术扫描,从图像中提取文本内容;

  • 高效错误纠正:通过本地 LLM 或 API 服务(如 OpenAI、Anthropic)纠正 OCR 扫描提取到的文本错误;

  • 生成 Markdown:最后将处理后的文本内容转换为 Markdown 文档输出。

相比传统的 OCR 工作流程,需要几个小时处理的文本识别、手动校对、格式调整等繁琐操作,有了该工具后,一下子轻松多了。

无论是从 PDF 中提取文本,还是处理大量复杂扫描版文档内容,这款工具都能让我们工作变得更加高效和省心。

实时直播一键换脸,效果逼真

虽然 AI 换脸已经不是什么新鲜事,但最近 GitHub 上一个项目凭借一张 “马斯克” 照片,实现效果逼真的一键换脸直播,迅速爆火,狂揽 31.9k Star。

这个项目便是 Deep-Live-Cam,仅需单张图像,即可实现 AI 实时换脸和一键视频深度伪造,无需专用硬件加速。

GitHub:https://github.com/hacksider/Deep-Live-Cam

该工具拥有实时人脸交换、一键视频深度伪造、支持多种硬件加速、多平台等众多特点。

而且提供了详细的安装指南,简单四个步骤:

  1. 环境要求 python(推荐 3.10 版)、pip、git、ffmpeg、visual studio 2022 runtimes (windows);

  2. 克隆项目代码到本地;

  3. 下载两个模型:GFPGANv1.4 和 inswapper_128_fp16.onnx,并放入到 models 文件夹中;

  4. 安装项目依赖项。

完成以上步骤后,执行 python run.py 命令启动可视化操作界面,首次运行还会下载大约 300M 的模型,一切顺利将看到如下界面。

使用更加简单,只需选择一张需替换的人脸图像以及目标图像或视频,然后点击 Live 按钮,即可开始处理。

现在 AI 换脸的门槛越来越低,而且随着技术的不断进步,效果已经非常逼真,网上那些直播带货或者视频会议,大家可要瞪大眼睛仔细辨别了。

轻松制作证件照,AI 抠图无需 PS 技巧

我们的生活中,无论是求职简历、工作证,还是学生证,几乎都离不开证件照。

如果遇到突然需要证件照,往往会自己拍个照然后进行抠图制作,但对于 PS 小白来说相对挺费劲的。

虽然现在手机上已经有不少 App 能帮忙解决,但多数都需要付费。

最近,我在 GitHub 上发现了一款轻量级的 AI 证件照制作工具:HivisionIDPhoto

GitHub:https://github.com/Zeyi-Lin/HivisionIDPhotos

该工具实现了对多种用户拍照场景的识别、抠图与证件照生成,并提供不同尺寸规格的标准证件照。

提供如下功能:

  • 轻松识别我们拍摄的照片背景,实现精确的一键背景抠图;

  • 提供证件照全尺寸规格,满足我们生成不同的标准证件照、六寸排版照;

  • 能够对人物进行美颜处理(正在开发中);

  • 通过 AI 为我们生成身穿正装的证件照(正在开发中)。

虽然工具没有太多功能,但这些都是我们制作证件照必用到的尺寸修改、更换背景、抠图等实用功能。

而且项目完全开源,可在线使用,足够我们用它来解决临时急需要证件照的情况,值得收藏以备不时之需。 

以上,就是本期为大家推荐的几个 GitHub 项目,希望对大家有所帮助。



推荐阅读

(点击标题可跳转阅读)

《机器学习 100 天》视频讲解

公众号历史文章精选

我的深度学习入门路线


重磅

1700多页的《人工智能学习路线、干货分享全集》PDF文档




扫描下方二维码,添加我的微信,领取1700多页的《人工智能学习路线、干货分享全集》PDF文档(一定要备注:资料。 



长按扫码,申请入群



感谢你的分享,点赞,在看三  

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173790
 
329 次点击