最近这段时间,各大互联网公司在 AI 科技圈的各种动作可谓热闹非凡,每隔一段时间就有王炸产品放出!
开源图像模型 Flux 重磅来袭,图像生成质量直逼 Midjourney;强大的 Cursor 代码编辑器再次爆火,不少开发朋友将其视为 GitHub Copilot 的替代品;各大 LLM 大厂的模型 API 额度纷纷降价,未来与 AI 互动成本将越来越低。
作为全球最大的开源代码托管平台,GitHub 在过去这段时间,也诞生了不少优质的开源应用以及有趣的项目。
今天就给大家推荐几个 GitHub 上比较热门的 AI 工具,简单易用且高效,顺便解放你的个人生产力。
颠覆传统 OCR 技术,轻松处理复杂扫描 PDF
在日常工作生活中,面对那些质量低、格式混乱的扫描 PDF 文件时,如何提取当中的内容往往让人头疼。
传统的 OCR 工具,虽然能帮助我们高效处理这些文档,但使用过发现其内容识别精确度和排版体验不尽人意。
最近,我在 GitHub 上发现一款基于 LLM 的 OCR 扫描 PDF 开源工具:LLM-Aided OCR。
它通过结合 LLM 和 OCR 技术,能够将原始扫描 PDF 文件转换为高准确度、格式正确且易于阅读的 Markdown 文档。
GitHub:https://github.com/Dicklesworthstone/llm_aided_ocr
简单介绍下该工具的工作流程:
PDF 转换为图像:首先将 PDF 文件转换为图像,方便 OCR 扫描识别;
OCR 处理:然后利用 OCR 技术扫描,从图像中提取文本内容;
高效错误纠正:通过本地 LLM 或 API 服务(如 OpenAI、Anthropic)纠正 OCR 扫描提取到的文本错误;
生成 Markdown:最后将处理后的文本内容转换为 Markdown 文档输出。
相比传统的 OCR 工作流程,需要几个小时处理的文本识别、手动校对、格式调整等繁琐操作,有了该工具后,一下子轻松多了。
无论是从 PDF 中提取文本,还是处理大量复杂扫描版文档内容,这款工具都能让我们工作变得更加高效和省心。
实时直播一键换脸,效果逼真
虽然 AI 换脸已经不是什么新鲜事,但最近 GitHub 上一个项目凭借一张 “马斯克” 照片,实现效果逼真的一键换脸直播,迅速爆火,狂揽 31.9k Star。
这个项目便是 Deep-Live-Cam,仅需单张图像,即可实现 AI 实时换脸和一键视频深度伪造,无需专用硬件加速。
GitHub:https://github.com/hacksider/Deep-Live-Cam
该工具拥有实时人脸交换、一键视频深度伪造、支持多种硬件加速、多平台等众多特点。
而且提供了详细的安装指南,简单四个步骤:
环境要求 python(推荐 3.10 版)、pip、git、ffmpeg、visual studio 2022 runtimes (windows);
克隆项目代码到本地;
下载两个模型:GFPGANv1.4 和 inswapper_128_fp16.onnx,并放入到 models 文件夹中;
安装项目依赖项。
完成以上步骤后,执行 python run.py
命令启动可视化操作界面,首次运行还会下载大约 300M 的模型,一切顺利将看到如下界面。
使用更加简单,只需选择一张需替换的人脸图像以及目标图像或视频,然后点击 Live 按钮,即可开始处理。
现在 AI 换脸的门槛越来越低,而且随着技术的不断进步,效果已经非常逼真,网上那些直播带货或者视频会议,大家可要瞪大眼睛仔细辨别了。
轻松制作证件照,AI 抠图无需 PS 技巧
我们的生活中,无论是求职简历、工作证,还是学生证,几乎都离不开证件照。
如果遇到突然需要证件照,往往会自己拍个照然后进行抠图制作,但对于 PS 小白来说相对挺费劲的。
虽然现在手机上已经有不少 App 能帮忙解决,但多数都需要付费。
最近,我在 GitHub 上发现了一款轻量级的 AI 证件照制作工具:HivisionIDPhoto。
GitHub:https://github.com/Zeyi-Lin/HivisionIDPhotos
该工具实现了对多种用户拍照场景的识别、抠图与证件照生成,并提供不同尺寸规格的标准证件照。
提供如下功能:
轻松识别我们拍摄的照片背景,实现精确的一键背景抠图;
提供证件照全尺寸规格,满足我们生成不同的标准证件照、六寸排版照;
能够对人物进行美颜处理(正在开发中);
通过 AI 为我们生成身穿正装的证件照(正在开发中)。
虽然工具没有太多功能,但这些都是我们制作证件照必用到的尺寸修改、更换背景、抠图等实用功能。
而且项目完全开源,可在线使用,足够我们用它来解决临时急需要证件照的情况,值得收藏以备不时之需。
以上,就是本期为大家推荐的几个 GitHub 项目,希望对大家有所帮助。
重磅!
1700多页的《人工智能学习路线、干货分享全集》PDF文档
扫描下方二维码,添加我的微信,领取1700多页的《人工智能学习路线、干货分享全集》PDF文档(一定要备注:资料)。
长按扫码,申请入群
感谢你的分享,点赞,在看三连