社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

一个 ChatGPT / Gemini 的实用技巧:检索并提取部-20250425141349

宝玉xp • 4 天前 • 23 次点击  

2025-04-25 14:13

一个 ChatGPT / Gemini 的实用技巧:检索并提取部分 PDF 内容

ChatGPT 和 Gemini 应该都内置了 PDF 工具,可以读取 PDF 内容,也可以帮你检索。如果你选的是推理模型的话(o3/o4-mini/Gemini 2.5 pro等)由于它们都有推理能力,所以可以对 PDF 先进行检索,然后去提取。

当然太长了也不行,毕竟受限于上下文窗口长度。

比如我有个 400 多页的 PDF 文件,没有哪个 LLM 能正常提取完整内容,但是你可以让它:
> 帮我找出来这个PDF中有关教育方面的章节,并将这个章节的内容提取成 Markdown

或者你也可以:
> 帮我翻译这个PDF169到171页的内容,保持图表不变,输出为Markdown格式

这个任务 Gemini 结果还要好一些,但 Claude 有点拉跨,PDF 稍微一大就无法运行,提示超过了长度。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181483
 
23 次点击