一个 ChatGPT / Gemini 的实用技巧:检索并提取部分 PDF 内容
ChatGPT 和 Gemini 应该都内置了 PDF 工具,可以读取 PDF 内容,也可以帮你检索。如果你选的是推理模型的话(o3/o4-mini/Gemini 2.5 pro等)由于它们都有推理能力,所以可以对 PDF 先进行检索,然后去提取。
当然太长了也不行,毕竟受限于上下文窗口长度。
比如我有个 400 多页的 PDF 文件,没有哪个 LLM 能正常提取完整内容,但是你可以让它:
> 帮我找出来这个PDF中有关教育方面的章节,并将这个章节的内容提取成 Markdown
或者你也可以:
> 帮我翻译这个PDF169到171页的内容,保持图表不变,输出为Markdown格式
这个任务 Gemini 结果还要好一些,但 Claude 有点拉跨,PDF 稍微一大就无法运行,提示超过了长度。
ChatGPT 和 Gemini 应该都内置了 PDF 工具,可以读取 PDF 内容,也可以帮你检索。如果你选的是推理模型的话(o3/o4-mini/Gemini 2.5 pro等)由于它们都有推理能力,所以可以对 PDF 先进行检索,然后去提取。
当然太长了也不行,毕竟受限于上下文窗口长度。
比如我有个 400 多页的 PDF 文件,没有哪个 LLM 能正常提取完整内容,但是你可以让它:
> 帮我找出来这个PDF中有关教育方面的章节,并将这个章节的内容提取成 Markdown
或者你也可以:
> 帮我翻译这个PDF169到171页的内容,保持图表不变,输出为Markdown格式
这个任务 Gemini 结果还要好一些,但 Claude 有点拉跨,PDF 稍微一大就无法运行,提示超过了长度。