社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

问:想问一个基础的问题,我想让chatgpt读一篇十几页或者几十-20240910054834

宝玉xp • 3 月前 • 328 次点击  

2024-09-10 05:48

问:想问一个基础的问题,我想让chatgpt读一篇十几页或者几十页的报告,然后针对其中的一部分,按照模板进行总结或者appraisal(有过往的报告参考),最好的方法是直接把pdf上传,然后再把模板上传,这样直接让他生成吗? 感谢宝玉老师!

答:

如果这个任务只有几页,那么对于 LLM 来说是很简单的任务,因为现在的 LLM,上下文窗口长度都比较大,GPT-4o(ChatGPT)有 32 K(2.3 万英文单词),Claude 3.5 Sonnet 有 200K(14万英文单词),Gemini 1.5 Pro 有 1M(70万英文单词)

所以如果只有几页,那么把报告内容+模板都提供给 LLM,让其按照模板总结就好。

如果几十页,那恐怕有点困难,可以先试试 Gemini 1.5 Pro,应该够用。

如果超出上下文长度,有几个办法:
1. 手动精简内容,把不必要的信息清理掉
2. 分块总结,将几十页拆成几页几页的小块,再选一种分块总结方案:
- 每块独立总结,然后将所有总结合并,可能会损失上下文
- 一块块总结,将前一块总结的结果合并到下一块一起总结,速度慢一些,但是上下文损失小一些

当然还有其他一些办法,根本就是保证输入长度不要超过 LLM 的最大上下文长度(最好不要超过最高上限的2/3,因为输出内容也占用长度)。

另外 PDF 中内容的格式对于结果也会有影响,比如图表的总结效果可能并不会好。如果能把这些信息变成文本会更好。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173987
 
328 次点击