社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

不能用 AI 代写作业了?OpenAI 正研发 ChatGPT 文本水印,检测成功率惊人

AppSo • 4 月前 • 418 次点击  

前段时间,关于 AI 检测毕业论文的话题引发了广泛讨论,并一度登上了热搜榜,围观者观点无外乎 AI 检测论文的程度有些过火,甚至也有人质疑是否应该使用 AI 进行检测。
而据《华尔街日报》报道,OpenAI 内部开发了一种可以准确检测用户是否利用 ChatGPT 撰写文章或学术论文的方法。
报道称,这项技术的背后用到了一种数字水印,虽然肉眼上不可察觉,但可以通过 OpenAI 的检测技术进行识别。检测工具会提供一个分数,以评估整篇文档或其中一部分由 ChatGPT 撰写的可能性。
内部文件透露,当由 ChatGPT 生成的文本达到一定程度时,水印技术的准确性高达 99.9%。
去年七月,包括 OpenAI、Meta 在内的七家科技巨头承诺将采用一些安全措施来增强 AI 技术的安全性。
这七家科技巨头都承诺将共同开发和应用一种水印系统,适用于 AI 生成的所有类型的内容,包括文本、图像、音频和视频。
据知情人士和《华尔街日报》查阅的内部文件显示,ChatGPT 文本检测器也已经准备就绪,随时可以发布。一位知情人士表示:「这不过是按一下按钮的事情。」
OpenAI CEO Sam Altman 和 CTO Mira MUrati 也曾参与有关这个「反作弊」工具的讨论,但据知情人士透露,Altman 虽然支持这个项目的开发,但却并未积极推动其公开发布。
一个关键的考虑因素在于,根据 OpenAI 对 ChatGPT 高黏度用户所进行的一项调查结果,69% 的用户认为作弊检测技术可能会引发对使用 AI 的不实指控。
近 30% 的用户表示,如果 ChatGPT 启用了水印功能而其竞争对手没有,他们可能会减少使用 ChatGPT。
OpenAI 去年也曾推出一款名为「AI Text Classifier」 的文本检测器,旨在检测文本是否是由 AI 生成。
然而,根据 OpenAI 的数据,该工具在识别 AI 生成文本方面的正确率仅为 26%,同时将人类缩写内容错误识别为 AI 生成的错误率达到了 9%,因此,该工具仅推出半年后便遭到了停用。
与此同时,《华尔街日报》引述 OpenAI 一位女发言人的话称,OpenAI 担心这项工具可能对非英语为母语的群体造成不公平的影响。
她强调「我们正在开发的文本水印技术在技术上有很大潜力,但在探索其他可能性时,我们也在权衡其带来的重要风险……考虑到所涉及问题的复杂性和对 OpenAI 之外整个生态系统可能产生的影响,我们认为采取谨慎的态度是必要的。」
斯坦福大学生物医学数据科学助理教授 James Zou 曾领导一众科学家,使用 7 个流行的 GPT 检测器评估了 91 篇由非英语母语人士撰写的托福(鉴定非英语为母语者的英语能力考试)作文。
研究发现,在 7 个 GPT 检测器中,由非英语母语人士撰写的超过一半的作文被错误地标记为由 AI 生成,甚至有一个检测器错误地将近 98% 的作文标注为由 AI 生成。
相比之下,以英语为母语的八年级学生写的作文在检测后,同样的 AI 检测器将超过 90% 的作文标注为由人类生成。
此外,这类 AI 检测器的普及度也是一个微妙的平衡点。
倘若使用检测器的人过少,该工具的效果将大打折扣,如果使用的人太多,被破解的风险也随之激增。
可以预见的是,随着 AI 的不断进步和渗透到我们的日常生活,验证作品的「含人量」将逐渐成为我们不得不面对的新常态。



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172914
 
418 次点击