Py学习  »  chatgpt

为什么Karpathy说Notebook LM中蕴藏着类似 ChatGPT 的机会

歸藏的AI工具箱 • 3 天前 • 47 次点击  

昨晚Andrej Karpathy介绍了一下谷歌的 NotebookLM,之后还说这个产品所代表的交互形式可能触及 LLM 产品的全新领域,是一个类似 ChatGPT 的新范式。大家也都知道目前 AI 的价值主要集中在生产力层面,也就是工具属性比较重,主要辅助用户生产内容。

工作流程是用户向 AI提出问题,AI 给出意见,用户基于意见修正和整合,产生新内容。

但是作为工具来说他的价值是有限的,因为需要文字类工具的人非常少,无法快速形成规模效应。

目前比较赚钱的业务都是涉及内容消费的,比如抖音这类 PGC 内容生产和分发工具。

Karpathy 正是看到了 Notebook LM这个产品中蕴含的内容消费机会。

ChatGPT 为什么可以帮助 LLM 破圈

他说 Notebook LM 可能蕴含着类似 ChatGPT 这种机会,我们来看 ChatGPT 解决了什么问题。

其实 GPT-3 的模型已经具备相当的能力了,但是发布相当长时间没有出圈,不被人注意。

ChatGPT 将 GPT-3.5 包装成一个对话界面,突然就出圈了,直接开启了这一轮 AI 大战的序幕。

对话形式一下解放了 LLM 的能力,让人们意识到到了他的全能和开放性,也给了用户一种错觉和暗示,那就是 LLM 真的是具有智能的,我在跟一个真的意识在聊天。

所以说一个与当前 AI 发展阶段匹配的交互形态对于推广产品和模型能力是非常重要的。

从 Perplexity 和 Notebook LM 看新的 AI 产品范式

在总结新的范式之前我们来看这个范式两个典型的产品功能表现的例子。

Perplexity 的发现页

Perplexity 最近对他的发现页进行了大改版,我说他们在创造一个更强的今日头条,估计他们 CEO 也是因为这部分分析关注我的。

AI 会自动在互联网上搜集和检索信息,然后综合各个信息源整合成新闻页面,可以根据你选择的主题给你推荐,在移动端表现为类似抖音的上下滑形式。

页面的新闻内容会被翻译为用户当前使用的语言,比如你的界面是中文,新闻内容就也是中文。

另外你可以在这个页面点击按钮直接收听今天的所有新闻,也可以在新闻页面单独收听这一条。

另外 Nothing Phone 也有个类似功能是一个桌面小组件,长得像收音机,点击之后他们公司 CEO 就会给你播报今天的新闻。

NotebookLM 的对谈播客

Notebook LM 是谷歌的一个产品你可以上传文件(文字、音频、视频)之后,AI 会帮你总结成文字内容而且可以提问相关信息。

他们最近上线一个功能,可以将你上传的文件总结为一个双人对谈的播客,解放了你的眼睛,可以直接收听这个上传内容的总结,也可以讲生成的播客内容分享给其他人。

NetebookLM 代表的新 AI 交互范式是什么

NotebookLM 播客功能为代表的产品功能代表的新 AI 交互范式:

就是将已有的庞大文本内容利用日渐成熟的其他模态 AI 模型转换为更多可被用户消费的内容形态,从而满足更多的用户消费场景。

Perplexity 的发现页面将全世界大量不同语言的新闻内容重新整合,变为可以被不同语言消费的新闻信息流,同时 TTS 的加入让用户的消费场景获得了极大的拓展,可以不用盯着屏幕了。

NotebookLM 将用户感兴趣的长篇文字内容拆解、总结、整合,让其更符合用户消费习惯,播客的加入也让整理内容的消费场景获得了拓展,另外对谈的形式也避免了让用户提问题这个成本很高的动作。

这一范式的主要特点是:

AI 自动收集整理文本内容将原始文本内容转换为可被消费的其他模态内容

主要的解决了下面这些问题:

拓展内容消费来源:不同语言不同地区的内容都可以被消费。拓展内容消费场景和形式:同一份内容可以被变为图文、单口播客、对谈播客、视频。降低内容消费成本:长篇深度内容可以被结构为简单的、简短的内容供用户消费。

这一范式实现的前提只有一个:

**各个模态 AI 生成模型开始真正成熟,生产的文本、音频、视频没有违和感,可以被消费。

NotebookLM 生成的播客能如此出圈也是因为他的对谈播客声音自然流畅,非常有感情,没有 AI 感。Perplexity 整理和收集的新闻行文简明扼要,废话很少,图文混排的时候文字和图片相关性也很强。

目前成熟应用的场景还是图文和声音,随着视频生成和检索技术的成熟,这一范式迟早会落地到视频上,到时候可能不止是 ChatGPT 这种级别的机会了。

比如我前几天用 NotebookML 和 Heygen 做的这个演示,一篇复杂的论文被转换成二人对谈视频并且有对应内容的配图,理解成本和学习成本是不是低了很多。

两个交互范式的融合

另外 ChatGPT 代表的对话式交互范式也可以模态互转这个范式有融合的趋势。

想象一下:

一个虚拟 AI 角色可以跟你在上班的时候通过文字聊天,做家务的时候通过语音聊天,休息的时候跟你视频聊天,是不是还会给你发一个她录的生活视频,甚至会跟你玩双人游戏,她懂你的所有喜好和过往。

这个未来很远吗,我觉得不是很远了,所有的条件都在成熟。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/174545
 
47 次点击