夕小瑶科技说 原创
作者 | 付奶茶
就在昨天,Karpathy在X上连续发布了多条安利帖,强烈地给大家推荐一个AI产品NotebookLM。
嘶~给周围人疯狂种草并不稀奇,但Karpathy的推荐理由给NotebookLM戴了一个高帽子-他提到这款产品让人联想到ChatGPT。
这种就令人好奇,究竟NotebookLM有何特别之处,能与GPT相媲美呢?
产品介绍
在去年,Google就发布了NotebookLM的早期产品Project Tailwind,可以将
PDF、Word等复杂文档转为简洁的摘要以及可以和人类互动讨论的AI模型。
这个产品在学术界、工业界的使用范围还蛮广,奶茶看到了很多网友的好评~让人们无需花费大量时间阅读长篇文献,便可快速提炼出关键信息。
随着Project Tailwind项目的进一步升级,NotebookLM平台问世了~
NotebookLM进行了重大更新,现在开始支持多种多样的内容类型。该平台重新定义了与LLM(大语言模型)的交互方式,用户现在可以轻松上传多种格式的资料,包括YouTube链接、音频文件、PDF文档、Google Docs、幻灯片以及网页等,并将这些内容直接集成到笔记本中。
用户可以通过查询功能引用这些资料,并查看相关的结果和引用信息。平台支持用户上传文本、音频或视频数据,系统将对这些内容进行深入分析和概括,进而生成精准的文本摘要。此外,用户还可以针对AI生成的内容提出问题,以获得更多详细信息。
NotebookLM最新推出的功能允许用户将上传的文件转换成双人对话形式的播客,使用户能够直接聆听内容的总结,还可以将生成的播客分享给他人,增强信息的传播和交流。
Karpathy提到了自己的文章“从零开始学习比特币”以及使用 train_gpt2.c 的 C 代码已经被用作生成播客,据说效果很不错~印象令人深刻:
NotebookLM可以将多模态内容进行拆解、总结和整合,从而直观、便捷地理解并转化为可直接提供给用户的解答或需求形式。它甚至能够将同一份内容整理成播客的形式,主动传播知识,避免用户提问。同一份内容可以被转化为图文、单口播客、对谈播客或视频等多种形式。体验上,NotebookLM生成的对谈播客声音自然流畅,富有感情,完全没有机器人的感觉。
大家可以去体验下~ 奶茶给大家准备了链接:
产品地址:
https://notebooklm.google
为什么被称为ChatGPT一样的机会?
从上文中,大家应该也大概知道这个产品到底是做什么,那为什么会得到这么高的赞誉呢?
首先,我们看看Karpathy是怎么说的~
我认为 LLM 能力(智商,还有记忆能力即上下文长度、多模态能力等等等)远远领先于将目前打包到现有产品中的UIUX展现的部分(UIUX 是指用户界面User Interface和用户体验User Experience的缩写)。Think Code Interpreter、Claude Artifacts、Cursor/Replit、NotebookLM等等。
我期望有更多不同的交互模式,而不仅仅是聊天。这才是播客模式作为UIUX探索的最终吸引力所在。
而现在探索的播客的模式消除了LLM的两个主要“享受障碍”:
1.聊天很难,你不知道该说什么或问什么。在播客模式中,提问也委托给了人工智能,因此你会获得更加轻松的体验,而不是在生成过程中成为同步约束。
2.阅读很难,靠在椅背上听要容易得多。
是的是的!奶茶认为Karpathy之所以认为NotebookLM具有像ChatGPT那样的里程碑意义,最核心的原因在于它试图解决的是AI在与人交互使用障碍,让AI能够以更加自然、易用和解放人类的方式为我们服务。
随着人工智能技术的不断进步和能力的提升,与LLM的交互体验已经变得更加自然、智能和高效。
这种交互不仅要求对语言和意图有更深入的理解,包括对语境、情感和隐含意义的精准把握,还需要拓展到多模态交互,支持声音、图像乃至视频等多种输入和输出方式。这些要求涉及到实时性、情感适应性以及高度的拟人化表现。
而LLM底层技术的逐渐同质化,各家产品在语言处理能力上的差距将会逐渐缩小。
在这种情况下,产品设计和用户体验将成为关键的竞争力,who能够提供更加人性化、智能化的交互方式的产品,who就能够在市场中脱颖而出!
本文提到的NotebookLM正是一个广泛受到行业认可的优秀例证~如果大家有更多的想法或见解,欢迎在评论区分享和讨论,没准你会遇到志同道合的朋友捏!
参考资料
https://x.com/imxiaohu/status/1840295200830226477