夕小瑶科技说 原创
作者 | TscomLlama与ChatGPT,谁是23年AI模型最大的赢家?
相对于今年爆🔥的ChatGPT,在短时间内吸引了1亿用户的生成式AI模型 Llama和开源AI的崛起能否超越ChatGPT,成为AI领域的主导力量?
本文编译自VentureBeat(作者Sharon Goldman),将对此进行论述。
Llama和开源AI的崛起
Llama是Meta公司于2023年2月发布的大语言模型,随后在7月份推出了商业化的Llama 2,以及8月份的Code Llama。尽管ChatGPT在2022年11月30日发布后,仅用两个月就吸引了1亿用户,将生成式AI推向世界,但Goldman认为,Llama和开源AI的崛起将产生更深远的影响。
Forrester的分析师Rowan Curran表示,ChatGPT无疑是一款具有革命性的生成式AI,它引发了生成式AI的热潮。然而,当Meta发布了Llama,这个第一个重要的免费“开源”大语言模型时,开源AI开始迎来了一个新的时刻。尽管对于开源AI模型的安全性和保密性,以及高昂的计算成本,各方都有所质疑,但这并没有阻止开源AI的发展。
据Meta公司透露,自Llama发布以来,开源AI社区在Hugging Face平台上对其进行了精细调整,并发布了7000多个衍生模型,包括Koala、Vicuna、Alpaca、Dolly和RedPajama等一系列受欢迎的Llama后代。此外,还有许多其他开源模型,如Mistral、Hugging Face和Falcon,但Llama是第一个得到大型科技公司Meta的数据和资源支持的模型。
Domino Data Lab的数据科学战略和传播部门负责人Kjell Carlsson认为,Llama及其开源AI同伴的崛起,将导致“更多真实世界的、有影响力的生成式AI应用,并巩固生成式AI应用的开源基础”。
然而,OpenAI的联合创始人兼首席科学家Ilya Sutskever在2023年表示,Meta分享他们的研究是一个错误,他提到了竞争和安全方面的考虑。相比之下,Meta的首席人工智能科学家Yann LeCun坚持要求以商业许可证发布Llama 2,并附带模型权重,他认为大语言模型将成为每个人都会使用的基础设施,它必须是开放的。
Otherside AI的首席执行官Matt Shumer指出,如果没有ChatGPT的先行,Llama可能不会获得它所拥有的接受度和影响力。但他同意Llama的影响将持续多年:“在过去的一年左右,可能有数百家公司得以启动,而这些公司如果没有Llama和随之而来的一切,是不可能存在的。”
可以看出,尽管ChatGPT在短期内取得了显著的成功,但Llama和开源人工智能的崛起预示着AI领域的新篇章。这种转变可能会带来更多的创新,推动AI技术的广泛应用,并对社会产生深远的影响。
Meta对开源AI的支持和影响
前Neeva首席执行官Sridhar Ramaswamy,现任数据云公司Snowflake的高级副总裁,曾对Meta公司的开源人工智能模型Llama 2 给予高度评价。他认为,Llama 2是第一个真正有能力的开源AI模型,它改变了行业的游戏规则。
Llama模型的开源及其影响
今年二月份,Meta公司发布的第一个Llama模型因其参数规模的多样性(参数范围从70亿到650亿不等)而引人注目。据开发者报告,130亿参数的Llama模型在大多数自然语言处理基准测试中的表现超过了参数规模更大的GPT-3(拥有1750亿参数),而参数最大的模型则与PaLM和Chinchilla等最先进的模型相媲美。Meta公司根据具体情况向学术界和研究人员提供Llama模型权重,包括斯坦福大学用于其Alpaca项目。
但由于Llama的权重在4chan上泄露,使全球的开发者首次完全访问到了GPT级别的大语言模型,从而引发了一系列新的衍生品。随后在七月,Meta免费向公司发布了Llama 2,并可以用于商业用途,并且微软也将Llama 2提供给自己的Azure云计算服务。
这些发展正值美国国会开始讨论对人工智能进行监管的关键时刻。在六月份,两位美国参议员给Meta首席执行官马克·扎克伯格发送了一封信,质疑了Llama泄露事件,并表示他们担心其在垃圾邮件、欺诈、恶意软件、隐私侵犯、骚扰和其他不当行为和伤害方面的潜在滥用问题。
尽管如此,Meta始终坚定地致力于开源人工智能。在6月份的一次内部全员会议上,扎克伯格表示,Meta正在将生成式AI应用于其所有产品,并重申公司对“基于开放科学的方法”进行AI研究的承诺。
Meta公司对开放研究的倡导
相较于其他大型科技公司,Meta一直是开放研究的倡导者,特别是在PyTorch框架周围创建了一个开源生态系统。随着2023年即将结束,Meta将庆祝FAIR(基础人工智能研究)成立十周年,该研究旨在通过开放研究推动人工智能的最新发展,造福于所有人。
在Meta位于纽约办公室的面对面采访中,Meta的AI研究副总裁Joelle Pineau回忆起她于2017年加入Meta的原因是因为FAIR对开放研究和透明度的承诺。但是,她补充说,进行开放式研究的原因已经改变了。在过去一年中,开放研究对整个生态系统的生产力产生了巨大影响,催生了许多初创企业。
但是,她也强调,每个Meta发布都是一次性的,不承诺发布的所有内容永久开放,每个发布都会根据优势和风险分析后确定。
Llama模型的反思与展望
曾参与原始Llama项目的Meta 研究科学家Angela Fan表示,她也参与了Llama 2项目,并努力将这些模型转化为Meta在上个月的Connect开发者大会上展示的面向用户的产品能力。
她认为,尽管技术仍然处于初级阶段,但我们已经达到了一个可以构建一些非常有趣的产品的阶段。她补充说,公司寻求来自开发者社区以及使用Llama进行各种不同应用的初创企业生态系统的反馈意见。
她认为,Llama的成功秘诀在于:在较长的时间内,把一些小事情做得非常好、非常正确。这包括正确获取原始数据集,确定参数数量,并在正确的学习速率计划上进行预训练。她强调,这只是很多辛勤工作的结果,而非只是“一个疯狂的科学家坐在某个地方”。
由此,Meta公司对开源人工智能的支持和影响是显而易见的。通过开源研究和开放科学的承诺,Meta公司推动了人工智能的发展,同时也催生了一系列新的衍生品和初创企业。尽管面临着监管压力和技术挑战,Meta公司仍然坚定地致力于开源人工智能的发展,展现出其对人工智能未来的坚定信念。
Llama与ChatGPT的纷争和未来
开源人工智能的推动与保护
开源生态系统的广泛应用和实用技术一直是业界共识。Together的联合创始人Vipul Ved Prakash持有这样的观点。Together是一家知名初创公司,以创建RedPajama数据集而闻名,该数据集是对Llama数据集的复制。同时,Together还发布了一个全栈平台和云服务,以便开发人员构建开源人工智能,包括在Llama 2的基础上进行构建。
Prakash坚信,Llama和开源人工智能将在2023年成为改变游戏规则的因素。他解释说,这是关于开发可行、高质量模型的故事,许多公司和组织正在其基础上进行建设。他指出,"在这个网络中,成本分散,当你进行微调或推理时,你不必承担模型构建的成本。"
但目前,开源人工智能的支持者认为,随着监管机构的介入,有必要推动保护对这些LLM的访问。在英国安全峰会上,主题是减轻先进人工智能系统落入恶意行为者手中对人类造成的风险,而这些行为者很可能拥有开源人工智能的访问权限。
然而,由LeCun和Google Brain联合创始人吴恩达领导的开源人工智能社区的一群发言人在Mozilla发布的一份声明中表示,开放式人工智能是“一种解药,而不是毒药”。
Andreessen Horowitz的合伙人Sriram Krishnan也在推特上支持Llama和开源人工智能。他强调了对于LeCun和他的团队来说,让Llama 2顺利推出是多么重要,他们可能以后再也没有合法的机会了,我们也永远无法看到开源的潜力,并且认为LLMs是这些公司与生俱来的权利。
Llama vs. ChatGPT:持续的辩论
关于Llama与ChatGPT的辩论,以及开源与闭源的辩论,无疑将会继续。在询问各种专家的意见时,ChatGPT赢得了胜利。
RelationalAI的机器学习研究副总裁Nikolaos Vasiloglou认为,"毫无疑问是ChatGPT。"他解释说,ChatGPT改变游戏规则的原因不仅在于其人工智能能力,还在于其背后的工程技术以及无与伦比的运行成本。
TravelAI的首席执行官 John Lyotier 也认为,"毫无疑问,ChatGPT是明显的赢家。它已经成为公众心目中的人工智能。那些从未认为自己是技术专家的人突然开始使用它,并通过ChatGPT向他们的朋友和家人介绍人工智能。它已经成为‘普通人的人工智能’。"
然而,Atlas的首席执行官Ben James指出,Llama重新点燃了研究的热情,而ChatGPT没有,这将带来更强大、更长期的影响。"ChatGPT确实是2023年的游戏规则改变者,但Llama将成为未来的游戏规则改变者。"他说。
最后,也许我们可以得出这样的结论,Llama和开源人工智能在2023年赢得胜利,是因为它将对2024年及以后产生影响。Forrester的Curran也持有类似观点,他认为,如果没有像ChatGPT这样的东西,2023年创造的时代精神,生成人工智能是不可能发生的。他补充说,开源模型,尤其是像Llama 2这样得到企业开发者广泛采用的模型,为该领域的实地开发和进步提供了大量持续的动力。
从长远来看,Curran认为,专有模型和开源模型都会有自己的位置,但如果没有开源社区,生成式人工智能领域将会是一个进展较少、非常小众的市场,而不是一个具有潜力的,在工作和生活的许多方面都产生巨大影响的技术。他强调,“开源社区一直是,并将继续是许多重大长期影响产生的地方,开源社区对于生成式人工智能的成功至关重要。”



参考资料
[1]https://venturebeat.com/ai/forget-chatgpt-why-llama-and-open-source-ai-win-2023/