编辑部 发自 凹非寺
量子位 | 公众号 QbitAI
身处全球科技创新中心的硅谷,AI产业生态已经进化到什么程度?投资者们的钱,又砸向何处?
硅谷知名投资人、技术VC Fusion Fund创始人张璐,在中国AIGC产业峰会上给出了这些关键判断:
现阶段,初创企业基本上都可以做“鸡尾酒”模式,即调动最前沿大模型的API,在上面配套使用开源模型,再自己做些修改进行模型调优。
在硅谷,模型的市场已经比较相对明确,主要有三类,我个人非常看好开源平台。
人工智能是超级工具,我们的机遇可能比互联网时代大10倍,但只有1/3的机会留给初创企业。
张璐毕业于斯坦福大学,现管理近4亿美元资本,专注医疗,AI和深科技领域投资。
为了完整体现张璐的思考,在不改变原意的基础上,量子位联合大模型对演讲内容进行了编辑整理,希望能给你带来更多启发。
中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。
话题要点
人工智能是高效的超级工具,代表着全产业数字化转型的趋势,即Digital Transformation。
基础设施层面,我们需要解决人工智能面临的几大挑战:算力成本高、耗电量大、数据隐私问题和延迟问题。
在硅谷,人工智能的主题是赋能而非破坏或变革。赋能就意味着不仅是初创企业,大科技公司也能被赋能。对于初创企业来说,找到合适的切入点至关重要。
初创企业都可以采用鸡尾酒模式,调用大平台的API,结合自己的开源模型进行优化,构建行业专属模型。
今年与去年相比,对人工智能的期待变得更加现实。去年关注的是模型和算法的表现,今年则关注大规模产业应用和成本控制。
应用机会方面,医疗、金融保险和机器人是迭代速度较快的领域。
基础设施是关键,因为它决定了人工智能应用的成本。而且大规模的应用成本是商业考量的第一要义。
在硅谷,AI的主题在于赋能而非破坏或变革
大家好,我是张璐。提到今天的主题——人工智能,虽然在硅谷已非新话题,自2016、2017年以来,它已成为base work。但是后面逐渐有新的主题被提出,到了2022、2023年,生成式AI不仅在科技圈,更在全产业掀起了对人工智能的广泛关注。
我一直强调,人工智能是工具,代表着全产业数字化转型的趋势,即Digital Transformation。我也早在几年前就提出,这次人工智能是高效的超级工具,能够推动全产业的数字化转型。不仅科技行业广泛应用人工智能,其他产业也涌现出大量高质量数据,为人工智能提供了展示其能力的舞台。
我经常强调,除了技术,我们还应关注数据。
数据在哪里?为什么人工智能一直存在,现在却能被应用?
因为许多产业在十年前虽有人工智能,却缺乏高质量数据来训练模型。而近两年产业自动化推动下,各产业都产生了大量高质量数据,成为人工智能应用和发展的基石。
大家可以看到,人工智能是超级工具,我们的机遇可能比互联网时代大10倍,但只有1/3的机会留给初创企业。
特别是在硅谷,人工智能的主题是赋能而非破坏或变革。
赋能就意味着不仅是初创企业,大科技公司也能被赋能。
在硅谷,To C端应用场景的特点是,大量高质量用户数据掌握在大科技公司手中。因此,初创企业和公司在应用层面上,需要清楚地认识到创新机会在哪里,哪些应用场景和产业能获得大量高质量数据。同时,大科技公司,尤其是硅谷的公司,都在构建自己的生态平台,如英伟达、Meta、微软等,他们多年前就开始搭建生态,希望助力初创企业发展。
因此,作为创业者和创新者,找到合适的切入点至关重要。
硅谷的模型市场已相对明确
在未来模型投资和模型的种类,在硅谷,模型的市场已经比较相对明确,分为三类:
一类是以OpenAI和Anthropic为代表的,背后有大型云服务公司支持,这些公司同时将模型作为服务和产品提供给第三方;
第二类如苹果、Salesforce、NVIDIA等,他们的语言模型非常出色,但初衷是支持自身产品迭代升级,不会作为第三方产品;
第三类是开源平台,我个人非常看好,我们也在该领域布局了多家公司。
硅谷的开源生态正在蓬勃发展,Meta作为领军企业,其LLama 2模型已助力许多企业快速发展。
未来几个月,我们可能会看到LLama 3的发布,以及Mistral在开源方面的贡献。
还有一些小型开源模型,如我们最近投资的一家公司——NEXA AI发布的一个在边缘端运行的小模型,最小的可能是10亿到20亿个token。这些开源模型的快速发展,为初创企业和大企业提供了另一种选择,也能更高效地优化能耗和基础设施成本。
初创企业可以采用鸡尾酒模式
我们的人工智能投资分为两个维度:应用端和AI基础设施端。
应用层面相对明确,每个行业都有不同应用场景,但在基础设施层面,我们需要解决人工智能面临的几大挑战:
算力成本高、耗电量大、数据隐私问题和延迟问题。
基础设施层不是单层解决方案,而是一个生态投资,从硬件到软件,从云端到数据端,都需要布局,以更好地推动AI生态发展。
在硅谷,人工智能应用发展方向主要集中在To B领域,我们不投资To C公司。
我一直强调数据的重要性,如何利用海量高质量数据优化模型,使人工智能解决方案更实际、更商业化。
目前,初创企业可以采用鸡尾酒模式,调用大平台的API,结合自己的开源模型进行优化,构建行业专属模型。
在这个过程中,我们发现两个特点:
一是数据质量比数量更重要,高质量数据可以以更低的成本和更快的速度进行模型优化;
二是我们不需要一个模型解决所有问题,在特定应用场景和产业中,训练行业专属的小模型,在表现上可以与通用大模型相匹敌,甚至在成本、效率和反应速度上更快。
三大应用领域迭代速度较快
在应用机会方面,医疗、金融保险和机器人是迭代速度较快的领域——
医疗领域在美国市场规模巨大,占GDP的20%。金融保险行业数据质量高,规则化,应用场景多样。机器人不仅是人形机器人,还包括各种自动化和机械手臂,它们是新型的数据接口。
太空数据和太空科技也是一个重要领域,太空数据现在既有高质量又有高数量,价值可观。
我们经常讨论的潜在趋势就是整个科技行业的监管,而监管的核心就是监管数据,这几个行业有一个极大的特点:它们本身是高监管行业,对监管的适应更简单。
另外一个很大的机会在于AI Infrastructure,也是我们必须要解决的问题。
尽管人工智能发展前景巨大,但挑战也会阻止我们进行大规模布局。我们不仅要追求更好的算法和模型,还要关注成本,尤其是生成式AI的成本。GPU成本高,算力和能量成本也很高。我们可能没有足够的能量支持大规模生成式AI应用,这也是追求小模型的另一个原因。此外,还有延迟问题,如何通过边缘计算技术解决,以及数据隐私和安全问题。
在计算能力方面,GPU和各种芯片设计是讨论的热点。从软件到硬件,大家都在探索新的架构和设计。
我在斯坦福学习材料科学与工程,也进行了新型材料的研发。现在的机会分为两派:
边缘计算也是一个潜在技术,可以解决能耗和延迟问题。
我们从2018年开始投入边缘计算,发布了行业报告,从芯片到serverless edge,再到云端边缘解决方案,帮助在人工智能时代进行边缘端应用。
边缘解决方案有多种切入点,如NEXA AI的开源模型Octopus V3,是一个在边缘上运行的生成式AI语言模型,有助于拓宽AI快速发展的方向。此外,边缘计算在开源层面上的灵活度也是一个优势。
数据隐私问题包括模型安全、Cloud Network安全和数据隐私。从芯片层进行模型安全保护,网络安全解决方案,以及联邦学习和数据加密等都是创新机会。
总之,今年与去年相比,对人工智能的期待变得更加现实。去年关注的是模型和算法的表现,今年则关注大规模产业应用和成本控制。
所以这里面我列了几个分享的内容:
第一,作为初创企业,要清楚竞争和合作的市场前景,找到好的生态平台支持成长。
第二找到合适的应用场景非常关键。回顾之前提到的,硅谷的C端市场有80%到90%的机会被大公司所主导,整体而言,在人工智能的创新领域,大约70%的优势机会同样掌握在大公司手中。然而,即便如此,剩下的30%机会相比互联网时代仍有十倍到二十倍的增长,这依然代表着一个巨大的市场潜力。
怎么找到合适的应用切入点非常关键,数据是核心,怎么让数据成为竞争优势更关键。
第三个数据质量和多样性也很关键。尤其是现在模型可以越做越小,可以进行各种各样的针对特定任务去打造小模型,数据的质量比数据量更重要,定义数据质量的时候,还有数据多样性也很关键。
最后一点,基础设施是关键,因为它决定了人工智能应用的成本,而大规模的应用成本是商业考量的第一要义。
但好处是我们才刚刚开始。无论模型还是基础设施的挑战,都是机会。
现在身处硅谷,我经常跟我的合伙人开玩笑讲,就像每天有一个小的惊喜的糖果等待着我们,也很高兴能在硅谷这个创新前沿与优秀的企业家合作,希望通过分享促进更多交流,期待未来在硅谷见到更多国内外企业家。
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~