社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

Coatue 重磅报告:具身智能不会有 ChatGPT 时刻

FounderPark • 1 月前 • 140 次点击  


全球顶级对冲基金Coatue近日发布了一篇关于“具身智能”的重磅报告,题为《通往通用机器人之路》( The Path to General-Purpose Robots )

Coatue认为,AI机器人是一股颠覆性的力量,有望成为人类历史上最大的科技浪潮之一,值得高度重视。

这篇报告亮点很多,不仅细致分析了现阶段AI机器人面临的挑战,同时也对行业发展做出了合理展望,从投资的角度给出了专业意见。无论科技投资人、AI从业者、还是对机器人感兴趣的朋友,都值得一读。

下面我给大家解读一下这篇大报告。报告链接在文末,欢迎感兴趣的朋友去看原文。


01 

机器人技术的今天在哪里?

理想很丰满,现实很骨感

机器人行业也许是Demo与现实差距最大的行业之一。

Demo视频中是这样的:

现实则是另一种画风:

1961年,第一台工业机器人诞生于GM,用于汽车生产流水线。

经过50多年的发展,机器人的形态变得越来越多样,功能场景也丰富了起来,有扫地机器人、四足机器人、人型机器人等。

纵观历史,机器人渗透率其实是线性提升的。

以工业机器人为例,每万名制造业员工对应机器人的数量从2013年的53台增长到2022年的151台,CAGR达到12%。

虽然机器人行业整体发展稳中向好,但是具体公司的的表现并不尽如人意。

机器人公司普遍存在商业化困难的问题,加之前期资本开支巨大,22-23年大量机器人公司破产倒闭。

空间智能,让通用机器人成为可能

上一代机器人更多是执行某些单一任务的,比如扫地机器人只负责扫地,农业无人机只负责灌溉农田,工业机器人只负责机械焊接等。

但是随着AI泛化智能的涌现,下一代机器人有望成为“通用机器人”,胜任各式各样的任务与环境。

正如大语言模型让语言推理成为现实,空间大模型有望打破第四面墙,让AI真正理解物理世界,从而与之交互。


02

通用机器人:新时代的曙光

(1)面临的核心挑战:缺乏训练数据

对人类来说很简单的任务,对机器人来说可能并不容易。

Coatue举了三个具体例子。

灵巧性:

空间感知能力:

平衡恢复能力:

为了克服这些问题,需要用海量数据进行训练,使机器人变得更加智能。

但是机器人是一个非常新的领域,严重缺乏训练数据的积累。

对比不同模态下的最大数据集,文本模态约15T tokens,图片模态有6B图文配对数据,视频模态有2.6B视听特征数据。

然而机器人模态只有240万个数据片段,相比其他模态而言,数据积累远远不够。

(2)机器人训练数据的四种采集方式

既然数据是机器人发展的核心瓶颈,那么有什么方法可以快速积累机器人训练数据呢?

近年来,这方面的研究层出不穷,逐渐形成了四种流派。

机器人数据采集方法1:远程操作(Teleoperation)

顾名思义,由实验人员操作机械手柄,远程控制机器人做出相同动作,以此来积累数据。

机器人数据采集方法2:AR

在一项名为《Explainable Human-Robot Training and Cooperation with Augmented Reality》的研究中,研究人员通过AR(增强现实)技术让人机交互过程具备更强的可解释性,从而进行数据积累。

机器人数据采集方法3:仿真

通过海量算力进行模拟运算,计算得出海量机器人训练数据集。

仿真可能是目前最有可能做到规模化数据生成的路径,背后需要巨大的算力支持。

目前Nvidia的Jim Fan团队采取的就是这条技术路径。

机器人数据采集方法4:视频学习

通过多模态大模型,直接让机器人通过视频学习人类动作,从而积累训练数据。

(3)机器人成本与人类工资的黄金交叉

随着GPU成本的下降,大模型训练的成本大幅降低。

过去一年中,Azure云平台上的A100显卡租赁价格从6美金/小时下降到1.5美金/小时,降幅达到75%。

硬件成本同样在快速降低,20年L3 LiDAR传感器的成本在7400美金左右,现在已经腰斩到3200美金。

机器人成本不断下降的同时,人类的薪酬水平却在稳步提升。

可以想见,在不久的将来,二者终将迎来金叉。

Coatue认为26-27年人型机器人的成本就会降低到人类平均薪酬以下,这无疑会对全球劳动力市场造成重大冲击。

(4)硅基生命进化进行时:更快的速度,更高的灵巧性

作为硅基生命的代表,机器人在很多场合的能力表现已经超过了人类。

比如宇树的H1机器人行走速度达到3.3米/秒,而人类平均行走速度只有1.42米/秒。

除了行走速度之外,机器人动作的灵巧性也在快速提升。

马斯克表示,今年新的Optimus机器人将有22个自由度。

随着大量AI机器人公司的涌现,硅基生命的进化速度会越来越快。

(5)类比无人驾驶,L4人型机器人即将到来

在自主性方面,人型机器人与无人驾驶汽车类似,可以分为L1到L5。

无人驾驶汽车从L1到L2花了大约20年,而从L2到现在的L4只用了不到10年。

人型机器人从L1到L2用了大约50年,从L2到L4预计只需要不到5年。


03

机器人不会有“ChatGPT时刻”

大模型发展如火如荼,大家都在期待着机器人领域迎来自己的“ChatGPT时刻”。

纵观过去20年,真正称得上科技领域的“WOW!时刻”的只有三次,分别是07年的iPhone、22年的ChatGPT、以及24年的无人驾驶。

这些“WOW!时刻”有着一些共同特征。

首先,它们都在day 1带来了激动人心的use case,并通过口耳相传形成病毒式传播。

其次,应用成本达到拐点,使得技术能够向市场大众普及,构成正向的商业模型。

第三,开发者社区增长迅猛,围绕核心技术及产品形成商业生态。

Coatue预测,机器人并不会迎来所谓的“ChatGPT时刻”,因为它尚不具备以上几点特征。

相反,Coatue认为机器人的普及,会经历由浅入深的三个阶段,走出一条独特的发展路径。

  • 第一阶段:Seeing,人们通过电影、小说等媒介对机器人形成初步模糊的了解。

  • 第二阶段:Experiencing,指消费者直接享受机器人提供的服务,而非自己拥有机器人,类似B2B2C的模式。比如你在咖啡厅享用一杯机器人拉花的咖啡,就属于这个阶段。

  • 第三阶段:Owning,即每个用户自己拥有一台或多台机器人。

Coatue还预测了人型机器人能力的成长曲线。

对于家庭人型机器人,能力成长路径依次为:扫地 -> 做饭 -> 管家-> 保姆。

对于户外人型机器人,应用场景成长路径依次为:仓库 -> 门店 -> 消防-> 手术。


04

投融资火热,机器人生态渐成

随着奇点的不断逼近,AI机器人公司的投融资越来越火热。

围绕AI机器人,一个完整的生态圈正在形成,包括机器人开发工具、机器人训练数据集、机器人运维、空间大模型、机器人生产制造等。

类似PC时代,AI机器人正在形成Wintel-like以及Walled Garden这两种典型的商业模式。

Neuralink的脑机接口、SpaceX的卫星通信、Tesla的无人驾驶、xAI的大语言模型、Optimus的人型机器人,马斯克的这盘大棋正在逐渐浮出水面,越来越清晰。

作为AI时代极少数拥有机器人全栈能力的公司,Optimus的发展值得期待。

参考资料:

https://www.coatue.com/blog/perspective/robotics-wont-have-a-chatgpt-moment



更多阅读

SaaS 出海为何首选美国?万字探讨背后的共识与非共识
具身智能万字研究:通用机器人领域的关键问题、重要公司全梳理
HeyGen 创始人万字访谈:没有自研大模型,AI 视频公司如何做到 3500 万年收入?
过去三个月 AI 融资盘点:各投各的,该卖的卖了
三万字深度对谈:为何 OpenAI 做不出革命性交互的产品?AI 是新的科技泡沫吗?

转载原创文章请添加微信:founderparker

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172424
 
140 次点击