2020年,Open AI发布GPT-3,我们初步预测生成式预训练语言模型是未来的方向;
2021年4月底,Open AI发布DALL-E模型之后,文生图的模型更加趋向成熟,整个科研界都觉得这个路子是对的,它创建了CLIP+Diffusion的技术范式,接下来Stable Diffusion、Midjourney都顺着这个技术路径走,它比过去GAN、VAE“文生图”模型更容易泛化,所以从2021年下半年开始,我们非常关注文生图大模型范式;
2021年其实还涌现出很多其它多模态相关的AI技术,除了文生图的CLIP+Diffusion,还有谷歌发布的NeRF,这是一种基于神经场的渲染技术,可以用来生成视频流或者重构成3D Mesh。谷歌也利用NeRF技术重构了旧金山市。