北大-兔展AIGC联合实验室发起的开源Sora计划,以下是项目介绍:
在2024年2月, OpenAI最近推出了Sora, 这是一个开创性的文本到视频模型, 代表了视频生成技术的一个重大飞跃。Sora能够将简短的文本描述转换成详细的、高清的视频片段, 这些片段最长可达一分钟。所提出的Sora推进了AI技术, 并在视频制作中提供了新的创造潜能。
今天, 我们非常兴奋地推出我们的Open Sora项目, 旨在复制OpenAI的视频生成模型。下面, 我们将介绍我们的框架, 它由以下组成部分组成。
1. Video VQ-VAE.
2. Denoising Diffusion Transformer.
3. Condition Encoder.
项目地址:网页链接
在2024年2月, OpenAI最近推出了Sora, 这是一个开创性的文本到视频模型, 代表了视频生成技术的一个重大飞跃。Sora能够将简短的文本描述转换成详细的、高清的视频片段, 这些片段最长可达一分钟。所提出的Sora推进了AI技术, 并在视频制作中提供了新的创造潜能。
今天, 我们非常兴奋地推出我们的Open Sora项目, 旨在复制OpenAI的视频生成模型。下面, 我们将介绍我们的框架, 它由以下组成部分组成。
1. Video VQ-VAE.
2. Denoising Diffusion Transformer.
3. Condition Encoder.
项目地址:网页链接