快300-2500倍,高效、个性化和高质量多主体图像生成模型
扩散模型在文生图方面表现出色,但仍然存在因微调而效率低下、因计算密集而难以部署等问题,而且常常在多主体生成方面表现不佳。
该研究提出了FastComposer,它能实现高效、个性化、多主题的文本-图像生成,而无需进行微调。实验表明,其可以生成具有不同风格、动作和背景的多个未见过的人物图像,比如爱因斯坦和牛顿坐在一起、同被誉为“深度学习三巨头”之一的 Yoshua Bengio 和 Geoffrey Hinton 在海滩等。
与基于微调的方法相比,FastComposer的速度提高了300-2500倍,为高效、个性化和高质量的多主体图像生成打下了坚实的基础。