Py学习  »  aigc

阶跃星辰开源图像编辑模型Step1X-Edit;阿里巴巴AI旗舰应用夸克发布全新“AI相机”丨AIGC日报

创业邦 • 2 天前 • 13 次点击  


1.【阶跃星辰开源图像编辑模型Step1X-Edit】4月27日,阶跃星辰宣布开源图像编辑大模型Step1X-Edit,性能达到开源 SOTA。该模型总参数量为19B(7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持11类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。(每经网)


2.【阿里巴巴AI旗舰应用夸克发布全新“AI相机”】阿里巴巴AI旗舰应用夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于AI超级框背后的视觉理解和推理模型能力,全新的夸克AI相机能深入理解用户意图,更好地实现视觉搜索、多轮问答、图像处理与创作。(财联社)


3.【Meta Token-Shuffle登场:自回归模型突破瓶颈,可AI生成 2048×2048 分辨率图像】报道称Meta AI创新推出Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。在语言生成方面,自回归模型大放异彩,近年来也被广泛探索用于图像合成,然而在面对高分辨率图像时,AR模型遭遇瓶颈。不同于文本生成仅需少量token,图像合成中高分辨率图片往往需要数千个token,计算成本随之暴增。这让许多基于 AR 的多模态模型只能处理低中分辨率图像,限制了其在精细图像生成中的应用。尽管扩散模型(Diffusion Models)在高分辨率上表现强劲,但其复杂的采样过程和较慢的推理速度也存在局限。(搜狐)


4.【Adobe发布Firefly Image Model 4模型:AI生图再升级】Adobe发布博文,推出Firefly Image Model 4和Firefly Image Model 4 Ultra两款文本生成图像AI模型,并预告针对Photoshop和Illustrator的Creative Cloud应用更新。Firefly Image Model 4强调速度与操控性,被Adobe称为“迄今最快、最可控、最逼真的图像模型”,最高支持生成2K分辨率的图像,风格、尺寸和相机角度控制更加精准。(IT之家)


更多AIGC资讯……

扫码订阅AIGC产业日报,
精选行业新闻,帮你省时间!👇


此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181575
 
13 次点击