AI日报：通义千问Qwen3重磅发布；抖音AI搜索能力开放；ChatGPT 搜索新增网购功能；Suno V4.5版本将发布

AI日报

4月29日•AIbase

1、通义千问Qwen3发布：推理能力显著增强

2、抖音AI搜索能力开放可为第三方应用提供更丰富内容

3、ChatGPT 搜索新增网购功能，对话获得个性化商品推荐

4、Suno AI即将推出V4.5版本:音乐生成技术再升级

5、Simular AI登陆macOS，本地智能助手革新人机协作体验

6、暗月之面发布开源模型 Kimi-VL， 28 亿个参数即可处理文本、图像和视频

7、大幅提升 AI 推理速度：UCLA 与 Meta AI 联合推出 d1 框架

8、通义灵码上线Qwen3：编程智能体即将上线集成魔搭MCP广场

9、光影魔术手！Gen-4 References 惊艳亮相，AI 实时混合图像，精准拿捏光影氛围！

10、Hugging Face 推出全新 SO-101机械臂:低价高效、可编程 AI 助手

11、Windsurf 推出全新品牌标志与功能，AI编码工具进一步优化

12、Ollama 支持全线的 Qwen 3 模型，本地部署Qwen 3 更便捷

1. 通义千问Qwen3发布：推理能力显著增强

通义千问团队推出了Qwen3，Qwen3在多个基准测试中表现出色，尤其在代码、数学和通用能力方面，展现了与顶级模型的竞争力。该模型支持两种思考模式，能够灵活应对复杂和简单问题，并且开源了多个模型的权重，旨在推动大型基础模型的研究与开发。

亮点提要：

🧩 Qwen3系列模型在代码、数学和通用能力等基准测试中表现优异，展现出与顶级模型的竞争力。

🔍 Qwen3支持思考模式和非思考模式，用户可根据任务需求控制模型的推理程度，提升效率。

🌍 Qwen3开源多个模型并支持119种语言，为国际应用提供了新的可能性，推动大型基础模型的研究与开发。

详情入口：

🔗 https://huggingface.co/Qwen/Qwen3-235B-A22B

2. 抖音AI搜索能力开放可为第三方应用提供更丰富内容

抖音平台最近开放了其搜索能力接口，允许第三方应用接入其内容搜索服务。这项服务旨在通过抖音的丰富内容资源，提升其他应用的搜索和问答功能，从而优化用户体验。

亮点提要：

📹 接入抖音搜索能力后，第三方应用可以获取生活、教育、娱乐等多个领域的优质内容，包括视频和图文。

📝 用户输入搜索词后，系统将返回相关的抖音经验内容，具有较高的时效性和可信度。

🤖 目前该服务主要面向AI智能体和内容工具等应用，提升信息获取效率，提供更丰富的搜索结果。

3. ChatGPT 搜索新增网购功能，对话获得个性化商品推荐

OpenAI 最近对其 ChatGPT Search 进行了重要的功能升级，新增了网购功能，旨在为用户提供更便捷的购物体验。用户可以通过自然对话与 ChatGPT 互动，获取个性化商品推荐，并实现一站式购物体验。

亮点提要：

🛒 OpenAI 为 ChatGPT Search 新增购物功能，正式进军电商领域。

🤖 用户可通过自然对话获得个性化商品推荐，并实现一站式购物体验。

📈 系统能够记忆用户偏好，确保推荐的中立性，未来将扩展更多商品类别。

4. Suno AI即将推出V4.5版本:音乐生成技术再升级

Suno AI即将推出其V4.5版本，这一升级引发了音乐创作者和科技爱好者的广泛关注。新版本将提供更精细的音乐控制和音质提升，特别在人声和乐器音色的真实度上有所改善。

亮点提要：

🎤 V4.5版本将提供更强大的音乐生成控制功能，优化音质表现，特别是在音色真实度上。

🎼 新版本可能引入更灵活的生成选项，降低创作门槛，使无音乐背景的用户也能创作高品质音乐。

🚀 Suno在AI音乐生成领域的竞争中，V4.5的推出被视为对市场反馈的积极回应，旨在缩小与竞争对手的音质差距。

5. Simular AI登陆macOS，本地智能助手革新人机协作体验

Simular AI的推出标志着本地化智能助手的新时代，强调人机协作与隐私保护。作为首个在用户本地设备上运行的AI浏览器智能体，Simular通过理解屏幕内容和自动化网页操作，极大提升了用户的工作效率。

亮点提要：

🌐 本地化处理：Simular AI在Mac上本地运行，无需上传数据，确保隐私安全。

🤖 自动化网页操作：支持自动浏览、搜索、填写表单等，适合重复性任务。

👥 人机协作模式：用户可随时介入AI操作，实现高效的并行协作。

详情入口：

🔗 https://www.simular.ai/

6. 暗月之面发布开源模型 Kimi-VL， 28 亿个参数即可处理文本、图像和视频

Moonshot AI 最近推出的 Kimi-VL 模型，凭借其高效的性能和处理长文档、复杂推理的能力，成为多模态 AI 领域的亮点。该模型仅有2.8亿个活跃参数，却在多个基准测试中表现出色，超越了许多大型模型。

亮点提要：

🌟 Kimi-VL 是 Moonshot AI 发布的开源多模态 AI 模型，处理图像、文本和视频表现优异。

📈 该模型以2.8亿个活跃参数在多项基准测试中超越许多大型模型，显示出高效的性能。

🤖 Kimi-VL 支持长文档处理和复杂推理，能解读用户界面并自动化数字任务。

7. 大幅提升 AI 推理速度：UCLA 与 Meta AI 联合推出 d1 框架

UCLA与Meta AI研究人员推出的d1框架通过强化学习显著提升了扩散式大语言模型（dLLMs）的推理能力。该框架结合监督微调和新算法diffu-GRPO，优化了模型的学习效果，尤其在生成长响应时展现出自我修正能力。

亮点提要：

🌟 d1框架结合强化学习技术，显著提升扩散式大语言模型的推理能力。

⚡ dLLMs 采用遮蔽生成方法，能更高效地处理上下文信息，降低延迟。

🚀 d1在多项推理基准测试中表现优异，展现出自我修正能力，适用于企业各种数字工作流程。

详情入口：

🔗 https://arxiv.org/abs/2504.12216

8. 通义灵码上线Qwen3：编程智能体即将上线集成魔搭MCP广场

通义灵码团队推出了Qwen3，标志着编程智能体的重大进展。此次开源的混合推理模型包括多款MoE和Dense模型，展现出卓越的性能，尤其是旗舰模型Qwen3-235B-A22B在多个基准测试中表现突出。开发者可以在主流IDE中体验Qwen3的强大功能，支持灵活的思考模式，并具备多语言能力，推动全球应用。

亮点提要：

🛠️ Qwen3团队开源了8款混合推理模型，包括两款MoE和六款Dense模型，展示了强大的技术能力。

🌍 Qwen3支持119种语言和方言，促进全球开发者的应用，提升编程效率。

📈 在Agent能力评测中，Qwen3创下70.8的新高，超越了顶尖模型，降低了开发者的编码复杂度。

详情入口：

🔗 https://lingma.aliyun.com/download

9. 光影魔术手！Gen-4 References 惊艳亮相，AI 实时混合图像，精准拿捏光影氛围！

Gen-4References是一项新兴的图像生成技术，凭借其卓越的实时图像混合能力和光影一致性，迅速成为AI创作领域的焦点。该技术通过融合两张参考图像，能够根据用户的描述生成高质量的新图像，展现出在艺术创作和商业设计中的巨大潜力。

亮点提要：

🎨 实时图像混合：基于两张参考图像生成新图像，构图生成仅需数秒，支持自然语言描述。

🌟 光影环境保留：精准捕捉光影特征，确保生成图像与环境风格一致，视觉效果自然。

🚀 高分辨率输出：支持2K至4K分辨率，适合专业设计与艺术创作，细节清晰。

10. Hugging Face 推出全新 SO-101机械臂:低价高效、可编程 AI 助手

Hugging Face 最新推出的 SO-101 机械臂在前代产品的基础上进行了多项升级，特别是在机械性能和操作速度上有显著提升。该产品结合了强化学习 AI 技术，能够学习执行各种任务，提升用户体验。售价在100至500美元之间，具体取决于供应商，展示了 Hugging Face 在机器人领域的技术积累及全球扩展的雄心。