欢迎围观“AI新榜”的「AI日报」栏目。AIGC前沿资讯,及时拿捏!📚 百度文库AI升级“专业PPT生成”功能
💰 AI内容平台造梦次元完成近亿元人民币融资,多家顶级风投和大厂共同投资
🚀 3个月估值超2亿美金,00后大模型公司再获数千万美金融资
💻 百度文小言电脑版正式发布,支持Windows和Mac免费下载
🍎 ChatGPT全面接入苹果全家桶
🌐 谷歌正式发布Gemini 2.0,专为Agent时代设计
👨💻 全球首个“AI程序员”Devin全面开放,月费500美元
12月12日,百度文库AI推出“专业PPT生成”功能,通过AI技术帮助用户一键生成高质量PPT,只需输入关键词或主题,可快速获得内容明确、主题突出的专业演示文稿。据介绍,该功能采用商务化PPT版式,提供清晰的结构和视觉设计,支持个性化编辑,包括字体、颜色和动画效果,助力职场汇报和晋升。
2. AI内容平台造梦次元完成近亿元人民币融资,多家顶级风投和大厂共同投资深圳想法流科技有限公司已于近日完成数千万人民币的A轮融资,本轮融资由锦秋基金领投,高榕创投、明势创投、商汤科技等多家知名机构和AI大厂参投。
据悉,该公司创立于2023年,定位为专注多模态AI驱动的新一代内容平台,旗下核心产品“造梦次元”为年轻用户提供交互式、剧情化的虚拟角色互动体验,日均活跃互动时间超100分钟。(来源:ZPotentials)
3. 3个月估值超2亿美金,00后大模型公司再获数千万美金融资12月12日消息,Sapient Intelligence再获数千万美金Seed+轮融资,距离上一轮千万级美金融资仅过去不到3个月。本轮投资方包括日本最大的私募股权投资集团JAFCO以及其他知名海外投资机构。Minerva Capital持续担任长期独家财务顾问。
据悉,Sapient创始人是00后清华毕业生王冠,公司致力于开发一个用于解决复杂问题的通用大模型,从而跳过LLM的理论限制,使AI能更快达到L2阶段,即拥有长程推理能力,甚至能像人类一样思考和自我进化。
目前,Sapient已经完成首个新模型架构的预训练,新模型Sapient H已经在复杂约束满足问题、高维离散变量最优化问题以及数学推理问题上进行了测试,从有效性、准确率、参数效率和模型性能上均超过经过深度网络优化的Llama DeepNet 100L模型。
团队方面,Sapient已经完成北京&湾区双研发中心的组建,新加入的技术人才包括清华北大的资深研究员,Deepseek和强化学习之父Richard Sutton团队的核心成员等。(来源:暗涌)
4. 百度文小言电脑版正式发布,支持Windows和Mac免费下载
12月11日,百度旗下AI智能助手文小言正式发布电脑版,支持Windows和macOS系统免费下载。据介绍,文小言电脑版可与手机端App形成双端协同和消息互通,具备自由编辑、文档解析、AI搜索等功能。
产品网址:
wenxiaoyan.com
5. ChatGPT全面接入苹果全家桶
北京时间12月12日凌晨,OpenAI第五场发布会宣布ChatGPT正式登陆iOS生态系统,全面支持iPhone、iPad和Mac。
即日起随着iOS18.2、iPadOS18.2和macOS Sequoia15.2推送给用户,更多的智能服务接入苹果设备,其中包含用于创建自定义表情符号的Genmoji、用于生成图像的ImagePlayground和ImageWand,以及集成到Siri的ChatGPT等服务。
更新至最新系统后,用户可以通过Siri或写作工具直接访问GPT-4o,同时还能完成一键识物、总结和复制文本、跨语言翻译以及提取电话号码等操作。苹果方面表示,明年将推出更多苹果智能的更新,Siri将迎来重大进化,尤其是在跨应用操作方面。
目前,苹果智能暂不支持中国大陆地区,主要面向特定英语地区用户开放。不过值得一提的是,苹果用户无需注册OpenAI账户即可使用ChatGPT集成功能,不过ChatGPTPlus会员仍需付费订阅。隐私方面,OpenAI不会保存隐私记录,也不会使用用户的数据去训练模型。(综合消息)
6. 谷歌正式发布Gemini 2.0,专为Agent时代设计北京时间12月12日凌晨,Google推出Gemini 2.0 Flash模型,据称该模型在关键基准测试中的速度比1.5 Pro快两倍,是谷歌迄今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。
据介绍,Gemini 2.0 Flash不仅支持图像、视频和音频等多模态输入,还支持多模态输出,如与文本混合的原生文生图、可自定义的文本转语音(TTS)多语言音频内容。
此外,它还支持原生调用工具,如Google搜索、代码执行以及第三方用户定义函数等等。基于Gemini 2.0架构,谷歌还宣布了对AI Agent方面实验性功能的更新,包括通用AI Agent Project Astra、多步骤任务AI Agent Project Mariner、AI编程Agent Jules等。
目前,开放人员可通过Google AI Studio和Vertex AI调用Gemini2.0 Flash API,部分高优先级开发者还可使用原生的TTS文本转语音和图像生成功能,而实时多模能力可以通过Multimodal Live API来调用。
Gemini和Gemini Advanced用户则可以在桌面界面的模型下拉列表中选择并尝试聊天优化版本的Gemini 2.0。
谷歌官方博文:
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ceo-message
7. 全球首个“AI程序员”Devin全面开放,月费500美元
12月12日消息,早前凭借全球首个“AI程序员”称号在AI编程领域走红的产品Devin已于近日全面开放,其开发商Cognition Labs宣布,个人开发者和团队可以每月500美元获得Devin的完整访问权限,服务包括Slack集成、IDE扩展以及专业的技术支持。
Devin所具备的技能如下:
快速掌握新技术:只需阅读文档,Devin就能快速掌握不熟悉的工具和框架。
开发端到端应用:构建并部署功能齐全的网络应用程序,根据用户反馈逐步增加功能。
自动化查找Bug:Devin擅长识别、调试和修复代码问题,同时为开源和生产级软件仓库作出贡献。
AI培训:从研究资料库中获取指令,建立并微调大型语言模型。
据介绍,Devin能熟练运用多种编程语言,独立完成网站和应用程序的构建与部署,自主发现并修复代码缺陷。官方表示,其已通过多家AI公司的工程师面试,并成功在Upwork等零工平台上完成实际项目。(来源:IT之家)
产品网址:
https://devin.ai/
(整理:石濑)
![](http://mmbiz.qpic.cn/sz_mmbiz_png/mibHj077gz7AkPH4YknAgTN15icFFQV5DjHibMHHsbJ8ia19dOZ9PRXW6Oj3hpjlyiaeDJgttaVPQYoIPKZ0DgDrMoQ/640?wx_fmt=png&from=appmsg)
![](http://mmbiz.qpic.cn/sz_mmbiz_png/mibHj077gz7DIqTCEjm7bfhgeSAsbv48xicTsrUQGLmwW2WtWhAaHntsRYuf03ZpnLuoDiaib8rjr9JQ3Ix971aTjw/640?wx_fmt=png&from=appmsg)
![](http://mmbiz.qpic.cn/sz_mmbiz_jpg/mibHj077gz7AWicZ2JTEXNXCM18FJ2CxQUF5QY5lTsDVTWS1okbHzEicZ7fmHPCI24U6zbHoWFhvXOhGY6mrUdZfg/640?wx_fmt=jpeg&from=appmsg)
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。