- 突然!OpenAI高层人事地震:首席技术官宣布离职
- ChatGPT高级语音助手正式上线:50多种语言、9种声线可选
- 谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
- 微软将在墨西哥投资13亿美元开发云计算和人工智能技术
突然!OpenAI高层人事地震:首席技术官宣布离职
9月26日消息,OpenAI高层人事迎来大地震,OpenAI首席技术官(CTO)米拉·穆拉蒂发长文宣布离职,将离开这家工作了六年半的公司。穆拉蒂表示,经过深思熟虑,我做出了离开OpenAI的艰难决定,离开是为了有时间和空间进行自己的探索,目前她首要任务是努力确保平稳过渡。对于穆拉蒂的离职,OpenAI CEO阿尔特曼感谢她所做的一切,OpenAI将很快会详细介绍过渡计划。穆拉蒂是OpenAI核心人物,在阿尔特曼去年11月被短暂罢免后,穆拉蒂曾担任临时CEO。值得注意的是,有媒体报道,称穆拉蒂可能是这场宫斗大戏的“始作俑者”,她曾在去年10月向董事会成员表达了对阿尔特曼管理的担忧。穆拉蒂的离职,已经是今年从OpenAI离职的第11位高管。其中包括今年5月OpenAI联合创始人Ilya Sutskever和前安全负责人Jan Leike宣布离职,联合创始人John Schulman上个月离职并加入OpenAI的竞争对手Anthropic。此外,OpenAI总裁格雷格·布罗克曼 (Greg Brockman) 也已休假。据路透社报道,OpenAI计划重组,将取消非营利性董事会的控制权,CEO萨姆·阿尔特曼(Sam Altman)还将首次获得OpenAI股权。(快科技)9 月 25 日,百度创始人李彦宏在为“文心杯”创业大赛第二季颁奖致辞时指出,智能体是他最看好的 AI 原生应用发展方向,相当于 PC 时代的网站和自媒体时代的账号。李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用。未来,将会有数以百万量级的智能体出现,形成庞大的智能体生态。“百度希望能与所有的创业领域企业共建一个繁荣的 AI 产业应用和智能生态,帮助创业者更早的找到 PMF,做出超级应用。”李彦宏表示。(IT之家)林凡对话面壁智能李大海:端侧大模型中国与美国差距较小甚至领先
9 月 24 日,脉脉创始人兼CEO林凡对话面壁智能CEO李大海,深度探讨AI手机背后的端侧大模型进展、未来交互变革可能性、被AI接管的未来,普通人该如何快速适应等重要话题。李大海认为,新一代AI手机、新一代智能汽车都会变成“超级智能体”,基于端侧模型的智能计算,贴身陪伴用户、更懂用户,并帮助用户建立和世界的交互。但目前iPhone 16的AI功能远远没有达到理想状态。同时李大海透露,手机内存对端侧模型的影响显著。他同样认为,未来的AI硬件将会分成Copilot(助手)和Agent(智能体)两种类型,Agent能够自主与环境互动,做出更自主的决策。未来,会出现很多的Agent 类型的硬件。此外,林凡和李大海均表示,在云端大模型领域,中国相对落后于美国1-2年,但在端侧大模型领域,双方差距不大,在部分技术方面,中国已经处于国际领先水平。(鞭牛士、新浪科技)
百度全面升级千帆大模型平台 3.0,一句话即可生成企业级应用,Vidu API正式接入
在 9 月 25 日的百度云智大会上,百度智能云宣布,千帆大模型平台全面升级至3.0版本。本次千帆平台全面升级了企业级RAG和企业级Agent开发。大会还发布了低代码AI应用开发平台“AI速搭”,通过自然语言对话就能进行企业级应用开发,一句话即可创建AI应用。同时,生数科技联合创始人兼CEO唐家渝也在会上宣布,旗下国内首个视频大模型Vidu正式开放API,并接入百度智能云千帆大模型平台。Vidu API的开放预计将加速影视、动画、广告等行业的视频创作,释放规模化潜力,帮助企业降低成本、提升效率,并激发创新思维。除此之外,百度智能云还宣布将百舸AI异构计算平台全面升级至4.0版本。百舸4.0全面升级了故障检测手段和自动容错机制,可以有效降低故障发生频次,大幅减少集群故障处置时间。(鞭牛士、品玩快讯、证券时报)近期,智元自主研发的机器人中间件 AimRT 开源上线。官方表示,AimRT 是一个更现代、轻量易用,且高效稳定的通信开发框架,具备机器人开发流程所必备的许多实用特性,并解决了主流开源中间件的一些痛点。以“天才少年”身份加入华为的稚晖君于 2022 年底宣布离职,创业智元机器人。今年 9 月 3 日,智元机器人完成 A++++++ 轮融资,估值已超过 70 亿元,得到了包括北汽、上汽、比亚迪在内的国内汽车巨头支持。(IT之家)华为、中国移动联合发布超大规模AI存储:容量达150PB
在华为全联接大会 2024 期间,华为联合中国移动发布超大规模集群AI存储解决方案。中国移动在哈尔滨万卡超大规模智算集群首次大规模部署多协议融合存储,存储集群可得容量达150PB。基于华为OceanStor AI存储,依托高性能融合存储系统,中国移动大幅提升大模型训练效率,足以支撑千亿/万亿级参数规模大模型高效训练。(快科技)9 月 24 日,悦享控股有限公司,一家以技术驱动的新一代移动互联网基础设施与平台服务提供商宣布,悦灵犀AI多模态全面升级2.3版本。在本次更新升级中,悦灵犀AI实现了支持部分国家和地区的海外用户使用。同时,悦灵犀AI多模态2.3版本新增了一个AIlive图功能,其强大的自由创作应用能力可以让任何一张照片说话并完全视频化,全新交互功能让普通用户一键就能实现AI便捷应用。(快科技)华为发布星河 AI 自动驾驶网络解决方案:业界首个 L4 自动驾驶网络
在华为全联接大会 2024 “星河 AI 自动驾驶网络”论坛上,华为发布了业界首个 L4 自动驾驶网络 —— 星河 AI 自动驾驶网络解决方案。华为数据通信产品线 NCE 数据通信领域总裁王辉在演讲中表示,该方案包括智能网元、数字孪生和智慧大脑三层架构,以集成百亿语料通信大模型、云图算法仿真等底层根能力,打造风险自识别、故障自闭环、变更自验证的 L4 自动驾驶网络,为金融、高校等多个行业打造了 AI 值守的运维专家。(IT之家)9 月 24 日,“香港青年科创号”卫星由捷龙三号运载火箭在山东海阳发射基地成功发射。这颗卫星作为港中大卫星星座首发实验星,是国际首颗人工智能(AI)大模型科学卫星,搭载了亚米级高分辨光学遥感相机[1]和在轨智慧处理载荷,将对高解析度对地遥感观测、资料在轨智慧处理和卫星上大模型部署等关键技术进行验证,可服务于香港、大湾区乃至全球灾害回应、智慧城市、碳中和、低空经济等领域,加快香港新质生产力发展。该卫星首次部署端侧AI大模型,将推动卫星由单星服务的“功能机”向网络服务的“智慧机”时代转变。(界面新闻)前百度研究院副院长新项目:给手机、PC做可用的大模型基础设施,前微软高管加入
前百度研究院副院长李平的新创业公司VecML,近期已经完成了产品的探索和初步研发。值得注意的是,VecML近期还邀请到了前雅虎和Ebay首席科学家、前Walmart副总裁,和前微软技术高管Jan Pedersen博士,出任VecML首席战略官(CSO)。VecML希望能够做下一代端侧AI的基础架构和边缘计算平台,让端侧的设备,也能完成更高难度的大模型计算。目前,VecML已经推出了一套端侧AI基础架构和边缘计算平台,这可以看作是一个部署、开发端侧AI模型的“工具箱”,企业客户通过这个平台,能够完成端侧AI的部署和运行。(智能涌现)近期,中控技术正式发布了Plantbot机器人解决方案。Plantbot机器人解决方案,是中控技术基于30余年的行业经验,深入洞察超过3万家海内外客户在多样化应用场景下的需求,针对流程工业中巡检环境的复杂性、统一调度的缺失以及巡检任务繁重等难题,特别为工业细分应用场景量身定制的机器人产品及软硬件平台解决方案。目前,Plantbot解决方案已成功构建了以“AI + 工厂操作系统 + 安全巡检、智慧物流Apps ”为核心的“机器人+机器视觉”综合巡检解决方案和仓储物流解决方案。(中控技术)近期,上交大等研究团队开发了一个名为Diabetica的大语言模型,专门用于帮助糖尿病患者进行个性化管理。这个AI工具能够理解复杂的医学术语,并为患者和医务人员提供个性化建议。Diabetica通过分析大量医疗数据进行训练,能够处理多种与糖尿病相关的任务,包括提供医疗咨询、辅助医学教育和总结临床记录。在实际测试中,它在医学咨询方面的表现甚至超过了人类医生,在医学教育测试中的得分也高于医生。此外,Diabetica还包括一个较小的模型版本Diabetica-1.5B,适用于资源有限的环境。(新智讯)特斯拉 Optimus 机器人进展:已经生产数百台、还拧不好螺丝
“就算我明天被外星人绑架,特斯拉也会解决自动驾驶问题。但我不知道特斯拉怎么在 Optimus 上赢。” 今年 4 月的财报会上,马斯克给出他该拿 500 亿美元薪酬的一个理由。一位接触过特斯拉团队的人表示,在马斯克说这番话前不久,他就要求人形机器人团队在今年内拿出有意义的突破——让机器人能上产线完成部分工作,如果达不到就进一步裁员,“团队承受的压力越来越大”。
据悉,Optimus 人形机器人目前已经生产数百台,但还不到可以上产线工作的状态,目前只能用来采集数据、测试不同的设计方案。特斯拉机器人团队面前的挑战是,一步到位造出像人一般行动的机器人基本不可能。目前他们只能采取一些工程上的妥协,可能针对特定的工作场景,比如拧螺丝,专门训练模型,让人形机器人先发挥一部分作用。至于妥协的结果马斯克能不能接受,还不得而知。(晚点LatePost)
ChatGPT高级语音助手正式上线:50多种语言、9种声线可选
9 月 24 日,OpenAI宣布,所有付费订阅ChatGPT Plus和Team计划的用户都将可以使用新的AVM功能,该模式将在未来几天逐步推出,并于下周向OpenAI Edu 和 Enterprise 计划的订阅者开放。据悉,AVM提高了部分外语的对话速度、流畅度并改进口音。AVM还新增了两大功能:为语音助手存储“自定义指令”,以及记住用户希望语音助手表现何种行为的“记忆”的功能。语音方面,OpenAI推出了五种不同风格的新声音:Arbor、Maple、Sol、Spruce 和 Vale,加上之前老版本的四种声音Breeze、Juniper、Cove和Ember,可选声音达到九种,撤走了被指山寨“寡姐”(女演员斯嘉丽·约翰逊)的声音Sky。同时,AVM可以用超过50种语言说“对不起,我迟到了”。(财联社)微软将在墨西哥投资13亿美元开发云计算和人工智能技术
微软在 9 月 24 日宣布,该公司将在未来三年内投资 13 亿美元在墨西哥建设云计算和人工智能基础设施。董事长兼首席执行官萨蒂亚·纳德拉 (Satya Nadella) 表示:我们正在加倍努力为墨西哥带来更多产能。该公司在一份声明中表示,这笔投资将用于改善连通性并促进中小企业 (SMB) 对人工智能技术的采用。声明称,该计划旨在三年内覆盖 500 万墨西哥人和 30,000 家中小企业。微软表示,微软和通信公司 Viasat 还致力于在 2025 年底前为 15 万多名之前没有蜂窝连接的墨西哥人提供互联网服务。(鞭牛士)谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
据外媒报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。新定价于 2024 年 10 月 1 日生效。(IT之家)英特尔正式推出Gaudi3 AI芯片:比英伟达H100慢,成本更低
英特尔近日正式推出用于AI工作负载的Gaudi3加速器。新芯片的速度比英伟达广受欢迎的H100和H200 GPU(用于AI和HPC)要慢,因此英特尔将其Gaudi3的成功押注于其较低的价格和较低的总拥有成本(TCO)。
英特尔的Gaudi3处理器使用两个芯片,包含64个张量处理器核心(TPC,带有FP32累加器的256x256 MAC结构)、8个矩阵乘法引擎(MME,256位宽矢量处理器)和96MB片上SRAM缓存,带宽为19.2TB/s。此外,Gaudi3集成24个200GbE网络接口和14个媒体引擎,后者能够处理H.265、H.264、JPEG和VP9,以支持视觉处理。该处理器配备128GB HBM2E内存,分为八个内存堆栈,可提供3.67TB/s的巨量带宽。(爱集微)英伟达发布 Llama-3.1-Nemotron-51B AI 模型
9 月 23 日,英伟达发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B。该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负荷下,只需要一片 H100 GPU 即可运行,大大降低了内存消耗、计算复杂性以及与运行此类大型模型相关的成本。英伟达认为这种方式在保持了出色的精度前提下,显著降低了内存占用、内存带宽和 FLOPs,并证明可以在创建另一个更小、更快的变体来加以推广。(IT之家)据Meta 发言人表示,Meta公司不会立即加入欧盟的《人工智能协议》。该协议是欧盟人工智能法案全面生效前的一项临时措施。欧盟立法者于今年 5 月同意了该法案,这是首个规范人工智能开发和部署的规则。《人工智能协议》规定,公司有义务提供用于训练人工智能模型的数据的详细摘要。Meta 发言人表示:“我们欢迎统一的欧盟规则,目前我们专注于在人工智能法案下的合规工作。”据悉,Meta 可能会在晚些时候加入《人工智能协议》。(品玩快讯)据外媒报道,微软以预览版的形式,在 Azure AI Content Safety 中推出 Groundedness Detection,用于“纠正” AI 幻觉。在人工智能领域中,幻觉是由人工智能生成的一种回应,它含有貌似事实的虚假或误导性资讯。微软的 Groundedness Detection 主要对比 AI 输出内容和源文件,从而识别没有证据或者幻觉内容。微软强调,虽然该工具提高了人工智能输出的可靠性,但并不能保证完全准确,只是能提高生成内容与源材料之间的一致性。(IT之家)贝恩预计AI相关市场将在去年基础上每年增长40%至55%
近期,贝恩公司表示,全球人工智能(AI)相关产品市场持续增长,规模有望在2027年达到9,900亿美元,这项技术的快速应用正在改变企业和经济。该咨询公司在周三发布的第五次年度全球科技报告中表示,包括AI相关服务和硬件在内的市场将在去年1,850亿美元的基础上每年增长40%至55%。贝恩表示,这将带来7800亿至9,900亿美元的收入。(钛媒体AGI)泰坦尼克号导演詹姆斯·卡梅隆加入Stability AI董事会
9 月 24 日,Stability AI表示,电影《泰坦尼克号》的导演詹姆斯·卡梅隆已加入这家人工智能初创公司的董事会。业内人士表示,OpenAI的文生视频工具Sora在 2 月份凭借其高质量视频引起轰动后,好莱坞高管和经纪人与该公司会面,讨论该技术的潜在用途。(界面)
Snap将谷歌人工智能模型Gemini整合进聊天机器人My AI
Snap与谷歌宣布扩大合作关系,Snap将把谷歌的生成式人工智能(AI)模型Gemini整合进其聊天机器人My AI,以提高用户的参与度。据了解,Snap在去年首次推出My AI,当时使用的是OpenAI的AI模型,而近期开始使用Gemini的原因是该款语言模型可以同时处理影片、音讯和文本。Snap首席执行官Evan Spiegel还考虑将Gemini用于其智能眼镜Spectacles的其他功能,该款AR眼镜可以连接到Snapchat应用程序并已与My AI聊天机器人兼容。(格隆汇)诺基亚、英伟达、T-Mobile 合作,共建业内首个 AI-RAN 创新中心
9 月 24 日,诺基亚宣布与美国 T-Mobile 和英伟达携手合作,共同建立业内首个 AI-RAN 创新中心,旨在利用 AI 技术增强无线网络,进一步提升网络速度、减少延迟、提高可靠性。该创新中心位于美国华盛顿州的贝尔维尤市(Bellevue,WA),致力于将诺基亚及其合作伙伴推向 AI、云计算与无线通信技术融合的前沿。同时,诺基亚还与日本软银集团(SoftBank)签署了合作备忘录,开展 AI-RAN 与 6G 技术的联合研究。基于诺基亚的 Cloud RAN 平台,双方将合作开发 AI-RAN。同时,还计划开展厘米波新频段的外场测试,诺基亚称该频段预计将成为未来 6G 的主要频率范围。(IT之家)英国警方测试 AI 工具:可短时间分析大量数据,为破获悬案带来新希望
Söze 由澳大利亚 Akkodis 公司开发,目前正在英国 Avon and Somerset 警方进行试验。该技术能够在数小时内分析多年的数据,包括视频、财务记录和社交媒体,从而为侦探们节省大量的时间。评估发现,Söze 仅用 30 个小时就审查了 27 个复杂案件的证据,而人类则需要数十年才能完成这项工作。英国国家警察局长委员会主席 Gavin Stephens 明确表示,AI 在悬案中的潜力巨大,因为大量的证据数量使得调查几乎不可能。(IT之家)近期,日本东京都政府出手,推出官方背书的人工智能相亲系统,旨在帮助东京居民找到合适的伴侣。“东京结缘”,于 9 月 20 日正式推出,面向在东京生活、学习或工作的 18 岁以上未婚人士。用户必须支付 1.1 万日元(当前约 540 元人民币)购买两年使用资格,还需要多种认证并提供收入证明,接受系统工作人员的面试。实施收费措施是为了驱逐那些可能出于休闲目的使用该应用的人,从而服务于真正对寻找稳定关系、安顿下来有认真态度的人群。(IT之家)