社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

AIGC月刊:AI智能体会自动操作电脑和手机了;AI视频特效风靡全网;国产AI投放大战(24.10)

AI新榜 • 2 月前 • 68 次点击  


各位好,这里是“AI新榜”的月更栏目:AIGC月刊。


本期开始,我们准备对这个栏目的板块进行一些调整。比如,你将在下文看到:


「AI大事件」为你盘点每月最值得关注的至少10条AI资讯


「AI创作」为你推荐每月值得一看的AI内容创作热门案例


「AI Talk」为你精选每月值得一读的AI领域访谈/演讲/报告等


「AI预告」为你搜罗下个月值得跟进的AI动态及产品发布(也欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510备注姓名公司)


希望能为你了解AIGC带来参考,也欢迎你在评论区交流每月使用/研究AI的感受心得~


🪐附AI产品榜,助你了解更多AI产品排名:https://www.newrank.cn/aiRank


💬附AI玩家进群方式:添加微信banggebangmei备注姓名公司,进群交流AI




10月AI大事件


1. AI攻占诺贝尔奖


今年诺贝尔奖的化学奖和物理学奖都“爆冷”颁给了AI,成为10月AI领域的热点话题之一。


10月8日,2024年诺贝尔物理学奖授予美国普林斯顿大学的生命科学家霍普费尔德(John J. Hopfield)和加拿大多伦多大学的辛顿(Geoffrey E. Hinton),以表彰其通过人工神经网络实现机器学习的基础性发现和发明。


辛顿是深度学习的先驱,被认为是与Yoshua Bengio和Yann LeCun齐名的“AI教父”。辛顿本人在得知拿奖后的第一反应也是“完全没有想到”。


此外,2024年诺贝尔化学奖授予大卫·贝克(David Baker)、丹米斯·哈萨比斯(Demis Hassabis)和约翰·乔普(JohnM.Jumper),以表彰他们在蛋白质设计和蛋白质结构预测领域作出的贡献。后两位都来自谷歌DeepMind公司,其中丹米斯是DeepMind创始人兼CEO。


最近,图灵奖得主LeCun对此发表锐评,表示“今年诺贝尔奖颁给AI,是诺奖委员会感到压力的结果,需要承认深度学习的影响。但物理奖颁给Hinton和Hopefield,获奖成果玻尔兹曼机和Hopefield网络现在完全无用。”网友对此看法不一,有人认为不无道理也有人说他是“酸了”。


2. Adobe推出新AI工具Project Turntable


在10月举行的Adobe MAX 2024大会上,Adobe的推新也引起不少关注。


Adobe MAX 2024大会又被称为设计圈年会,今年Adobe在会上推出了多项生成式AI新功能,包括Project Turntable,可以将2D矢量图像像3D对象一样进行旋转,无需重新绘制,AI会即时生成图像所需的隐藏部分。比如,一篮面包的2D图像在旋转过程中,AI自动补全了原本不可见的背面。


网友瞬间炸锅:甲方永远是对的!十年前甲方:把那头大象转过来。



Adobe全家桶逐渐AI化,生产力简直爆炸,决定了评论区抽一人送我正版Ps


3. AI卷王们集中发力


10月23日凌晨,大洋彼岸的AI卷王们接连发布重磅炸弹,也成为10月AI领域的一大景观——


首先是Anthropic发布升级版Claude 3.5 Sonnet和新模型Claude 3.5 Haiku,其中新功能Computer Use(计算机使用)成为最大亮点,可以让Claude像人一样使用计算机,比如查看屏幕、移动光标、单击按钮和输入文本。


Claude官网:https://claude.ai/new


AI图像方面,Stability AI一口气带来了Stable Diffusion 3.5全家桶,包括Large、Large Turbo和Medium三个版本,可在消费级硬件上运行,年总收入100万美元以下可免费商用。官方称在多样性上做了优化,无需大量提示,就能生成不同肤色和特征的人像图片,同时支持3D、摄影、绘画等多种视觉风格。


Stable Diffusion 3.5在线使用:

https://huggingface.co/collections/stabilityai/stable-diffusion-35-671785cca799084f71fa2838


AI初创公司的节奏是真的快,刚成立2年的GenmoGenmo突然发布Mochi 1预览版,宣称是“最强开源视频生成模型”。测试数据显示,Mochi 1在高保真运动和提示遵从性上都超越了Pika、可灵、Runway、Luma等领先的封闭模型。


https://www.genmo.ai/play


目前Genmo仅放出了Mochi 1 480P基础版本,提供在线试用。完整版本包括Mochi 1 HD将在今年年底前发布。


4. 智谱发布AutoGLM功能,AI会自动操作手机


Claude刚刚发布Computer Use,智谱就紧接着推出AutoGLM,可以让AI像人一样使用手机。只需要说出简单的语音/文字指令,AutoGLM就可以帮你:


在微信上给老板的朋友圈点赞并写评论……

在淘宝上购买某一款历史订单产品……

在携程上预订酒店……

在12306上购买火车票……

在美团上点个外卖......


目前,AutoGLM Web已经通过智谱清言插件对外发布,可以根据用户指令在网站上自动完成高级检索、总结与内容生成。手机端AutoGLM已开启内测,暂时仅支持安卓系统。



5. 国产AI在投放上杀疯了


最近,三张体现国产AI产品广告投放金额的图片在AI圈引发热议。虽然据我们了解,表格中的数据真实性还有待考究,至少并不完全准确,但国产AI今年在投放上的力度相较往年着实大了不少。


除了投流,国产AI们在内容上重点投放的平台和账号都有哪些,这些预算究竟流向了哪些博主?借助新榜旗下海汇提供的数据,“AI新榜”重点拉取了近3个月国内15家头部AI产品在抖音、快手、B站、小红书、视频号、微博等6个平台的投放内容数量以及具体投放内容。



我们发现,从最近三个月的数据来看,kimi最爱投快手、夸克最爱小红书;头部和科技博主账号固然有机会,垂类低粉博主却更吃香,而且类型广泛涉及游戏健身、美食、美妆和短剧等泛生活娱乐场景的博主。


相关阅读:《国产AI在投放上杀疯了,这些巨款究竟流向了哪些博主?》


6. 字节大模型训练被实习生攻击,涉事者已被辞退


10月18日,有传闻称字节跳动的实习生因对团队资源分配不满,利用HuggingFace漏洞,在公司的共享模型里写入破坏代码,导致大模型训练效果不可靠,而且AML团队无法核查原因。


10月19日,字节跳动回应称,涉事实习生恶意干扰商业化技术团队研究项目的模型训练任务,已在8月被辞退,但这并不影响商业化的正式项目及线上业务,也不涉及字节跳动大模型等其他业务。网传“涉及8000多卡、损失上千万美元”严重夸大。



7. OpenAI推出新交互界面Canvas


10月4日,OpenAI推出了全新交互界面Canvas(画布)。这是一个在标准对话框旁开启的独立窗口,用户可以在其中与ChatGPT深度协作,编辑和改进AI的输出。比如你可以高亮标注出重点部分,告诉ChatGPT特别关注哪里,类似于一个文案编辑或代码审查员提供实时反馈和建议。



内测期间,OpenAI将向ChatGPT Plus和Team用户推出Canvas,Enterprise和Edu用户将陆续获得访问权限,内测结束后将向免费用户开放使用。


8. 字节豆包推出AI智能体耳机Ola Friend


10月,字节正式杀入AI硬件,通过AI耳机。


10月10日,字节跳动豆包发布了首款AI智能体耳机Ola Friend。这款耳机接入了豆包大模型,并与豆包App深度结合。用户戴上耳机后,无需打开手机,便能通过语音唤起豆包进行对话,适用于信息查询、旅游出行、英语学习及情感交流等场景。目前Ola Friend已在各大电商平台上架售卖,售价1199元。


“AI新榜”在第一时间对Ola Friend进行了评测,虽然现在AI耳机还无法满足我们的所有想象,但已经能起到“搭把手”的作用了,具体使用体验见下方视频。



9. Apple Intelligence与iOS 18.1同步上线


10月28日,苹果宣布首批Apple Intelligence功能现已面向iPhone、iPad和Mac用户推出,随iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的发布同步上线。目前,Apple Intelligence功能有:写作工具、通知摘要、Siri的新视觉更新、照片增强功能等等。


苹果表示,到12月,写作工具将变得更强大,还将推出新的视觉智能体验,帮助用户迅速了解物体和地点。


10. Kimi内测语音通话功能


实时语音通话早已不是什么新奇功能,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。


随着GPT-4o高级语音模式于近期陆续放出,10月,Kimi智能助手App也在内测语音通话功能,支持更换声音和调节语速,用户可以克隆自己的声音,并分享给他人使用。


与其他AI助手不同的是,Kimi语音通话界面会实时显示对话字幕,提升交流效率。另外,Kimi还设置了两个特殊的场景模式:英语陪练和模拟面试,比如英语陪练模式支持单词跟读、语法纠错和练习。



在测试中,我们让Kimi和GPT-4o试着扮演对方的相亲对象尬聊,Kimi总体表现还算自然流畅,而且很会主动开启话题。


相关阅读:《让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了》



10月AI创作


1. 捏扁一切,一种很新的po图方式


10月,Pika的特效滤镜在海内外社交媒体上走红,被网友们玩出花来,创作出不少新鲜有趣的AI内容。


网友们通过“Pikaffect”——Pika(https://pika.art/)于10月3日推出全新1.5版本后更新的AI特效功能,上传一张图片,就可以用AI模拟爆炸、融化、粉碎、膨胀、溶解等10多种视频特效。随后,用AI把“照片里的自己”捏扁,这成了“一种很新的po图方式”。



类似的特效也可以通过海螺AI等视频生成工具实现。


2. 人间清醒的AI奶奶们集体出道


最近,一大批AI奶奶账号在小红书、抖音等社交平台上集体出道,成为一道风景。


这些账号的内容形式比较简单:一组由AI创作的动漫奶奶形象,搭配一段以治愈、成长为关键词的清醒语录,就成了一个获赞不低的AI奶奶账号。


通过AI绘图、AI文案生成等工具即可批量制造这类图文内容,目前AI奶奶们已经开始探索包括卖课、接商单、做情感咨询、卖书、卖老年服装等变现方式。


不久前“AI新榜”发文《批量生产的AI奶奶,正在小红书扮演人生导师》,我们还看到后台有朋友评论“那我去做个人间暴躁舅爷爷的营销号不知道有没有人看”。



3.靠AI 3D内容赚到第一桶金


AI创作不仅能带来流量还能帮创作者赚到钱,这样的案例又有更新。


最近UGC内容平台Roblox玩家“RG”使用Tripo生成的一顶粉色贝雷帽,在1小时内吸引了超3000名玩家涌入Tripo。


“RG”也靠售卖游戏配饰赚到了超过1亿Robux(Roblox内的代币,折合约35万美元,近250万元人民币)。



Tripo AI(https://www.tripo3d.ai/app)支持文生3D和图生3D,其团队表示尽管目前游戏中的主角、场景依旧需要精度更高、更复杂的模型,但在短视频、游戏配件领域,AI 3D内容已经有了用武之地。


据“AI新榜”观察,在TikTok、Roblox等内容平台上,已有不少通过AI 3D内容赚一波的创作者。大部分玩家会先使用AI 3D工具基础建模,再导入Blender、Comfy等工具中进行细节优化。


相关阅读:《一顶帽子带来近250万元收入,国产AI 3D工具开始帮创作者赚钱了》


4. Runway视频转绘功能带火AI二创


Runway视频转绘功能最近带火了AI二创。


背景是Runway(https://runwayml.com/)近期推出了V2V(视频生视频)功能,由Gen-3模型提供支持,用户可以通过文字提示词指挥AI做后期特效,包括改变视频氛围、色调和风格,甚至更改人物形象。


很快,各大社交媒体上涌现出了不少基于AI视频转绘的有趣玩法,例如《甄嬛传》的二创,抖音博主“赛博影业”发布的“印度甄嬛”系列有一条视频获得近40万转发。



相关阅读:《AI魔改《甄嬛传》,Runway带飞AI视频转绘,这下谁还能拦住网友搞二创啊》

5. “3A大作”《沙威玛传奇》风靡全网


最近,一款名叫《沙威玛传奇》的模拟经营游戏风靡全网,让无数网友和玩家为之上头,其中的游戏角色、中文主题曲和配音都成了热门二创素材,随之涌现出一些爆款内容。


由于使用了AI制作,这款游戏被称为真正的“3A大作”:AI作图、AI作曲、AI配音。



《沙威玛传奇》无疑是一款低成本高回报的游戏,用大量AI实现了14种语言支持,虽然制作粗糙,但也提供了网友二创、玩梗的空间,这为AIGC在游戏的应用上打开了一条新思路。


相关阅读:《“3A大作”《沙威玛传奇》风靡全网,懂AI都知道这里面的门道有多深》



10月AI Talk 


1. Anthropic CEO Dario Amodei:“强大AI”最早2026年到来,比诺贝尔奖获得者更聪明


原文:https://darioamodei.com/machines-of-loving-grace


10月13日,Anthropic CEO Dario Amodei发文《Machines of Loving Grace:How AI Coulf Transform the World for the Better(AI能如何改变世界,创造更美好的未来)》详细阐述了强大AI的定义及限制因素,并对其在生物与健康、神经科学与心理、经济发展与贫困、和平与治理、工作与意义这五个领域的积极影响进行了预测。


他表示自己谈论了很多关于强大的AI的风险,但他更想强调大多数人都低估了AI的好处,就像低估了风险可能有多严重。


在他看来,强大的AI在形式上可能类似于如今的大语言模型,在多个领域会比诺贝尔奖得主更聪明,它没有实体形态,并且具备所有可供人类进行虚拟工作的交互方式,包括文本、音频、视频、鼠标和键盘控制以及互联网访问,还能自主完成任务等。


“许多人对强大的AI是否会很快建成持怀疑态度,有些人则怀疑对它是否会建成。我认为它最早可能在2026年到来,尽管也有可能需要更长的时间。”


2. 新世相创始人张伟:AIGC浪潮会带来新的一批内容偶像


相关阅读:《上万年轻人用AI写遗嘱,新世相如何在AI时代制造流行?》


制造过“逃离北上广”等多个现象级事件的头部内容公司新世相,在2024年决定全面拥抱AI,并成立了AI创意厂牌“新世相AI”,打造了第一届AI艺术节(AIAF),还邀请1万个年轻人用AI写遗嘱。



在接受“AI新榜”访谈时,新世相联合创始人杨远骋表示,今天的AI虽然可以做很多事,但它最直接影响的其实是艺术创作、和各种各样的自媒体创作。


“AIGC领域很多活跃的创作者,都不是过去在图片/影像生产领域很活跃、甚至有影响力的那批人。AIGC浪潮会带来新的一批内容偶像,我觉得这件事在小圈子里已经发生了。”新世相创始人张伟认为,现阶段专业的AI内容团队并不存在,对内容公司来说,现在做AI需要的并不是技术能力,而是产品研发思维,以及用户理解、选题洞察、运营思维和传播思维等内容行业里最基本的能力。


3. Meta首席人工智能科学家杨立昆:AI威胁人类论是胡说八道


华尔街日报链接:https://www.wsj.com/tech/ai/yann-lecun-ai-meta-aa59e2f5?st=SYmYBM&reflink=desktopwebshare_permalink


Meta首席人工智能科学家杨立昆(Yann LeCun)近日接受《华尔街日报》采访时提到,AI威胁人类论“完全是胡说八道”。他认为,今天的语言大模型缺乏一些关键能力,如持久记忆、推理、规划和对物理世界的理解。现有模型只是证明了“你可以操纵语言,但并不聪明”,它们永远不会产生真正的通用人工智能(AGI)。


杨立昆曾获得图灵奖,他此前曾在社交媒体上表示,在担心控制超级智能AI之前,我们需要先弄清楚如何设计一个比家猫更聪明的系统。



4. 李彦宏:百度不会碰Sora类的视频生成


国内AI视频模型在近半年来一路狂奔,几乎把Sora甩在身后,但做不做视频生成模型,不同AI公司之间仍存在分歧。


据36氪,李彦宏在百度2024年第三季度总监会上提到,百度不碰Sora类的视频生成。ToB业务尽量不碰吃力不讨好的项目制,尽量推出标准化产品。而文心一言改名后的ToC新搜索应用“文小言”,在推广上则不会像字节跳动的豆包、月之暗面的Kimi那样激进。


5.《AI现状报告》:OpenAI相对于其它AI公司的领先优势已基本消失


完整报告:https://www.stateof.ai/


人工智能投资者Nathan Benaich和Air Street Capital近日发布了最新一期《State of AI(人工智能现状)》报告,发现OpenAI相对于其它AI公司的领先优势已基本消失。


Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5、X的Grok 2,Meta的Llama 3.1 4050亿参数开源模型,在部分基准测试中已与OpenAI的GPT-4o持平,部分测试甚至略胜。OpenAI最近发布的o1 Strawberry模型在推理任务中仍然保持着优势。


6. Runway CEO Cristobal Valenzuela:AI公司的时代已经结束了


原文:https://cvalenzuelab.com/newmedia?continueFlag=0f330e7b74d1c55481c53d0381543412


Runway CEO Cristobal Valenzuela近日发布公开信称:“我认为AI公司的时代已经结束了,因为AI正在成为像电力或互联网一样的基础设施。”


他表示,Runway不是一家AI公司,而是一家媒体和娱乐公司。AI只是一种工具,真正的变革不在于技术本身,而是在于它所实现的东西:新的表达形式、讲述故事的新方式、连接人类体验的新方法。


7. First Page Sage发布了10月份美国AI聊天机器人市场份额报告


相关链接:https://firstpagesage.com/reports/top-generative-ai-chatbots/


AI博主歸藏在公众号“歸藏的AI工具箱”中整理了中文版图片以及主要内容:


•ChatGPT依然是王者,但是份额在逐渐下降

•谷歌和微软在争夺老二的位置

•Perplexity和ClaudeAI高速增长

•Perplexity和ClaudeAI正在从ChatGPT和Gemini蚕食份额



下月AI预告


1. 11月12日,百度世界2024将在上海举办


以“应用来了(Applications Are Here)”为主题的百度世界2024将于11月12日在上海举办,目前公布的大会亮点包括:李彦宏年度演讲;100多个AI原生应用发布;4场主题分论坛和30多节公开课;超5000平方米的 “AI应用小镇” 科技展区等等。



百度世界官网:https://baiduworld.baidu.com/m/world/main/2024/index.html?lng=zh


2. 11月4日至5日,韩国SK AI峰会将在首尔举办


SK AI峰会是韩国SK集团每年的重要活动,今年扩展为全球论坛。OpenAI董事长兼总裁Greg Brockman、微软执行副总裁Rani Borkar、创新工场董事长兼首席执行官李开复等AI公司高管将出席。峰会将举办100场会议和50场展览,重点关注AI基础设施、半导体和服务。



SK AI峰会官网:https://skaisummit.com/


3.11月20日至22日,微软将举办Ignite 2024全球技术大会


北京时间11月20日至22日,微软Ignite 2024全球技术大会将在芝加哥举行,全球线上同步直播。今年大会将重点关注 “AI转型中的最新创新”,微软董事长兼首席执行官萨蒂亚·纳德拉 (Satya Nadella)将在11月20日12:00发表主题演讲。



微软Ignite 2024官网:https://ignite.microsoft.com/en-US/home


4. 11月,MiniMax将发布首款对标GPT-4o的实时语音对话API产品


有消息人士称,AI大模型领域的独角兽MiniMax将于11月发布对标GPT-4o的Realtime API服务。这是MiniMax推出的首款端到端实时语音对话产品,将提升端到端实时多模态处理能力,并带来更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交、直播、游戏等多种场景提供服务。


5. 11月,快手可灵即将上架独立App


在2024中国计算机大会上,快手可灵AI宣布其用户已超过360万,累计生成3700万个视频和超过一亿张图片,同时将内测视频人脸模型功能并于近期上架独立App。


另有爆料称,可灵1.5 Lora功能正在测试中,可以解决文生视频角色一致性的问题。


6. 11月,天工AI将升级高级搜索功能及发布新模型


昆仑万维旗下天工AI智能助手持续迭代更新,近期在网页端(tiangong.cn)新增了高级搜索模式、彩页和宝典,11月会升级高级搜索,以及发布新模型。



7. 据内部人士向“AI新榜”透露,11月,腾讯混元将宣布模型开源上的大进展。


ps. 欢迎AI同行联络爆料,完善信息,共创AI月刊,可联系微信zhangjie74510(备注姓名公司)



AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。

欢迎分享、点赞、在看
 一起研究AI

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/175584
 
68 次点击