社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
速递|DeepSeek已在全球140个市场的应用商店排名第一,下载量接近ChatGPT同期2倍,印度...
DeepSeek是ChatGPT的套壳?
每日 GitHub 探索|最新 GitHub 开源项目指南,赋能开发者
DeepSeek内部数据库泄露;ChatGPT仿DeepSeek升级推理交互;Claude全球服务宕...
DeepSeek R1已在Gitee AI免费开冲——全尺寸碾压,小尺寸更有性价比!
意大利监管机构向DeepSeek寻求数据保护方面信息;阿里云通义千问旗舰版模型Qwen2.5-Max...
在A股中,本金5万,一年翻倍,看deepseek,月之暗面,豆包和ChatGPT,谁给出的方案合你心...
DeepSeek对ChatGPT有哪些技术突破? | 中国AI领跑全球的法律风险
《2035 年技术融合估计:量子互联网、人机接口、机器学习系统、隐形机器人、增材制造》美陆军232页
2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
关注
Py学习
»
aigc
谷歌发布视频生成模型VideoPoet;AI机器人在迷宫游戏中超越人类;智源FlagEval大模型12月榜发布丨AIGC大事日报
智东西
• 1 年前 • 245 次点击
12
/
20
全球AIGC产业要闻
1、
谷歌发布零样本视频生成模型VideoPoet
2、
谷歌将AI代码辅助功能扩展到所有Colab用户
3、
谷歌将在美国总统大选前限制选举相关AI检索
4、
微软Copilot引入音乐生成功能
5、
亚马逊云科技自研芯Graviton3实例落地中国
6、
亚马逊的AI评论摘要被认为夸大负面反馈
7、
AI机器人在迷宫游戏中超越人类
8、
百度智能云千帆AppBuilder开放服务
9、
智源FlagEval 12月榜发布,新增鲁棒性评测
10、
摩尔线程首个千卡智算中心落地
11、
港中大团队开源AI音频工具包Amphion
12、
CMU研究称Gemini Pro不如GPT-3.5 Turbo
13、
盖茨:距美国大众广泛使用AI还有18到24个月
14、
NewsGuard:全球AI虚假新闻网站已达614个
15、
《出版业生成式人工智能技术应用指南》发布
16、
轻松集团自研大模型升级 发布七大AI+健康应用
17、
AI创企安安创新完成1500万天使轮融资
18、
荷兰地图平台TomTom与微软合作打造车载AI助手
19、
荷兰数字金融公司Bunq推出AI聊天机器人
20、
药品连锁店因滥用AI人脸识别被FTC起诉
1、
谷歌发布零样本视频生成模型VideoPoet
今日,谷歌于官网宣布推出用于零样本视频生成的大型语言模型VideoPoet。该模型能够完成多种视频生成任务,包括文本到视频、图像到视频、视频风格化、视频修复、视频扩张以及视频到音频。该模型采用的方法在单个大模型中无缝集成了多种视频生成功能,而不是依赖于专门针对每项任务的单独训练组件。
论文地址:
storage.googleapis.com/videopoet/paper.pdf
项目主页:
sites.research.google/videopoet
2、
谷歌将AI代码辅助功能扩展到所有Colab用户
今日,谷歌于官网宣布将AI代码辅助功能扩展到所有Colab用户,包括免费用户,现已在175个地区推出。Colab是谷歌提供的一个在线工作平台,可以免费使用GPU进行深度学习,支持Jupyter Notebook和代码执行程序。
3、
谷歌将在美国总统大选前限制选举相关AI检索
据路透社报道,谷歌于当地时间周二宣布,在2024年美国总统大选之前,它将限制其聊天机器人Bard和搜索生成体验所能返回的与选举有关的查询类型,这些限制将于2024年初开始实施。
4、
微软Copilot引入音乐生成功能
今日,微软于官网宣布与AI音乐创作公司Suno合作,以插件形式将其功能引入微软Copilot,使用户可以通过简单的提示轻松创作有趣、巧妙和个性化的歌曲。
5、
亚马逊云科技自研芯Graviton3实例落地中国
12月15日,亚马逊云科技宣布,通过与光环新网和西云数据的紧密合作,其在亚马逊云科技北京区域和宁夏区域推出基于自研芯片Amazon Graviton3处理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g计算优化型和R7g内存优化型三款实例。这些实例均基于Amazon Nitro System构建,与采用Amazon Graviton2的实例相比,整体性能提升高达25%,内存带宽提升50%,同时能耗更低,能效提升高达60%。其中,M7g实例适用于如应用程序服务器、微服务、游戏服务器等,C7g 实例适用于如高性能计算、视频编码、游戏和基于CPU的机器学习推理加速等计算密集型应用程序,R7g实例适用于如开源数据库、内存缓存和实时大数据分析等内存密集型工作负载。
6、
亚马逊的AI评论摘要被认为夸大负面反馈
据彭博社昨日报道,亚马逊的AI商品评论摘要功能有时会提供不准确的产品描述,或是夸大负面反馈。一些商家称,这些摘要是在他们即将进入关键的假日购物季时部署的。彭博社审查了数十篇评论摘要发现,AI在分析顾客评论和生成评论摘要时并不一致,有的突出了批评性反馈,有的则没有。
7、
AI机器人在迷宫游戏中超越人类
据彭博社报道,苏黎世联邦理工学院的研究人员创造了一个名为CyberRunner的AI机器人,其在迷宫游戏Labyrinth中的表现超过了人类。据称,该机器人通过倾斜表面使一个小金属球穿过迷宫,避开棋盘上的洞,仅用了六个小时就掌握了这个玩具。相关论文于当地时间周二发布,介绍了其建立在基于模型的强化学习领域的最新进展之上的模型,让AI通过试错来学习如何在动态环境中行动。该项目现已开源发布,用户可支付200美元以使用CyberRunner平台协调大规模实验。
项目主页:cyberrunner.ai
8、
百度智能云千帆AppBuilder开放服务
今日,百度智能云宣布,AI原生应用开发工作台——千帆AppBuilder全面开放服务。据了解,AppBuilder提供两种产品形态,代码态与低代码态。对于有深度AI原生应用开发需求的用户,AppBuilder代码态提供包括SDK、开发环境、调试工具、示例代码等各种开发套件和应用组件;而AppBuilder低码态则提供可视化工具,用户只需简单点选,即可快速定制、上线AI原生应用。
9、
智源FlagEval 12月榜发布,新增鲁棒性评测
据智源研究院微信公众号发文,今日,FlagEval大语言模型测评榜单12月榜发布,本期榜单新增大语言模型鲁棒性评测结果,考察模型对于输入文本的抗干扰能力;FlagEval平台更新了C-SEM v2.0数据集评测结果,新增了最新开源的Qwen-72B/1.8B、DeepSeek-67B(Base)模型评测。其中,Qwen-72B-Chat模型主观评测结果大幅领先,准确率达83.6%。
据悉,北京航空航天大学与智源FlagEval团队共同构建了大语言模型鲁棒性评测方案,并针对当前主流模型进行了初步评测,本期鲁棒性评测数据集和评测结果分为两个部分:内容扰动鲁棒性评测(北京航空航天大学构建),针对选择问答、文本分类、代码生成任务下的MMLU、OCNLI、CSL、HumanEval测试集进行字符(Char)、单词(Word)、句子(Sentence)三个级别进行内容扰动以及对抗性扰动(即采用代理模型和相关算法进行对抗性攻击),生成了不同的扰动数据集;格式扰动鲁棒性评测(智源FlagEval团队构建),基于MMLU_Chinese、MMLU、Gaokao2023_v2.0数据集,进行选项格式扰动,考察模型是否真正理解了问题和选项并遵从指令的格式要求作答。例如,四个选项的内容调换顺序,或者将A、B、C、D改为B、D、C、E。
详细测评结果:flageval.baai.ac.cn/#/trending
10、
摩尔线程首个千卡智算中心落地
据摩尔线程微信公众号发文,昨日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。同时,摩尔线程CEO张建中发布了大模型智算加速卡MTT S4000、专为千亿参数大模型训练和推理提供强大支持的摩尔线程KUAE平台。据悉,摩尔线程KUAE支持包括DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale在内的业界主流分布式框架,并融合了多种并行算法策略,包括数据并行、张量并行、流水线并行和ZeRO,且针对高效通信计算并行和Flash Attention做了额外优化。
11、
港中大团队开源AI音频工具包Amphion
12月18日,香港中文大学(深圳)武执政副教授带领的团队联合上海AI实验室等开源了音频、音乐和语音生成工具包Amphion v0.1版本。除了文字转语音功能,Amphion还可以将一首歌的声音换成另一个歌手的声音,支持声音转换、歌声合成、文本到音频、文本到音乐等功能,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音频生成任务。
论文地址:
arxiv.org/abs/2312.09911
声音转换Demo地址:
huggingface.co/spaces/amphion/singing_voice_conversion
12、
CMU研究称Gemini Pro不如GPT-3.5 Turbo
据VentureBeat报道,昨日,卡内基梅隆大学(CMU)和BerriAI的研究人员共同发表了一篇论文,将谷歌的Gemini Pro模型与OpenAI的GPT-3.5 Turbo、GPT-4 Turbo以及Mistral AI的Mixtral 8x7B进行了测试对比,通过一组不同的提示运行所有模型,包括向他们询问57个不同的多项选择题,涉及STEM、人文科学、社会科学等方面的内容。测试结果显示,Gemini Pro得分在十几个数据集的测试上表现都不如GPT-3.5 Turbo。研究人员还发现,当提示不同的模型在标记为A、B、C或D的答案之间进行选择时,Gemini选择“D”的次数比其他模型不成比例地多,无论它是否是正确的答案。
论文地址:arxiv.org/pdf/2312.11444.pdf
13、
盖茨:距美国大众广泛使用AI还有18到24个月
比尔盖茨昨日发布年度展望博客,其中谈道:“如果让我做个预测,在美国这样的高收入国家,我猜离普通民众大量使用AI还有18-24个月的时间。而在非洲国家,我预计在3年左右的时间里,AI的使用就会达到相当的水平。这仍然是一个差距,但比我们在其他创新中看到的滞后时间要短得多。”他还提到,希望AI在抗生素药物、个性化教育、高危妊娠治疗、艾滋病风险评估、医疗信息获取等方面能够得到更广泛的应用。
14、
NewsGuard:全球AI虚假新闻网站已达614个
新闻数据集网站NewsGuard昨日发布报告称,迄今为止,NewsGuard的团队已识别出614个不可靠的AI生成的新闻和信息网站,涵盖15种语言。相比今年4月的49个,虚假新闻网站的数量增加了1153%。这些网站大多使用一些诸如“商业日报”(iBusiness Day)、“爱尔兰头条新闻”(Ireland Top News)、“每日时事更新”(Daily Time Update)等看似权威的名称,对于消费者来说难以辨认。这些网站发布的文章涉及政治、技术、娱乐和旅游等主题,包含名人死亡骗局、捏造事件以及将旧事件描述为刚刚发生等虚假内容。
15、
《出版业生成式人工智能技术应用指南》发布
今日,中国音像与数字出版协会发布关于发布团体标准《出版业生成式人工智能技术应用指南》的公告,该指南经立项审核、标准起草、征求意见、专家组审查等程序,并通过团标委审查,现予以批准发布。标准编号为T/CADPA 47-2023,自2024年1月20日起开始实施。
《出版业生成式人工智能技术应用指南(征求意见稿)》原文地址:
https://web-yinxiang.oss-cn-beijing.aliyuncs.com/yinxiang/upload/yinxiang/file/20231114/1699945418432981.pdf
16、
轻松集团自研大模型升级 发布七大AI+健康应用
据医疗健康企业轻松集团微信公众号发文,12月19日,轻松集团旗下医疗健康服务平台轻松健康,宣布其自研的垂直领域大模型“轻松问医Dr.GPT”全面升级。同时,轻松健康还发布了基于该大模型研发七大应用,以满足不同应用场景及用户群体的特定需求,包括“智能问诊系统”“个性化健康管理顾问”“慢性病管理计划”“心理健康指导师”“医学知识库和技能培训平台”“辅助诊疗助手”“患教内容智创平台”,覆盖健康管理服务全场景应用。
17、
AI创企安安创新完成1500万天使轮融资
据36氪昨日报道,AI创企安安创新近期完成一轮近1500万元天使轮融资,投资方为个人股东。据悉,安安创新是一家企业服务赛道的创业公司,创立于2021年,公司主要面向民营企业服务,针对企业的“治理、管理、金融、财税、法律”5个维度难题,通过大模型等AI工具进行智能诊断,结合自主知识图谱+专家知识库,输出专业解决方案。
18、
荷兰地图平台TomTom与微软合作打造车载AI助手
据路透社报道,荷兰数字地图平台TomTom于当地时间周二宣布,将与微软合作打造一款基于AI的车辆对话助手。该助手将允许用户通过自然语言与车辆交谈,并实现与信息娱乐、位置搜索和车辆命令系统的语音交互。TomTom称,该语音助手可以集成到其他汽车信息娱乐系统中,也可以内置到TomTom的数字驾驶舱中,是一个开放的模块化车载信息娱乐平台。
19、
荷兰数字金融公司Bunq推出AI聊天机器人
据彭博社今日报道,荷兰数字金融公司Bunq推出一款AI聊天机器人Finn,支持用户查询自己的支出信息。Finn建立在现有大型语言模型之上,并利用客户在Bunq平台上的消费信息进行训练,由十几名数据专家历时一年构建。
20、
药品连锁店因滥用AI人脸识别被FTC起诉
据彭博社报道,美国联邦贸易委员会(FTC)在当地时间周二提交给联邦法院的一份诉状中称,药品连锁巨头Rite Aid在纽约、洛杉矶、巴尔的摩等城市的门店使用了AI面部识别系统,但没有通知顾客。据该机构称,Rite Aid的面部识别系统产生了数千个不正确的识别,通常涉及黑人、拉丁裔或女性。由于匹配不当,Rite Aid员工会在商店周围跟踪顾客、报警,有时甚至谎称顾客入店行窃。作为与联邦贸易委员会和解的一部分,该连锁店同意在未来五年内不使用面部识别技术进行监控,删除迄今为止收集的图像,并向联邦贸易委员会提供有关其合规情况的年度报告。
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/165930
245 次点击
登录后回复