社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Nat. Mach. Intell. 速递:机器学习方法预测指数增长的 AI 知识网络的未来

集智俱乐部 • 1 年前 • 275 次点击  


关键词:人工智能,概念网络,复杂网络,跨学科研究



论文题目:Forecasting the future of artificial intelligence with machine learning-based link prediction in an exponentially growing knowledge network

期刊名称:Nature Machine Intelligence

斑图地址:https://pattern.swarma.org/paper/a3f9750e-6c78-11ee-b005-0242ac17000d

论文地址:https://www.nature.com/articles/s42256-023-00735-0


一种工具可以通过从科学文献中获取见解,来建议新的个性化研究方向和想法,这可能会深刻加速科学进步。一个可能从这种方法中受益的领域是人工智能(AI)研究,近年来科学出版物的数量呈指数增长,使得人类研究人员难以跟上进展。这项发表于 Nature Machine Intelligence 的最新研究使用AI技术来预测AI本身的未来研究方向。


图1. Arxiv上归类为机器学习或AI的论文数量


研究者引入一个基于真实数据的基于图的基准测试——Science4Cast基准测试,旨在预测不断发展的人工智能概念网络的未来状态。为此,研究中使用了超过143 000篇论文,建立了一个包含超过64 000个概念节点的知识网络(构造过程见图2)。然后提出了十种不同的方法来解决这个任务,从纯统计到纯学习方法。令人惊讶的是,最强大的方法使用了精心策划的网络特征集,而不是端到端的AI方法。这些结果表明,可以释放纯机器学习方法的巨大潜力而无需人类知识。最终,更好地预测新的未来研究方向将成为更先进的研究建议工具的重要组成部分。


图2. 从Arxiv论文构建概念网络的过程,利用1992年到2020年在 arXiv 上发表的143000篇人工智能和机器学习论文的摘要,基于自然语言处理产生的64000个概念作为节点,如两概念在同一网络中同时出现则构建连边,从而产生一个不断发展的、随着更多的概念被联合研究而扩展的网络。


图3. 生成的网络连边具有长尾效应


图4. 概念网络随时间变得稠密


图5. 随着时间变化,概念网络变得更加中心化


基于该网络的任务是预测哪些未连接的节点(尚未一起研究的概念)将在几年内连接起来。研究者使用了多种方法的组合来尝试完成该任务,包括是否基于手动微调的特征(NF)与使用机器学习或神经网络,结果显示基于手动设计的特征作为机器学习算法输入的情况下,预测准确性最高。


图6. 使用不同方法组合进行未来1、3、5年预测的 AUC 对比


该研究是朝向开发可以帮助科学家发现新的探索方向的个性化推荐工具的重要步骤。作者们指出,基于人工智能和语义网络,可开发出实用的跨学科研究方向推荐工具,改变科学家处理研究问题和在各自领域开展合作的方式。


考虑到研究说明利用概念网络的特征,将提取的概念作为节点和边作为机器学习算法的输入预测准确性最高,下一步的研究方向将是能否利用端到端的深度学习,在不使用特征工程的情况下更准确的进行预测。采用超图等高阶数据结构来构建概念网络,以同时使用论文引用信息和语义信息,则是另一个值得关注的方向。此外科学研究中,来自于意想不到的遥远领域的概念组合往往有可能诞生更具影响力的成果,如何鼓励意外的关联(例如概率网络上余弦相似度较低的节点),可增加研究方向推荐算法的价值。




编译|郭瑞东

计算社会科学读书会第二季



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动



推荐阅读

1. Yoshua Bengio领衔跨学科团队,Nature刊文综述人工智能时代的科学发现
2. 复杂性的跨学科关联:分数阶微积分、重整化群与机器学习
3. 知识就是AI的力量:从知识工程到知识图谱全面回顾
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5成为集智VIP,解锁全站课程/读书会
6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/163619
 
275 次点击