社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

深度学习直接缝了别的模型,论文中这种创新点应该如何描述?

江大白 • 1 月前 • 79 次点击  

以下章来源于微信公众号:AI前沿速递

作者:AI前沿速递

链接:https://mp.weixin.qq.com/s/EiPo2OAXBScFbnLsqFM5uQ

本文仅用于学术分享,如有侵权,请联系台作删文处理

导读
相信很多研究生们都想早早发了小论文然后去实习、考公考编。那么如何才能找到自己的创新点、写好自己的文章呢?本文从实际出发,给各位研究生们总结了一些经验和技巧,希望对大家有所帮助。

作为散养硕士,我们希望能早早发小论文,然后去实习&考公&考编,虽然知道网上大家都说缝模块来水论文,那怎样才能优雅的缝出一篇中稿率更高的论文(即如何更好地讲故事)呢?
简洁版:相似领域找灵感,边试边改勇投稿。

1.怎么找模块?

(1)缝一些常见模块

(2)融合相似领域

相似领域比如说,最新的顶刊顶会的通用骨干网络,可以作为你的骨干网络,相似领域的模块,可以作为你其中信息融合或者其他的模块。
多模态的目标检测/语义分割/目标跟踪,行人重识别,红外与可见光图像融合,这些就是相互之间为相似领域。
超分/去雾/去噪/去云/低光增强等里面的模块,都可以作为别的领域的模块。
甚至传统的图像滤波器,如sobel,bilateral+等,都可以以作为卷积算子嵌入模块中,作为一个子分支,补充某种类型的图像特征。这种具有先验知识的传统+深度学习的方法还是比较受审稿人喜欢的。

2.怎么编故事?

创新无非是:新问题,新方法,新损失,新数据集。
贡献可以是:大的框架+小的模块(可*2)+实验效果。(3到4个点)
论文的框架:(有时候是新瓶装旧酒,换一个说法)往往就是你你的这篇论文主打的卖点,即核心要解决的问题,比如现有研究往往会忽略xxx,现有研究通常xxx效果不佳。如果这个问题是别人都没怎么提到过的,就是一个新问题,比如说,红外与可见光图像融合任务中,很少人会想到用低光增强去增强可见光图像。涉及到多任务,也是近年来的热点,多任务就是叠不同任务的模型,有的分开叠,有的合到一起。
新的数据集:符合特殊的研究对象,已有数据集缺乏某种场景,缺乏某些任务标签,更好的为多任务服务。
新的损失:一般适合低层视觉任务,核心是你想让被约束的网约各生成啥样的结果,比如想让目标级更好的保留原有模样,结果与mask×源图像作损失,或者用一些显著性检测网络处理作损失。还有一些感知损失+,色彩一致度损失等。
模块的创新:你从哪抄的,就仿照别人怎么写,你只是在别人的基础上进行改进,这个改进作用大不大不重要,重要的是,你多个块包装起来的整体要有比较大的改进(消融实验+体现出来),记得"规范"引用别人的论文。
方法的创新: 方法上面的创新,个人觉得追热点是很重要的,尤其是近三年(最好好就是今年的顶会,如CVPR等,顶刊周期特别长,方法时效性有点差)的相似领域,找那些模块缝合并微调,组合成新的模块,自己命名。改动大就明说受什么启发,改动小就在引言一句带过。这样的方法既有理论基础,又大概率能涨点。好多人直接拿相同领域的老论文的点或者大家用烂了的注意力机制来缝,稍微懂点的都知道你是水论文,怎么就不能好好包装一下呢?
举个例子,丁霄汉+大佬提出的结构重参数化以及相关的后续工作,包括其他人的后续研究,都可以作为你的其中一个模块的点来用,替换掉多尺度特征提取部分网络,主打一个轻量级网络设计,解决现有算法计算量和参数大,直接用轻量级网络又会性能下降的问题。
同样的,看顶会论文,别人用这样的方法解决这样的问题,你要思考你的领域是否会存在这样的问题,能不能也用这样的方法解决,然后做实验。如果这个过程中发现新问题并解决,那太好了,你的研究就是很棒的。如果没有发现新问题而实验还不错,没关系,这就要看你怎么吹了。如果实验效果不好,思考一下为什么,确实没办法就换一个。
再次重申一遍,是一个大点加俩凑的小点,大点体现在某种新方法新思想,也是论文的主题,核心要讲的东西,为了工作量到位,再去凑一两个小模块,就是那种别人的a+b包装成你提出的c。大点也是从相似领域那里借鉴来的,不是自己想出来的。一定是围绕主题展开讨论,然后顺带搞几个模块让你的方法看起来复杂一点,写起来内容多一点,可能效果好一点。而不是上来就抄几个模块乱缝,咱们是跟模板作文一样,有框架的填素材。
实验效果:对比实验和泛化实验堆量,别人用5个对比算法,你用10个,别人比两个数据集,你用4个。前提还是你的方法整体上是最好的。如果是低层视觉任务(图像增强类型的基本都是),可以做一些高层视觉任务(目标检测,语义分割,显著性检测等的不同算法对比实验,主打一个卷死同行。(这个非常建议想发一二区的朋友来做)在计算机领域,一区特别看重好的创新+足够的工作量+写作很规范逻辑很通顺,二区是一些创新+足够的工作量+写作规范逻辑通顺,三区是一般的创新+还行的工作量+写作比较规范基本也到位,四区是各方面中规中矩,论文算是规范。中文期刊看基金、学校和圈子比较多,波动性比较大,中文EI和三区差不多,普通北核跟四区差不多,甚至有时候不如四区。

3.如何画图更专业?

常说的四种图:摘要图,方法图,对比图,消融图。
摘要图:通过一个图来让别人知道你要做什么,有时候是用不不同算法对比结果来体现你的方法的特殊性,有时候用指标对比体现你的SOTA+。这个一区基本都要要,二区弄得好会比较出彩。
方法图:也就是你的网络模型,能放到一张图就不要拆成多个卜图,太散乱就不知道你在说什么。
对比图:很常规的东西,自己看论文。这里说的是指标,有时候可以用雷达图来对比,会显得又专业又炫酷,但会比较碰运气。

消融图:同上。一般用visio 画,ppt,亿图之类的也很多。

4.论文的结构以及对应功能?

摘要:客观说明整篇论文的工作。
引言:引出问题及自己的工作。
1)任务的目的,意义,应用
2)该领域的研究发展历程,还存在什么问题,甚至解决这个问题题的发展过程及出现的新的子问题。
3)自己提出一种新方法,解决这些问题,贡献点1234(一般三到四个)
近期工作:针对这些问题,别人怎么做的,有时候不单单是该领域,可能会涉及到别的领域。从而引出你的方法。
方法:问题描述(有的人会写,分析得比较漂亮),整体方法,单个模块,损失函数。
实验:实验设置(数据集,对比算法,评价指标,实验参数,伪代码流程图等),对比实验(用来训练的数据集),泛化实验(别的数据集),验证实验(高层视觉任任务对比实验),消融实验(消掉不同模块,主要是你作为创新点提到的模块)
总结:总结这一系列过程,但存在xx问题(客观且无伤大雅),可能可以怎么解决,未来我们还会继续研究。
补充一点,你的整篇论文一定是围绕一个核心论点(解决某一个最重要的问题或者核心任务)展开说的,其他的是解决核心问题的过程中顺带解决的子问题尤其是引言部分,一定要好好理这个逻辑关系,千万别到处拼凑论文,这抄一点那抄一点,逻辑乱七八糟,甚至跟主题都没多少关系。(审过印度人的论文,逻辑乱七八糟,都不知道在讲什么,不愧是出了名的烂。)

5.小白如何入门?

以下建立在已经确定具体方向的基础上。

(1)了解该领域(任务)在做什么

通过综述论文+(最好是一区)了解该领域是做什么的,现有研究怎么做,效果怎么样,未来还可以做什么方向。也可以通过一些前沿论坛的视频了解,中国图象图形学报的b站号定期会举办各种图像领域的前沿论坛,邀请行业大佬来做分享,比如图像融合+,我记得就有3期。

(2)了解该领域的具体研究

通常都是先从顶刊顶会看起,尤其是带开源代码的论文以及经常用来对比的方法,重点看。尝试跑一下开源代码,看代码怎么对应论文的方法。

(3)尝试做实验,加模块

尝试加一些注意力机制,或者是别的相似领域的模块,改改损失函数和训练策略等。一方面是感受不同的网络模块和损失函数会带来怎样不同的效果,另一方面也会加强你的代码能力。
p.s.:很多人可能会问,为啥不是先系统学习深度学习的基础知只呢?我觉得深度学习更注重实践,实践的过程也会加深你的理解,在实践的过程慢慢补遇到的问题和不会的知识。学了一大堆,还不如直接上手理解得透彻。
这样一套下来,你的论文棒得不行,再找靠谱的师兄师姐导师改改,大语言模型(chatgpt,文心一言,讯飞星火+等)中翻英,注意一下时态(尽量一般现在时,容易出现一般过去时,要小心),然后deepl+英翻中看看意思有没有变,中文版写得好,英文版不会有什么大问题的,这样搞几乎也不用担心什么语法问题,润色问题。最后就是积极投稿,疯狂产产出,随着你越来越熟悉,你的点子就会越来越多。
此外,尽量避开热门期刊的上半年的毕业季(1到5月)和下半年的饱和期(8到11月,上半年收稿收够了,不够年底会冲业绩),这个规律主要是在MDPI比较明显,其他的有待考究。论文返修的时候,最好在截止时间的一半提交,太快会觉得你不认真改,太慢会觉得你不着急或者太拖拉。
顺带一提,有实力(院校级别高,导师关系硬)的组可以冲一二二区,有钱的组可以冲开源二三区,散养富哥可以冲开源三四区,散养赌徒可以冲便宜的小众开源四区和中文EI期刊的英文版且冲量(赌能拿国奖回血,研一也可以水一篇水北核拿一等做赌资,疯狂缝论文,主打一个不要脸)。
以下行为坚决反对:不想努力的富哥氪金让别人给你写(小心被人骗钱),又菜又穷又想水毕业的看看你研三的师兄能不能帮你水一篇,奖学金全给他(啥也不懂也不努力就想混毕业,做梦去吧)。
最后,你的科研大概率是没办法给你工作方面助力的,只是让人看起来硕士期间确实做了点东西,但能不能匹配岗位需求,还需要额外作准备,比如学习目标岗位的知识技能,找目标岗位的实习,做目标岗位相关的项目(熟悉或复现开源项目+也算,重点是问到都能说出点东西来),早些规划早做准备,毕竟这是往后余生为数不多能逆风翻盘的机会。

6.论文要规范

今天给同学看了一下论文,感觉还是很头疼的,一眼看上去就像是东拼西凑的论文,大家写论文还是要以sci一区或中文ei里写得好的论文作为基础,模仿别人的写作风格,有些比较一般的期刊,写的真的挺不规范的,只要写规范了,像模像样的,录用几率也会大很多啊。
这次看了另一个同学的论文,整体上看出来是照着顶会的风格去写的,实验各方面也基本很完整,效果也可以,但是投稿了两三个二三区一直被说创新不足,我个人觉得,主要还是方法一眼看过去就是那种缝合怪,图也画得不优雅,太随意了,也不是说分支多了,乱七八糟各种东西怼上去有效果了就能发了,在前几年确实能发,今年感觉还需要有个明确的主题,你的方法也需要能体现出这个主题,也就是核心故事。
这个主题要跟咱们以前写作文一样,讲究中心论点,前后一致,所有的部分都是为了更好的解释这个主题所展开的。尽管我们的东西可能是缝缝补补的,但是也要像以前写作文一样,尽量往主题上靠。核心故事要提前想好,然后再套进我们熟悉的框架里,再细化里面的具体模块。
随便讲几个我记得起来的故事,比如结构重参数化(甚至从2d推广到3d也可以,一样的套路,需要小改代码),大核卷积,扩散模型+(因为是热点,热点自身也是好故事),神经辐射场nerf+,高层视觉任务驱动,双稀疏xx注意力(忘记叫啥了,就是自己提出来的随插随用的注意力机制模块),mamba(24年的VIT式新热点),提示学习(文本提示生成图像,多模态方面的,应用到自己领域)。甚至热点+热点,就看自己的脑子了。
多看点别的领域的顶刊顶会,学习他们是怎么讲好他们的故事的,尤其是那种方法不复杂创新比较新颖的论文,好好模仿他们的写作逻辑、画图风格、实验设置等。没办法,人太多了,不得不更卷。

7.流程要规范

其实总结来说,我们这样做下来,就跟规范搞学术是一样的,只不过咱们更有技巧,知道哪些部分是可以从别的领域借鉴想法,甚至抄过来小改,而不是完全自己想出来一个东西,有时候自己想出来的老师又会说没有设计依据和理论基础。
这样搞出来的东西很容易上头,觉得自己很牛逼,甚至可以发一二区、发三四区很可惜,首先冷静一下,这是你拼凑别人的创新,其次你不一定有这样的平台(尤其是双非、散养硕,导师认识领域大牛或者在学术圈混得不错可以试试),咱们的目标就是早点达到毕业要求,早点去实习,顺带拿一下奖学金,组里没怎么发过一二区sci的话,三区是性价比很高的,一二区正常投稿周期太长了,没人给你加急审稿真的太难了。
再次重申一遍,整个流程是在规范科研的基础上的技巧,本人反对一切数据造假的行为。我们可以借鉴相似领域的思路,可以在前人的基础上缝缝补补,但绝不能是相同领域内的抄袭,更没有随随便便就能水出来的论文!一定是熟悉完整实验写作流程,每一部那分都是我们自己亲手完成的。
华中农大的勇士值得我们钦佩,后续无疑我们的毕业难度会更大,但是没关系,我们可以问心无愧,本就应该是达到水平的学生就能毕业,而不是靠导师关系便,私下相互打好招呼放水互相保学生,随便水水专利和水刊就能混毕业,让导师没关系的学生拉去垫底二辩。

8.课题方向选择

有不少同学问我的问题是关于课题方向选择方面的,导师放养,实验室没啥条件,统一回复一下,要考虑以下方面:

1.方向的热度

常规的做法就是最近一两年的CVPR里找你预想的方向有没有人做,因为里边基本都是开源代码,顺带解决下一个方面的顾虑。

2.实验(开源)代码的完整性

除了在顶会论文上,还要考虑顶刊论文的开源代码,意味着你有很多多考的榜样,可以去学习和模仿。

3.时间资金硬件方面

时间主要体现在你的个人计划,要不要读博,最低需要什么么级别的论文,需不需要短时间内产出。资金主要是论文版面费是否报销,如果租云服务器是否报销。这种中任务最少需要什么硬件平台,也是涉及钱的问题。

4.行动力很重要

最近在写毕业论文,写得很痛苦,因为前期发小论文的时候没有注意大论文框架问题,第一篇小论文问题不大,第二篇的时候,就应该开始考虑你的大论文要怎么写了,规划好这两三个研究点,分别解决什么问题,是独立问题,还是继续改进的递进关系,还是其他的,这个逻辑关系要规划好,多看看博士论文是怎么规划的,硕士论文可能都没注意这个问题。
千万要注意这个问题,不然研三的寒假,又要写大论文,又要备考,又要找工作,大论文磨磨蹭蹭蹭都写不好。还有开题和中期报告的国内外研究现状,一定要好好写,别老想着不查重去抄别人的综述,写好了后面直接就可以粘到大论文里了。也别老抄上一届的,查重一更新,抽检就出问题。
散养的学生通常都是没有老师给你规划大论文框架,要想后期时间紧迫的时候压力没那么大,就要前期做好这些工作,切记!!!

9.关键靠自己

前期入门可以找师兄师姐同学网友等帮忙,让你更快熟悉你的课题,后期还是需要多实践,多思考,不断改进你的方法,最后找榜样模仿,重复流程,多尝试和产出,敢于投稿(导师卡论文的真没办法,谁让你头铁要选,想办法满足最低毕业条件吧,该发疯还是要发疯)。
别问我推荐什么方向,我肯定是推荐我自己的方向啊,现在啥方向都卷,硬要做很卷的方向也能发论文的,都需要更多的尝试和思考而已。难不难是相对的,问就就是都有难度。你自己的课题你自己负责,你导只有监督作用,不会手把手教你,放养且给钱的导才才是真正的好导。
如果有段时间会因为想创新点而睡不着的时候,那你就很快要变强了。多跟别人学术交流,碰撞想法,坚持看更多的领域的论文,你会发现,大家都是在努力包装自己做的破烂,只有少数人才是真的做科研,而我们只需要做大多数人就好了。

推荐阅读

    江大白  | 这些年从0转行AI行业的一些感悟

    AI项目应用 | 万字长文教你一步步实现离岗识别


    AI行业大家有想问的,欢迎来《AI未来星球》,一起成长
    扫描下方二维码即可加入~


    你可以获得什么? 

    1、AI行业创业/工作/生活中遇到的各类问题,都可获高质量解答, 有效期一年,无限次提问,有问必答。

    2、购买过的,数万元的各类数据集的分享;

    3、定期邀请AI行业各类嘉宾分享,创业/商业等方面的经验!

    4、AI行业研发、产品、商业落地方面专业分享(大白主业,也在负责公司AI业务板块)

    帮助你解决遇到的实际问题,升职加薪!

    大家一起加油! 

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177095
 
79 次点击