-问:大家怎么看这两篇文章中关于王迁老师AIGC讲座的实验及回应?
问题:
复现AI“文生图”,发掘一点与王迁教授讲座中的不同事实
复现AI“文生图”第二弹,“物理学”又完蛋了?
回应:
回应《复现AI文生图发掘一点与王迁教授讲座中不同的事实》
-答1:建议他去了解下stable diffusion的原理,再做实验。
-答2:观点可以有差异,但赞同正反双方的实证主义的态度和方法。
-答3:王老师还是以作品为起点反推作者,只能说 也是一种分析路径。但是对于越来越复杂的创作环境,有点太单一了。
-答4:有一点是没问题的,创作的表达主要是AI贡献的。
-答5:赞同。不能因为想赋权、又无法突破“权利主体是人”的现有法律原则,就非要否定这点。削足适履不可取。另外,需要讨论(fansi)一下,如果著作权法在“AI生成物的可版权性”问题上如此激进,非要对生产边际成本递减接近零的生成物实施强版权保护,这背后到底是谁的诉求、保护了谁、损害了谁?如此“赋权”是生产关系调整和权利配置的真实需要么?想想就脑袋大,不能只图一案判决一时爽啊。
-答6:现在有的法院喜欢卷所谓的“第一案”,一旦如此,会坏了司法水源。
-答7:理论上讲就是对算法做可复现性分析。这里主要涉及到随机数传递、计算近似和算子原子性三个方面。随机数传递大概来说,就是是不是用的同一种方法来生成随机数,然后生成的结果是不是在整个计算过程里一直传递下去。如果方法不同或者结果不传递,就会影响复现。计算近似是一些特别消耗时间或者空间的计算操作,比如说稀疏矩阵的相乘,具体执行的时候要和硬件协同做很多优化,特别是GPU并行计算时的优化。这时候的优化很多时候都会放弃少许的确定性。算子原子性更加复杂,简单来说就是特定的硬件,比如说英伟达的卡,特定的卷积算子都在内在地有随机性的。并行计算优化或者调用有关算子都会引入随机性。随机数传递引入的随机性一般可以通过设置全局传递来解决。计算近似或者原子性引入的随机性只能通过更换实现方法来解决。Stable Diffusion的不可复现性,包括CPU和GPU之间的差别基本就是这些来源。深入做复现实验也是相应的思路。
-答8:第一案这样弄完法官压力估计更大了,社会舆论四起,翻盘也极有可能。
-答9:第一案已经没得翻了,除非法院自己提起再审,“AI文生图”著作权案一审生效。
-答10:还有一层,就是如果中国成了AI版权的洼地,而这个欧美又不被承认AI生成物的版权,然后会发生啥。
-答11:如果不从作品反推,而是从作者这一侧正向推导。那创作确实不是简单几条指令,提示词的设置和调整非常复杂,创造性不低。而且增减提示词没有那么容易,软件创造的门槛不靠抄提示词不行。边际价值保护的是什么,应该是作者思考和创作的成本,这个时代的创作从调教画笔变成了调教软件。从传统创作变成了软件创作。不过赋权确实太先锋了,而且在判决中显得没有必要.. 也确实带来了上面的问题。
-答12:Hugging Face有一篇Create Reproducible Pipelines,原理讲得不多,但给了可复现Stable Diffusion的完整解决思路。Stable Diffusion和Transformer的可复现性分析都是可实现的,只是做起来确实麻烦。之后如果考虑AIA的GPAI部分,有些内容也算是密切相关。如果用了硬随机确实如此,不过这个真就是数字艺术了。
-答13:但是工具发展的方向是越来越“傻瓜式”的,必然是让越来越多人更容易去生成。复杂的提示工程并非主流。在这个背景下,提示词要产生独创性还是很难得,美国版权局也坚决否认提示词能产生生成作品的独创性。
-答14:嗯嗯,退一步来说,即使承认提示词有独创性,独创性的高低也值得考量,未来AI工具越来越用户友好后(类比傻瓜相机),提示词会越来越简单,未来可能也会出现许多“提示词指南”作为辅助。
-答15:像那种生成一只打伞的龙猫,这种提示词,应该认为是比较低级的,未来如果都是这种提示词,另当别论。但现在Stable Diffusion这种,挺复杂的,需要反复调,他不是那种有个操作界面的这种,区别不亚于从DOS到有了Win。对于这种使用有门槛 输出有价值的软件创作,我个人感觉还是值得保护。如果未来高级了,都傻瓜了,那就另案调整被。
-答16:身边不少用AI搞创作的朋友就是这样的想法,现在用的提示词还是很复杂的,要反复修正才能达到自己想要的效果,所以他们看到第一案的结果都比较开心。
-答17:可不。如果按照咱们生图第一案的“创作”标准,米国版权局就得马上立刻毫不犹豫给予版权登记,而不是三番四次予以驳回。
总结:立法缺位,司法造法。版权洼地深入想想还挺麻烦。