
GPT-4o 的生图以及修图功能一上线就惊艳四座,据称他们的模型集理解和生成一体,因此除了能更好的遵循指令,而且生成的图像指令非常高,可以说把大模型生图的能力又提高到一个新的水准。除了官方公布的案例,社交媒体上涌现出了大量优秀的作品,本文就结合网上一些经典的案例来看看它到底有多厉害。【多图预警】
下面这张图非常专业,没有很深厚的 Photoshop 基础,一般人根本做不出来:

那么它的原图是怎么样的?请看下图,这里只给了 ChatGPT 一个指令就生成了上面这张专业的产品图。

生成广告图、海报图是一个刚需,这个事情说实话比较专业,一般人根本无法胜任,到现在的 AI 工具似乎轻松就给你搞定了。如下,只要把两张图提交给 ChatGPT,然后说明你的需求就可以了。

生成的广告图非常专业:

类似的案例还有:

可以说,ChatGPT 已经破解了产品图/广告图的制作魔法:

产品,加上使用场景才是用户真正想看到的,对此,4o 表现得 so easy:

做海报图(或广告图)有时候会出现问题,比如 GPT 会拒绝生成一些品牌名。下面这个作者在生成一个书籍封面,GPT-4o 拒绝生成 O'REILLY,因为版权,他聪明的改成了 OH REILLY,感觉更有趣了:

所以,同时绕过大模型的提示词(或越狱)有很多方法,读者可以自己去摸索。
通过简单的提示(或指令)就能生成非常专业的图文海报/产品图,甚至于直接达到了商用级别,姑且不论是否能替代专业设计师,但起码能做到一点:就是让普通人也能做一些看起来专业的设计工作了,这或许就是 AI 平权或者说 AI 赋能。
风格修改,特别是改成动漫风格是大众喜闻乐见的事情。这方面 GPT-4o 也是异常优秀。比如原图:

改成动漫风格后:

这样的例子非常多

有人已经结合这些技术(加上 Logo)来做广告了,不得不服:

下面这张图,不用贴原图了吧,看完还是令人唏嘘:

千万不要误会它只能将图片转成动漫,GPT-4o 直接生成动漫风格图片也是非常强大的:


将照片改成动漫非常有趣,但有些时候反其道行之,将插图改成真实图片就更加别具一格,毕竟真实感往往蕴含更多的信息量和想象空间:

爆改图片现在又玩出了新的高度,如果说以往的爆改只是针对单张图,那么现在都能爆改成故事片了。我们从蒙娜丽莎说起:

爆改成

但缺少一点现场感和真实感,于是继续:

再来一个自拍的角度:

到这里,感觉自己已经在第一现场了。修图已经变成了这些大语言模型的基操:


下面这个图就比较神奇,加了一个爱因斯坦,它居然是直接把其中一个人替换掉,如果它不替换直接加,那就牛逼了。(一般设计师也很难做到😭)

有一类图信息量非常大(infographics),经常用来做展示、教学或者放到自己的 PPT、视频里面 里面,但这种图一般人根本做不到,因为太专业了。但 4o 让这张图风靡起来了:



说到教学,我偶尔会教小朋友画简笔画,但我们找到的简笔画的图很少有带步骤的,而 4o 居然可以帮你做到这个:

寓教于乐还有一个有趣的方面是把解剖图画出来,并且标记出每个部分,这样的图我们常在课本插图里面看到,现在 ChatGPT 能帮你生成了:


前面看了那么多例子,别以为它只能生成英文的,中文也 OK 的:

该图来自@hahagood,可以看到意境不错,文字略有瑕疵,用过这类功能的朋友应该知道,豆包/即梦在文字上也有这样的问题。
可能因为在早期,GPT-4o 目前的监管约束相对宽松,可以直接生成一些名人的图,比如这个:

© AI范儿
要进“交流群”,请关注公众号获取进群方式
投稿、需求合作或报道请添加公众号获取联系方式