如何评价百度文心一言绘图疑似中译英再绘制?
百度文心一言的绘画功能对中文的理解,疑似是把中文翻译成英文以后再作为prompt绘制的比如:车水马龙、红烧狮子头、驴打滚、总线(BUS) 看起来是百度对英文tag做了一些奇妙的处理变成中文之后再训练的模型?
butter + fly = 黄油 + 苍蝇 + 蝴蝶
air + port = 飞机 + 港口
飞机和鸟混到了一起,船和飞机混到了一起,非常神奇…
直接翻译成英文应该是不会出现这种情况的? 估计文心一格团队连夜改代码了,目前(3月23日12:50)“一可以豆子”“一可以牛肉”“大山雀”“总线”“起重机”均恢复成本来意思。
但是有些图依然有错,“土耳其张开翅膀”:
“中国论文”:
“树叶封面苹果”:
只能说还是先把中文翻译成英文然后再抓国外的素材库吧。建议百度再练练。
一可以豆子的图我就收了,挺好看的: 松鼠“撅”鱼
至少模型对中文的见解十分独到幽默( 虽然没有拿到文心一言的测试资格(还在等待中),不过呢,由于文心一言的画图功能其实是直接调用的文心一格的,所以理论上来说,我们可以在文心一格中做一些测试,来验证这个猜想。下面是我尝试的一些测试样例。
有兴趣的朋友也可以在这个链接下做一样的测试:文心一格 - AI艺术和创意辅助平台
首先,先来在某种程度上证明一下文心一言调用的就是文心一格的作图功能。
下面是网传的文心一言作图“胸有成竹的男人”
文心一言
下面是文心一格的“胸有成竹的男人”
文心一格
可以看出,作画的逻辑基本上是一样的,而且甚至脸画得都差不多。
那么……下面就用文心一格来验证一下,到底文心一言的绘图到底是不是中译英再绘制的呢?
测试思路:
首先,我们需要一个单词,翻译出来会有两种不同的意义,而且最好都是名词,来方便AI绘制。
而且,这个单词还需要满足,它的两种意义里面,一个比较常用,另一个稍稍生僻一些,这样,在翻译过后,可以确保AI会以最常用的意义来绘制。一旦画出来的结果和中文完全对不上,但是却满足了英文单词的意思,就能确定文心一言确实是通过中译英后再绘制的。
简单想了想,我觉得可以用doctor(博士、医生)和spring(春天、喷泉、弹簧)来进行测试。
这里,我们要选用使用稍微低频的“博士”、“弹簧”来让AI绘制。
假如AI画博士却画出了医生(博士→doctor→医生),画弹簧却画出了春天(弹簧→spring→春天),我想大家心里应该也有了答案。
下面是测试结果。
文心一格使用中文“弹簧”后绘制出的图片
文心一格使用中文“博士”后绘制出的图片
至于……到底是怎么回事呢……那就留给其他大佬做说明吧。 汉译英再画图已经石锤了,请诸位看百度表演
当然,底层用的是国外框架或者英文图料不得而知
1、mouse 老鼠/鼠标无法区分
2、doctor医生/博士无法区分
3、table桌子/表格无法区分
4、你打破了我的大门 老鼠!、
-------------------------------------------------------------------------------------------------------------
截止至2023年3月24日00:17:03根据评论更新回答
5、画出麦德隆和赛百味
正确率:基本无害
6、一张关在笼子里的封条
seal 海豹/封条不能区分
正确率:玩得开心
7、爱国群众
正确率:过度拟合
8、爱国青年
正确率:正确
9、松鼠鳜鱼
正确率:基本无害
10、引用 zighouse 回复“请画一幅画,把鼠标放在表格上”
请画一幅画,黑板
正确率:过度拟合
画一幅画,黑板
正确率:正确
11、一可以豆子
正确率:可以
12、云中的平面
plane 平面/飞机不能区分
正确率:飞的开心
游客和平面
正确率:游得开心
13、鸡你太美
正确率:完美
页:
[1]