文心一言 VS ChatGPT 实力测评,谁更胜一筹?
等了好几个月,终于拿到了百度文心一言的试用资格。话不宜迟,我们就快点试用下吧,也可以与ChatGPT对比下效果。
1、有了试用资格后,在电脑上登录百度,就可以看到多个一个按钮。测试了在手机浏览器上访谒百度网站没有按钮呈现,看来目前只开放了网页版。而且通过百度手机助手下载到的app版本登录不异账号居然还要插手等待list,所以手机端的体验只能再等等了。
http://pic2.zhimg.com/v2-1cd2e1d941dbe8b992654080fc774c71_b.jpg
2、点击AI按钮后,进入文心一言的首页。
http://pic2.zhimg.com/v2-207cb05562d264c4c0ae3d5091b29619_b.jpg
作图
3、文心一言对比于ChatGPT最大的优势就是多模态模型,ChatGPT是基于GPT3.5的,所以只能输入输出文字。文心一言却可以输出图片,这点是与ChatGPT plus(基于GPT4.0)是一样的。还有一点,文心一言可以语音输入和语音输出,相当于把语音识别也做进来了。
那么我们就来尝尝文心一言的出图功能。我试了一个经常在文心一格里使用的提示词范本:港口、船只、日落、斑斓的光线、黄金时刻、超现实主义、聚焦的、细节丰硕的,电影画质,杰作,16:9。效果如下:
效果还不错,但是貌似图片大小被固定在了512*512像素。我们按照提示在成果加上了#创意图#,再看看新的效果:
http://pic2.zhimg.com/v2-9ef1002a50b7c2791ae262f2222585fd_b.jpg
感觉出图的质量还是挺不错的。文心一言号称可以用更简短的提示语,或者自然语言可以出高质量的图,那么我们就把提示词再简化一下: 黄昏,港口上有艘船#创意图#。效果如下:
http://pic2.zhimg.com/v2-8332a7c4ef77da83b00bd7fc97e58421_b.jpg
意境貌似没有上两幅好,不外也还是不错的效果,看来文心一言的出图能力还是斗劲OK的。
作诗
4、我们再来查验一下它的诗歌创作能力,我们知道,为了让AI模型更好地回答我们,我们凡是要遵循必然的提问形式,即:【角色定位】+【问题描述】+【等候成果】+【补充说明】,所以指定角色是第一步很关键,让AI模型给出更准确地回答。我问他:我但愿你扮演诗人的角色。你将创作能够唤起情感并有力地触动听们心灵的诗歌。可以写任何主题或主题,但请确保你的文字以斑斓而有意义的方式传达你想要表达的感觉。你也可以想出短小精悍的诗句,这些诗句足以在读者心中留下深刻的印象。我的第一个要求是我需要一首反映人工智能科技高速成长,促进人们的工作生活更美好的七言绝句古诗。
它的回答是:
http://pic2.zhimg.com/v2-3d248c151b106eeeb725b724ded40cd1_b.jpg
貌似文学性不是很强,不外整体还算押韵。我也对比了不异的问题ChatGPT的回答:
http://pic4.zhimg.com/v2-b75a399d8c36aca47ef09429a59074d3_b.jpg
ChatGPT貌似更愿意多写一些,古诗创作上略胜一筹。
我改了改,让文心一言写一首关于爱情的现代诗歌,效果如下:
比古诗效果更好一些,也算是掰回了一局。
代码生成
5、接下来我们看下代码生成的效果,我先按照文心一言保举的样式写了一个要求:写一段排查网络安全的代码。
http://pic4.zhimg.com/v2-4dc1e38705b3247258c7fac0ac98d46f_b.jpg
这段代码及说明还是挺清晰的。
6、接下来我又指定了一个任务:
请帮我生成一段python代码,可以自动找到在Windows10系统的指定目录下 (包罗目录下的子目录) 占用硬盘空间最大的五个文件的地址路径和文件大小 (单元为GB)。
文心一言这个时候不知道是怎么了,我测验考试了多次,其输出的代码都没有写完,写到一半就莫名结束了。而且生成代码的速度相对来说没那么快,估计要思考个5-6秒摆布。
http://pic4.zhimg.com/v2-56a62fe5879d4e0cc187826e66cc6e23_b.jpg
同样的问题我问了下ChatGPT,速度很快,2秒内,而且代码完整:
http://pic4.zhimg.com/v2-ca40d1944c805968a65cb57a6cdb8c23_b.jpg
看来在代码生成方面,文心一言是具备,但是还需要更多的数据训练得更成熟些。
回答历史
7、文心一言的优势应该是对中文资料的收集,所以我们还是提一个和中国有关的问题给它吧:你是一个历史学家,请列举中国5000多年以来每个朝代的一位杰出君主的事迹,每个朝代请列举出一位,以及说明下他做的事迹,不要遗漏朝代。
http://pic4.zhimg.com/v2-275e16684b156aa496485ecc48083173_b.jpg
回答成果看来是答得不错,从夏朝一直追溯到了清朝,主要的统一朝代都提到了,所以如果有关中国相关的问题,尽管问文心一言就好了。
写小说
8、出于好奇心,我还想尝尝它写小说的能力,于是我设定了一个标题问题:我但愿你扮演小说家的角色。你将构思出引人入胜的故事情节,吸引读者长时间阅读。你可以选择任何流派,如奇幻、浪漫、历史小说等,但方针是写出具有杰出情节、引人入胜的角色和意想不到的飞腾的作品。我的第一个要求是“我需要写一部设定在未来的科幻小说,描述人类已经探索到了宇宙的边界,并发现了穿越到另一个多元宇宙的世界。
还是有些情节的,但是还少了些对话,我们让它补上:
http://pic4.zhimg.com/v2-5bfc5493e759058eafc4b1cbeb78cabf_b.jpg
还可以,我们再让它扩写些内容:
嗯,立意还是不错的,强调了分歧文明、宇宙之间的互相学习、和平友谊。
作为对比,我们再来看看ChatGPT的回答:
http://pic2.zhimg.com/v2-fdd23a61fadeb25e0a6c1fec00db3b25_b.jpg
对比来看,个人感觉ChatGPT的回答细节更丰硕些。文心一言更像是指导人写作,而ChatGPT是直接给出了作品的一部门细节。在这点上,见仁见智。
灵感中心
9、最后,如果我们不知道问什么好的时候,我们可以打开“灵感中心”页面,里面有什么预置的功能,可以快捷提问。种类十分丰硕,也浮现了文心一言也如其他语言大模型一样,可以做得事情非常多,多到只有想不到,没有做不到。
http://pic4.zhimg.com/v2-a1e1788431d2e50748df05fe0618ae4f_b.jpg
我随便试了一个功能:“一键画出戴珍珠耳饰少女的各种状态”的绘画功能,对比于通用的绘图功能,这个小功能限定绘图范围在世界名画《戴珍珠耳饰的少女》内。
http://pic2.zhimg.com/v2-ede6c2b7243d449f1127b239a7160995_b.jpg
大师可以看看效果:
(1)提示词:带着眼镜看手机
(2)提示词:穿戴阿根廷球衣喝着可乐
(3)提示词:穿戴中国唐装,头戴发髻,手上拿着扇子
还是蛮有意思的,更多功能大师可以本身探索。
总结
最后总结下,文心一言是一个号称有2600亿参数的多模态大模型,对比于ChatGPT是1750亿参数的语言大模型,但对比于GPT4.0有着8个2200亿参数的多模态模型而言,还是有必然差距,我们测验考试了文心一言的出图、诗歌创作、代码生成、回答历史、写小说等功能,仅仅是冰山一角,和ChatGPT对比也互有胜负,作为国内AI界研发投入最大的科技公司,百度的努力我们还是肉眼可见的,但愿我们的国货产物能够不竭努力,早日达到国外先进水准。我们也可以多用起来,因为大模型使用得越多,从反馈学习的角度来看,其效果是会越来越好的。
#AI东西保举#
更多内容,欢迎存眷微信公众号:吴言不语零一二三
页:
[1]