找回密码
 立即注册
查看: 504|回复: 0

文心一言 VS ChatGPT 实力测评,谁更胜一筹?

[复制链接]

1

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2023-7-19 09:58:50 | 显示全部楼层 |阅读模式


等了好几个月,终于拿到了百度文心一言的试用资格。话不宜迟,我们就快点试用下吧,也可以与ChatGPT对比下效果。
1、有了试用资格后,在电脑上登录百度,就可以看到多个一个按钮。测试了在手机浏览器上访谒百度网站没有按钮呈现,看来目前只开放了网页版。而且通过百度手机助手下载到的app版本登录不异账号居然还要插手等待list,所以手机端的体验只能再等等了。



2、点击AI按钮后,进入文心一言的首页。



作图


3、文心一言对比于ChatGPT最大的优势就是多模态模型,ChatGPT是基于GPT3.5的,所以只能输入输出文字。文心一言却可以输出图片,这点是与ChatGPT plus(基于GPT4.0)是一样的。还有一点,文心一言可以语音输入和语音输出,相当于把语音识别也做进来了。
那么我们就来尝尝文心一言的出图功能。我试了一个经常在文心一格里使用的提示词范本:港口、船只、日落、斑斓的光线、黄金时刻、超现实主义、聚焦的、细节丰硕的,电影画质,杰作,16:9。效果如下:



效果还不错,但是貌似图片大小被固定在了512*512像素。我们按照提示在成果加上了#创意图#,再看看新的效果:



感觉出图的质量还是挺不错的。文心一言号称可以用更简短的提示语,或者自然语言可以出高质量的图,那么我们就把提示词再简化一下: 黄昏,港口上有艘船#创意图#。效果如下:



意境貌似没有上两幅好,不外也还是不错的效果,看来文心一言的出图能力还是斗劲OK的。

作诗


4、我们再来查验一下它的诗歌创作能力,我们知道,为了让AI模型更好地回答我们,我们凡是要遵循必然的提问形式,即:【角色定位】+【问题描述】+【等候成果】+【补充说明】,所以指定角色是第一步很关键,让AI模型给出更准确地回答。我问他:我但愿你扮演诗人的角色。你将创作能够唤起情感并有力地触动听们心灵的诗歌。可以写任何主题或主题,但请确保你的文字以斑斓而有意义的方式传达你想要表达的感觉。你也可以想出短小精悍的诗句,这些诗句足以在读者心中留下深刻的印象。我的第一个要求是我需要一首反映人工智能科技高速成长,促进人们的工作生活更美好的七言绝句古诗。
它的回答是:



貌似文学性不是很强,不外整体还算押韵。我也对比了不异的问题ChatGPT的回答:



ChatGPT貌似更愿意多写一些,古诗创作上略胜一筹。
我改了改,让文心一言写一首关于爱情的现代诗歌,效果如下:



比古诗效果更好一些,也算是掰回了一局。

代码生成


5、接下来我们看下代码生成的效果,我先按照文心一言保举的样式写了一个要求:写一段排查网络安全的代码。



这段代码及说明还是挺清晰的。
6、接下来我又指定了一个任务:
请帮我生成一段python代码,可以自动找到在Windows10系统的指定目录下 (包罗目录下的子目录) 占用硬盘空间最大的五个文件的地址路径和文件大小 (单元为GB)。
文心一言这个时候不知道是怎么了,我测验考试了多次,其输出的代码都没有写完,写到一半就莫名结束了。而且生成代码的速度相对来说没那么快,估计要思考个5-6秒摆布。



同样的问题我问了下ChatGPT,速度很快,2秒内,而且代码完整:



看来在代码生成方面,文心一言是具备,但是还需要更多的数据训练得更成熟些。

回答历史



7、文心一言的优势应该是对中文资料的收集,所以我们还是提一个和中国有关的问题给它吧:你是一个历史学家,请列举中国5000多年以来每个朝代的一位杰出君主的事迹,每个朝代请列举出一位,以及说明下他做的事迹,不要遗漏朝代。



回答成果看来是答得不错,从夏朝一直追溯到了清朝,主要的统一朝代都提到了,所以如果有关中国相关的问题,尽管问文心一言就好了。

写小说


8、出于好奇心,我还想尝尝它写小说的能力,于是我设定了一个标题问题:我但愿你扮演小说家的角色。你将构思出引人入胜的故事情节,吸引读者长时间阅读。你可以选择任何流派,如奇幻、浪漫、历史小说等,但方针是写出具有杰出情节、引人入胜的角色和意想不到的飞腾的作品。我的第一个要求是“我需要写一部设定在未来的科幻小说,描述人类已经探索到了宇宙的边界,并发现了穿越到另一个多元宇宙的世界。



还是有些情节的,但是还少了些对话,我们让它补上:



还可以,我们再让它扩写些内容:



嗯,立意还是不错的,强调了分歧文明、宇宙之间的互相学习、和平友谊。
作为对比,我们再来看看ChatGPT的回答:



对比来看,个人感觉ChatGPT的回答细节更丰硕些。文心一言更像是指导人写作,而ChatGPT是直接给出了作品的一部门细节。在这点上,见仁见智。

灵感中心


9、最后,如果我们不知道问什么好的时候,我们可以打开“灵感中心”页面,里面有什么预置的功能,可以快捷提问。种类十分丰硕,也浮现了文心一言也如其他语言大模型一样,可以做得事情非常多,多到只有想不到,没有做不到。



我随便试了一个功能:“一键画出戴珍珠耳饰少女的各种状态”的绘画功能,对比于通用的绘图功能,这个小功能限定绘图范围在世界名画《戴珍珠耳饰的少女》内。



大师可以看看效果:
(1)提示词:带着眼镜看手机



(2)提示词:穿戴阿根廷球衣喝着可乐



(3)提示词:穿戴中国唐装,头戴发髻,手上拿着扇子



还是蛮有意思的,更多功能大师可以本身探索。

总结


最后总结下,文心一言是一个号称有2600亿参数的多模态大模型,对比于ChatGPT是1750亿参数的语言大模型,但对比于GPT4.0有着8个2200亿参数的多模态模型而言,还是有必然差距,我们测验考试了文心一言的出图、诗歌创作、代码生成、回答历史、写小说等功能,仅仅是冰山一角,和ChatGPT对比也互有胜负,作为国内AI界研发投入最大的科技公司,百度的努力我们还是肉眼可见的,但愿我们的国货产物能够不竭努力,早日达到国外先进水准。我们也可以多用起来,因为大模型使用得越多,从反馈学习的角度来看,其效果是会越来越好的。
#AI东西保举#
更多内容,欢迎存眷微信公众号:吴言不语零一二三

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-11-24 22:42 , Processed in 0.058600 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表