文心一言 VS ChatGPT 实力测评，谁更胜一筹？

327473645 发表于 2023-7-19 09:58:50

等了好几个月，终于拿到了百度文心一言的试用资格。话不宜迟，我们就快点试用下吧，也可以与ChatGPT对比下效果。
1、有了试用资格后，在电脑上登录百度，就可以看到多个一个按钮。测试了在手机浏览器上访谒百度网站没有按钮呈现，看来目前只开放了网页版。而且通过百度手机助手下载到的app版本登录不异账号居然还要插手等待list，所以手机端的体验只能再等等了。

http://pic2.zhimg.com/v2-1cd2e1d941dbe8b992654080fc774c71_b.jpg

2、点击AI按钮后，进入文心一言的首页。

http://pic2.zhimg.com/v2-207cb05562d264c4c0ae3d5091b29619_b.jpg

作图

3、文心一言对比于ChatGPT最大的优势就是多模态模型，ChatGPT是基于GPT3.5的，所以只能输入输出文字。文心一言却可以输出图片，这点是与ChatGPT plus（基于GPT4.0）是一样的。还有一点，文心一言可以语音输入和语音输出，相当于把语音识别也做进来了。
那么我们就来尝尝文心一言的出图功能。我试了一个经常在文心一格里使用的提示词范本：港口、船只、日落、斑斓的光线、黄金时刻、超现实主义、聚焦的、细节丰硕的，电影画质，杰作，16:9。效果如下：

效果还不错，但是貌似图片大小被固定在了512*512像素。我们按照提示在成果加上了#创意图#，再看看新的效果：

http://pic2.zhimg.com/v2-9ef1002a50b7c2791ae262f2222585fd_b.jpg

感觉出图的质量还是挺不错的。文心一言号称可以用更简短的提示语，或者自然语言可以出高质量的图，那么我们就把提示词再简化一下：黄昏，港口上有艘船#创意图#。效果如下：

http://pic2.zhimg.com/v2-8332a7c4ef77da83b00bd7fc97e58421_b.jpg

意境貌似没有上两幅好，不外也还是不错的效果，看来文心一言的出图能力还是斗劲OK的。

作诗

4、我们再来查验一下它的诗歌创作能力，我们知道，为了让AI模型更好地回答我们，我们凡是要遵循必然的提问形式，即：【角色定位】+【问题描述】+【等候成果】+【补充说明】，所以指定角色是第一步很关键，让AI模型给出更准确地回答。我问他：我但愿你扮演诗人的角色。你将创作能够唤起情感并有力地触动听们心灵的诗歌。可以写任何主题或主题，但请确保你的文字以斑斓而有意义的方式传达你想要表达的感觉。你也可以想出短小精悍的诗句，这些诗句足以在读者心中留下深刻的印象。我的第一个要求是我需要一首反映人工智能科技高速成长，促进人们的工作生活更美好的七言绝句古诗。
它的回答是：

http://pic2.zhimg.com/v2-3d248c151b106eeeb725b724ded40cd1_b.jpg

貌似文学性不是很强，不外整体还算押韵。我也对比了不异的问题ChatGPT的回答：

http://pic4.zhimg.com/v2-b75a399d8c36aca47ef09429a59074d3_b.jpg

ChatGPT貌似更愿意多写一些，古诗创作上略胜一筹。
我改了改，让文心一言写一首关于爱情的现代诗歌，效果如下：

比古诗效果更好一些，也算是掰回了一局。

代码生成

5、接下来我们看下代码生成的效果，我先按照文心一言保举的样式写了一个要求：写一段排查网络安全的代码。

http://pic4.zhimg.com/v2-4dc1e38705b3247258c7fac0ac98d46f_b.jpg

这段代码及说明还是挺清晰的。
6、接下来我又指定了一个任务：
请帮我生成一段python代码，可以自动找到在Windows10系统的指定目录下 (包罗目录下的子目录) 占用硬盘空间最大的五个文件的地址路径和文件大小 (单元为GB)。
文心一言这个时候不知道是怎么了，我测验考试了多次，其输出的代码都没有写完，写到一半就莫名结束了。而且生成代码的速度相对来说没那么快，估计要思考个5-6秒摆布。

http://pic4.zhimg.com/v2-56a62fe5879d4e0cc187826e66cc6e23_b.jpg

同样的问题我问了下ChatGPT，速度很快，2秒内，而且代码完整：

http://pic4.zhimg.com/v2-ca40d1944c805968a65cb57a6cdb8c23_b.jpg

看来在代码生成方面，文心一言是具备，但是还需要更多的数据训练得更成熟些。

回答历史

7、文心一言的优势应该是对中文资料的收集，所以我们还是提一个和中国有关的问题给它吧：你是一个历史学家，请列举中国5000多年以来每个朝代的一位杰出君主的事迹，每个朝代请列举出一位，以及说明下他做的事迹，不要遗漏朝代。

http://pic4.zhimg.com/v2-275e16684b156aa496485ecc48083173_b.jpg

回答成果看来是答得不错，从夏朝一直追溯到了清朝，主要的统一朝代都提到了，所以如果有关中国相关的问题，尽管问文心一言就好了。

写小说

8、出于好奇心，我还想尝尝它写小说的能力，于是我设定了一个标题问题：我但愿你扮演小说家的角色。你将构思出引人入胜的故事情节，吸引读者长时间阅读。你可以选择任何流派，如奇幻、浪漫、历史小说等，但方针是写出具有杰出情节、引人入胜的角色和意想不到的飞腾的作品。我的第一个要求是“我需要写一部设定在未来的科幻小说，描述人类已经探索到了宇宙的边界，并发现了穿越到另一个多元宇宙的世界。

还是有些情节的，但是还少了些对话，我们让它补上：

http://pic4.zhimg.com/v2-5bfc5493e759058eafc4b1cbeb78cabf_b.jpg

还可以，我们再让它扩写些内容：

嗯，立意还是不错的，强调了分歧文明、宇宙之间的互相学习、和平友谊。
作为对比，我们再来看看ChatGPT的回答：

http://pic2.zhimg.com/v2-fdd23a61fadeb25e0a6c1fec00db3b25_b.jpg

对比来看，个人感觉ChatGPT的回答细节更丰硕些。文心一言更像是指导人写作，而ChatGPT是直接给出了作品的一部门细节。在这点上，见仁见智。

灵感中心

9、最后，如果我们不知道问什么好的时候，我们可以打开“灵感中心”页面，里面有什么预置的功能，可以快捷提问。种类十分丰硕，也浮现了文心一言也如其他语言大模型一样，可以做得事情非常多，多到只有想不到，没有做不到。

http://pic4.zhimg.com/v2-a1e1788431d2e50748df05fe0618ae4f_b.jpg

我随便试了一个功能：“一键画出戴珍珠耳饰少女的各种状态”的绘画功能，对比于通用的绘图功能，这个小功能限定绘图范围在世界名画《戴珍珠耳饰的少女》内。

http://pic2.zhimg.com/v2-ede6c2b7243d449f1127b239a7160995_b.jpg

大师可以看看效果：
（1）提示词：带着眼镜看手机

（2）提示词：穿戴阿根廷球衣喝着可乐

（3）提示词：穿戴中国唐装，头戴发髻，手上拿着扇子

还是蛮有意思的，更多功能大师可以本身探索。

总结

最后总结下，文心一言是一个号称有2600亿参数的多模态大模型，对比于ChatGPT是1750亿参数的语言大模型，但对比于GPT4.0有着8个2200亿参数的多模态模型而言，还是有必然差距，我们测验考试了文心一言的出图、诗歌创作、代码生成、回答历史、写小说等功能，仅仅是冰山一角，和ChatGPT对比也互有胜负，作为国内AI界研发投入最大的科技公司，百度的努力我们还是肉眼可见的，但愿我们的国货产物能够不竭努力，早日达到国外先进水准。我们也可以多用起来，因为大模型使用得越多，从反馈学习的角度来看，其效果是会越来越好的。
#AI东西保举#
更多内容，欢迎存眷微信公众号：吴言不语零一二三

页: [1]

T9AI - 深度人工智能平台's Archiver

文心一言 VS ChatGPT 实力测评，谁更胜一筹？