陈秦申 发表于 2023-5-10 14:26:35

科大讯飞 vs 文心一言,哪个是国内最强GPT?

科大讯飞近日正式发布了其最新的自然语言措置技术——星火模型。在发布会现场,对星火模型进行了多方面的实时测试,表示不俗,那么它与3月份发布的百度文心一言对比,能力怎么样呢?
下面我们通过几个问题来测试一下。
从易到难分袂提问如下。
<hr/>太阳系有几个行星?
讯飞星火


文心一言

http://pic4.zhimg.com/v2-7620242a24c18895f0b18dfa0371f50b_r.jpg
这种简单的问题,二者回答的都对,不外讯飞星火对问题进行了延伸,提供了更多的信息。
<hr/>请通俗易通的讲一下量子力学的基本道理是什么?
讯飞星火

http://pic4.zhimg.com/v2-6786bba3e9013d2a05096c2253eb6a53_r.jpg
文心一言

http://pic2.zhimg.com/v2-e80bf5dd903ec3013099f09201121e99_r.jpg
对于专业常识的理解和掌握,二者能力也相当,星火略详细。
<hr/>我想跟一个女生一起看场电影,请你保举几部,以增进感情,并说明保举理由。
讯飞星火


文心一言


情感性的问题,讯飞星火稍弱,而且总是强调本身没有情感,而文心一言的理解也有点偏差,问题是想和女生增进感情,概略率还不是情侣,而文心一言直接定义成情侣之间看电影。
<hr/>人工智能在未来会如何影响人类社会?
讯飞星火


文心一言

http://pic2.zhimg.com/v2-5410a7e294b1a035155b0d30a0ab8dd1_r.jpg
这个问题涉及未来预测和社会影响,是个开放的硬问题,回答难度较大,二者的表示都还可以,能力相当。

<hr/>一个三角形,如果一条边长为4cm,另一条边长为7cm,则第三条边最长可能是多少厘米?
讯飞星火

http://pic2.zhimg.com/v2-444fe15d458c2b8a297bebc333a44a8d_r.jpg
文心一言


这是一个简单的数学问题,但是一下子看出了二者的差距,星火模型在数学能力上表示斗劲突出,而文心一言没有理解该数学题的逻辑,而且在追问之下继续犯了底子性的运算错误。
<hr/>从以上问题的表示可以看出,对于正常的文本生成、语言理解,常识问答式,二者能力相当,不外科大讯飞在回答速度上比文心一言快很多。
对于数学推理类的问题,科大讯飞明显强于文心一言。当然文心一言也有本身的独到之处,比如画图能力,虽然经常被吐槽,但这个能力是科大讯飞现阶段所不具备的。
此刻各种大模型都声称是对标ChatGPT,那么它们与ChatGPT对比怎么样呢,我们通过一个简单的例子来测试一下:树有7只鸟,猎人开枪打死一只,请问树上还剩下几只鸟?


从这个小测试可以看出,国内大模型与GPT-4对比,还有差距,仍然需要鼎力追赶。
总体而言,科大讯飞星火模型和百度文心一言都有不凡的实力和巨大的成长前景,它们各有特点,虽然现阶段仍有不足,不外颠末不竭改良和优化,相信未来必然会阐扬越来越重要的感化。
PowerAI星球.

西域安魂曲 发表于 2023-5-10 14:27:21

ChatGPT指的是3 而不是 gpt4

逃学的龙 发表于 2023-5-10 14:27:53

这回答没发现数据从chatGPT 扒的

gk2008q 发表于 2023-5-10 14:28:40

都得都是幼儿园问题,这就超过CHATGPT了?

吴耿华 发表于 2023-5-10 14:29:36

透明的尿和黄色的尿哪个更好?我选择喝水[微笑]

unick 发表于 2023-5-10 14:30:07

你们吧chatGPT理解成百度搜索的2.0版了?[酷]
页: [1]
查看完整版本: 科大讯飞 vs 文心一言,哪个是国内最强GPT?