498 发表于 2023-8-31 09:42:23

斗劲国内的两个AI聊天东西-通义千问、问心一言

在我之前写的文章里,我对国外主流的AI聊天东西–chatGPT与claude、bard进行了斗劲。这是上次编写的文章–斗劲一下claude2和google bard与chartGPT的分歧,感兴趣的同学可以看一下。为了公平起见,这里就让通义千问、问心一言不与国外的AI聊天东西斗劲了,而让它们互对比力测试一下,看看最终效果如何。
首先,这是阿里推出的大模型官方网站–通义千问,国内用户可以直接登录并进行在线测试,这里我用了本身的付出宝账号登录测试的,如下图:

http://pic4.zhimg.com/v2-7ea23dbda35e1271d5b01fede4b3e66f_r.jpg
登录后,直接在文本框内输入本身想要生成的提示词即可,仍然是测验考试问它几个基础的问题:

http://pic3.zhimg.com/v2-0198233e2fed55d608724cfa15b4a97e_r.jpg
可以看出通义千问作为大模型无法获取当下的天气、资讯和时间。
这时候我们来看一下,百度的文心一言回答效果怎么样?
我们打开文心一言的主页:文心一言

http://pic3.zhimg.com/v2-12b94ed1bcb7b3cb1602cfbddae9bb8e_r.jpg
同样的问它一样问题,看看效果:

http://pic2.zhimg.com/v2-f8fc5354932cf17bccbb5d5a8d981be9_r.jpg
果然,有着搜索引擎的加持,确实能够获最新的天气、资讯和时间。下面依然问一下比来的新闻讯息和几个数学问题:

http://pic2.zhimg.com/v2-be4c9a84914f2b0d0cf5e64aaddfb4d5_r.jpg

http://pic4.zhimg.com/v2-91e9203b09c63d074fe4efac44a2f753_r.jpg

http://pic1.zhimg.com/v2-4dcb208d91ebf2429fab4db65f52644c_r.jpg
我们再问一下阿里的通义千问,让它解释一下葛立恒数和tree3:

http://pic4.zhimg.com/v2-165d220269affb8dd035d1e00dbca037_r.jpg

http://pic2.zhimg.com/v2-5e6d3c6d448dbe7e5aa7c934278c6959_r.jpg

http://pic3.zhimg.com/v2-2dd85f04d3c2ae4f3a60a6eeea5627e6_r.jpg
我再将百科里的内容截图下来作为斗劲:

http://pic2.zhimg.com/v2-140d44825496924302e5e7692fa42059_r.jpg
tree3这个数:约等于10^3.6兆次方。tree3是六位数,TREE3约等于10^3.6兆次方,葛立恒数是曾经在数学证明中呈现过的最大的数,后来被一个更大的数TREE3代替。葛立恒数虽然很大很大,但它在TREE3面前却可以忽略不计。TREE3这个数大到无法写出来,无法理解,也无法用物理语言来描述。百亿光年浩瀚的宇宙在TREE3面前甚至可以忽略不计。
tree3的道理
Kruskal证明了一个定理,考虑如下的树序列,最多有i个节点,每一棵树都被k顶染色,任意两棵树都不能同胚嵌入。定理,所有如此的序列必然有限。那么既然Kruskal序列是有限的,HarveyFriedman就定义了一个TREE,暗示k染色下序列长度的最大值。Graham数的概略大小是。目前还没人给出过TREE3的上界,只知道它是有限的。顺带一提的是TREE增长速度的等级已经超过了,而Graham数用普普通通的就能描述了。还有一个有意思的事情是,看一下下面的例子。这里我让这两个AI聊天东西都写一下c#的冒泡排序源码:

http://pic3.zhimg.com/v2-1e1cf8a5dd8db19bacbb105247c9d9d6_r.jpg

http://pic1.zhimg.com/v2-9330f065586bb7963a4937023695d934_r.jpg
给我反馈的答案里,用于冒泡排序举例用的数字是一模一样的,都是{ 64, 34, 25, 12, 22, 11, 90 }。好吧,看来它们用于模型训练的内容都一样,此外我也懒得问了……
由于对诸如文章、案牍、诗歌等文本生成的质量评断都是斗劲主不雅观的,这里就不进行详细斗劲。
通过上面斗劲能够发现,通义千问确实没有文心一言说的详细和准确,回答的内容也少,一直在“装糊涂”。我感觉文心一言同bard一样,从成果上来说,通过内容和准确性上有浏览器的加持要比纯挚的只有大模型生成的效果好(bard相对某些问题的回答比claude2更好一点)。不外由于案例很少,也不能具有很强的代表性,感兴趣的同学可以上这两个网站里测试一下。
欢迎存眷我的其他文章,包罗AI应用和软件分享:

[*]斗劲一下claude2和google bard与chartGPT的分歧
[*]如安在ipad与windows电脑上互传文件
[*]Photoshop Beta版本的注册和安装,解锁永远使用权限
[*]保举几个适用于MJ和SD的提示词网站
[*]如何免费使用(白嫖)amazon的云帆,EC2和甲骨文的永久免费账号
[*]Draw Things的模型导入和图片生成
[*]最简洁最易上手的Wolfram Mathematica入门教程
[*]Adobe Express使用教程
[*]Wolfram Mathematica使用技巧分享
[*]可能是全网最详细midjourney的使用教程了
[*]通过AI制作一个游戏
[*]聊一聊几款主流的下载器
[*]史上最强AI修图来了-DragGAN在colab部署教程
[*]如何复刻github的项目和共享本身的项目
[*]最简单最高效--几秒内实现AI换脸!
[*]比来的AI绘画应用汇总-FreeDrag、Stable Doodle、SD XL 1.0模型
[*]几款AI新应用-文本转视频、AI浏览器
[*]演示一下Midjourney的新功能-Pan
[*]至今为止最好用的AI生成PPT东西-Gamma
[*]类SD在线生成只需能上网就行?最好用的SD替代
[*]国内的智能PPT生成东西–chatPPT
[*]Fulljourney的文本生成视频功能和HyperwriteAI助手
[*]至今为止独一一个能够直接生成矢量图的AI东西
[*]分享两个来自国内的AI网站
[*]一句话自行成书?用AI一键生成思维导图
[*]chrome扩展应用web scraper使用教程
[*]如何使用cloudfare的warp+和zero trust实现安全上网
页: [1]
查看完整版本: 斗劲国内的两个AI聊天东西-通义千问、问心一言