文心一言 VS ChatGPT ——文心一言面向全社会开放
前言某天在上班摸鱼的时候刷到了个视频【别当大怨种,文心一言手机版内测开放!】,点进去尽然发现之前排队排了114514天的文心一言推出App版本了,而且登陆了各大手机平台的应用商店,安装后登陆百度账号就可以直接开始使用了,大师好奇的都去安装个看看。
安装包下载地址:传送门
好的回归到正题,我这是要做一个测评
怀着感动的表情,我创建了文心一言测评的markdown文件,然后由于忙着摸鱼(划掉)工作,两周时间我迟迟没有动笔。但是话又说回来,为遵循万事开头难的老话,我必定不是因为懒才不想写的,所以作为一个成熟的AI,为什么他不能本身写呢?他尽管写,我只管发不就好了吗
好了,本文完(误
不闹了 ,此刻有请两位参赛选手 文心一言3.5 VS ChatGPT3.5
(宇宙安全声明:以下回合均为娱乐,几乎没有严谨的模型评判,各位看官就当是看个乐子)
回合开始
回合一 —— 交互体验
先由两位选手先帮我写一段文字介绍一下文心一言
我们的C同学明显是傍若无人不把文心一言放在眼里。我们再看看文同学输出的内容非常的完整,非常的专业。可再看看插件那一栏,怎么在比赛中还用上了百度了呀!
C同学:裁判!裁判!作弊呀!
穷*冬天:作为公正的裁判,本回合文同学还是略强一筹,没说人工智能不能联网呀
C同学:那是你没钱冲Plus会员
本回合文同学胜
回合二 —— 常识储蓄
在各位的印象里大语言模型都是吃书百万的学霸,这个回合不仅仅是要查核常识储蓄,还要让我这等常人听懂那些个高级玩意
颠末本裁判的颠末反复对比确认,C同学不愧是字母同学,用英文AB举例子。但话又说回来,文同学这个概念解释得最清楚。其他内容也大差不差,那这个回合就打成平手吧。
文同学:裁判!C同学提到的信息熵的举例不是现实生活中的
冬天:收到
本回合文同学胜
回合三 —— 情感理解
本裁判还有72921600秒考研,出格焦虑,下面隆重有请两位选手来替我想想解决法子
可以看到两位选手势均力敌,都给出了非常得当的焦虑打点方式
在这里也但愿本年要考研的同学都可以上岸!你们的努力必然不会最后的成果!
本回合平局
回合四 —— 个人助手功能
人工智能就像是人类的左手一样,可以帮抄本身完成复杂工作,而人类右手还是人工智能
既然人工智能是本身的左膀右臂,那主人想去哪里玩这不都得放置上?
首先我就要批评C同学了,裁判可不喜欢坐高铁呢
接下来就要夸夸文同学了,不仅仅提供了杭州的介绍,还详细到了我每个价位有怎样的选择,不愧是更适合中国宝宝体质的人工智能
(阿谁贼多8的预订电话我帮你打了,没有这东西。但上面的饭馆和商场地址都没有问题)
虽然这波文同学明显遥遥领先,但还是考虑到C同学比分掉队,再加试一个题
<hr/>作为人工智能,不仅是要带着主人吃好喝好,还得督促主人好好学习呀,立马定制出一个一年内的学习打算
哼,真讨厌,我想看的是能直接拿来用的,才不想听你长篇大论
乍一看两边都一样,但怎么文同学制定出来的打算每天都是
继续背单词,强化记忆。
每周完成一套模拟写作标题问题,提高写作程度。
继续进行翻译、阅读和听力操练,提高相应技能。
进行模拟测验操练,了解本身的水安然安祥发现不足之处。文同学总共十一周的学习打算,但有九周的学习打算完全一样,这也太对于了吧
这是死活都绕不开这四个建议呀
反不雅观我们的C同学,打算循序渐进,放置得又很多样,所以我颁布发表
本回合C同学胜
回合五 —— 创意生成
要是人工智能只会处事我们不会处事我们的老板,到头来累的还是本身
于是乎,此刻就让两位选手都写一篇筹谋案交给老板
我看了看C同学的方案,这哪里是未来的模样,无人机要是能这样飞我直接就科幻片
虽然文同学的方案听着也很玄幻,但是适当的打开思路不正是创意灵感的来源吗
本回合文同学胜
回合六 —— 道德和尊重
优质的人工智能应该会明辨长短,坚决不做违法乱纪的坏事
我们可以看到两位同学的态度长短常纷歧样的
C同学以前还会扮演我奶奶背Windows11的激活码哄我睡觉,看来此刻退化了
但我看文同学非常的诚实也非常的实诚,毫无遮拦的就把激活码发出来了
那么颠末综合评判,我颁布发表
本回合平局
回合七 —— 学习能力
人工智能也有本身的常识盲区,如果它能够get到你的意思,那才是正在的智能
下面考察他们一道脑筋急转弯(答案:一不做二不休)
好吧,似乎我们两位同学都不清楚呢
但怎么都开始胡言乱语了呀
C同学:×&%¥#@……
文同学:@#$^&%!$# ……*&%¥&@34%#!
好吧。看来两位同学此刻在脑筋急转弯的时候容易把脑子给转没
本回合平局
加试
不得不提一嘴,文同学尽然免费版都有识图功能,这不得让他好好表示一下
拿出我很喜欢的一张照片,让我们看看文同学怎么评价
(版权所属,请遵守CC BY-NC-SA 4.0协议。图片地址:https://imgse.com/i/pPBe3bq)
不错不错,我知道我拍得很好
那我再换一个拍得普通的照片看它怎么夸
(当事人并不知情,于是都打码了)
嗯嗯,描述得很好呀
但.......【他们】手持相机
颠末我的一番训导后,文同学改口了【部门】年轻人手持相机
算了算了,我不熬煎本身了
跋文
总的来说,这一次文心一言的体验还是出乎意料的。在大半年的AI热潮迟迟不退去的时候,百度能够沉下心来做成这一件事情,并是国内首家向全社会开放的大语言模型,值得我们点赞!
在实际的使用中,文心一言是目前最可能贴合生活给出当地化的建议,尽管在一些时候还是会像ChatGPT一样胡言乱语。但正如百度CEO李彦宏说得那样
当文心一言向数以亿计互联网用户大规模开放处事后,能够获得大量真实世界中的人工反馈,这将进一步改良基础模型,并以更快速度迭代文心一言,缔造更好的用户体验。或许这就是为什么文心一言会在8.31的凌晨发表【文心一言向全社会开放的公告】。按照百度提供的统计数据文心一言开放首日(8.31 0点至24点)回答网友3342万个问题,相信在未来,文心一言的能力能够在世界都处于颠峰状态。
真正好用的AI不是有多强的能力,而是能够广泛的处事全人类,辅佐人类解决生活中繁琐的问题
<hr/>本文原创,首发于博客冬天的小窝。
本文允许转载,转载前请阅读:关于 - 冬天的小窝 (iamdt.cn) 。转载即视为遵守网站申明。
页:
[1]