找回密码
 立即注册
查看: 651|回复: 0

怎么评价讯飞入局大模型?怎么看国内大模型千模大战

[复制链接]

1

主题

0

回帖

8

积分

新手上路

积分
8
发表于 2023-5-9 18:10:31 | 显示全部楼层 |阅读模式
千模大战?
这个词一出来我是懵圈的!什么意思?


本来类比“千团大战”,是说目前国内AI大模型的参与者很多
阿里、商汤、百度、昆仑万维、360……大有一决雌雄的感觉
(插一句啊,底部有参战几家的申请链接整理)
昨天讯飞也参战了。
各种AI讨论群,俄然炸锅!




好家伙有人说:这玩意已经无限接近ChatGPT了
没想到就几个月时间,我们就赶上国外了
中国人太牛了!!
讯飞大模型一出国内千模大战即将收尾!
大有【讯飞大模型第一】的意思是吗?
有这么牛吗?
我们看看被玩“坏”的讯飞大模型


网友们不厌其烦的提出各种刁钻问题
“爸爸妈妈能成婚吗?”
“我是我爸的儿子,请问我爸是谁?”
“如果咖啡豆是豆子的话,那么咖啡属于豆乳吗?”
如果AI有表情必然是这样的


那讯飞大模型到底如何回答上面的问题?




看上去,回答还有模有样是不是?但后面就离谱了


你爸爸就是您本身!
这可把网友气乐了。


讯飞大模型强调的一个亮点是多模态沟通
但也有人不对劲:







看起来他虽然是多模态,但是各模态的功能还要加强。
谷歌一直不急
感觉就是因为正在修炼多模态能力
网友也花了点时间
收集了关于讯飞星火大模型的方方面面




我感觉最大亮点
是讯飞把自家大模型安到自家的录音笔等设备中
可以完成【一段录音,一键成稿】
的确是新闻工作者的福音




杜绝捧杀
我们需要给国产厂商一些时间
无论好坏,本身体验过才知道!
我把讯飞的个人申请方式,放在这里!
不仅是讯飞
我把收集到的众多参与“千模大战”的大模型申请方式,都放出来
千模大战申请链接
阿里通义千问https://tongyi.aliyun.com/
商汤日日新(API)https://techday.sensetime.com/list
360智脑https://www.so.com/zt/invite.html#AIGC
科大讯飞星火https://xinghuo.xfyun.cn/?ch=vM8zT2
出门问问序列猴子https://openapi.mobvoi.com/largemodel-introduce
百度文心一言https://yiyan.baidu.com/welcome
昆仑万维天工https://tiangong.kunlun.com/
澜舟科技 孟子大模型https://www.langboat.com/portal/mchat
欢迎答复补充
我爽利但愿你也爽利
点个存眷
聊点有用的
目前对大模型的能力凹凸没有统一检测尺度
大部门人还是拿同样的问题去测试分歧AI
通过他们的回答
判断好坏
其实这不太准确
万一
我是说万一,并没有针对哪个AI
我提前知道考题,提前设计好答案呢?
不外语言大模型范围有一份榜单CLUE
它会从文本分类、阅读理解、 自然语言推理等9项任务中全面查核AI模型的语言理解能力。
过去几年,该榜单吸引了众多国内顶尖NLP团队的参与尽管榜首位置多次易主,但参评AI模型一直未能超越人类成就。
人类成就(86.678)


2022年11月25日,阿里所发布的通义-AliceMind语言大模型以86.685的总分成就缔造了新纪录
AI初度超越人类成就
这意味着意味着AI模型的中文语言理解程度达到了新的高度
我之前研读过《阿里达摩院通义大模型概述》


有点意思的。可能很多人感兴趣对这份陈述的详细解读和AI资料,我会在之后几篇文章里分享
呼应下开头,国内千模大战即将收尾?
其实吧我看:
国内千模大战才方才开始
我们所有的AI教程和资料,会首先发布于

详情,欢迎来同名号【nextAI使用指南】

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-11-24 22:24 , Processed in 0.059412 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表