怎么评价讯飞入局大模型？怎么看国内大模型千模大战

金牛落秋 · 发表于 2023-5-9 18:10:31

千模大战？
这个词一出来我是懵圈的！什么意思？

本来类比“千团大战”，是说目前国内AI大模型的参与者很多
阿里、商汤、百度、昆仑万维、360……大有一决雌雄的感觉
（插一句啊，底部有参战几家的申请链接整理）
昨天讯飞也参战了。
各种AI讨论群，俄然炸锅！

好家伙有人说：这玩意已经无限接近ChatGPT了
没想到就几个月时间，我们就赶上国外了
中国人太牛了！！
讯飞大模型一出国内千模大战即将收尾！
大有【讯飞大模型第一】的意思是吗？
有这么牛吗？
我们看看被玩“坏”的讯飞大模型

网友们不厌其烦的提出各种刁钻问题
“爸爸妈妈能成婚吗？”
“我是我爸的儿子，请问我爸是谁？”
“如果咖啡豆是豆子的话，那么咖啡属于豆乳吗？”
如果AI有表情必然是这样的

那讯飞大模型到底如何回答上面的问题？

看上去，回答还有模有样是不是？但后面就离谱了

你爸爸就是您本身！
这可把网友气乐了。

讯飞大模型强调的一个亮点是多模态沟通
但也有人不对劲：

看起来他虽然是多模态，但是各模态的功能还要加强。
谷歌一直不急
感觉就是因为正在修炼多模态能力
网友也花了点时间
收集了关于讯飞星火大模型的方方面面

我感觉最大亮点
是讯飞把自家大模型安到自家的录音笔等设备中
可以完成【一段录音，一键成稿】
的确是新闻工作者的福音

杜绝捧杀
我们需要给国产厂商一些时间
无论好坏，本身体验过才知道！
我把讯飞的个人申请方式，放在这里！
不仅是讯飞
我把收集到的众多参与“千模大战”的大模型申请方式，都放出来

千模大战	申请链接
阿里通义千问	https://tongyi.aliyun.com/
商汤日日新（API）	https://techday.sensetime.com/list
360智脑	https://www.so.com/zt/invite.html#AIGC
科大讯飞星火	https://xinghuo.xfyun.cn/?ch=vM8zT2
出门问问序列猴子	https://openapi.mobvoi.com/largemodel-introduce
百度文心一言	https://yiyan.baidu.com/welcome
昆仑万维天工	https://tiangong.kunlun.com/
澜舟科技孟子大模型	https://www.langboat.com/portal/mchat
欢迎答复补充

我爽利但愿你也爽利
点个存眷
聊点有用的
目前对大模型的能力凹凸没有统一检测尺度
大部门人还是拿同样的问题去测试分歧AI
通过他们的回答
判断好坏
其实这不太准确
万一
我是说万一，并没有针对哪个AI
我提前知道考题，提前设计好答案呢？
不外语言大模型范围有一份榜单CLUE
它会从文本分类、阅读理解、自然语言推理等9项任务中全面查核AI模型的语言理解能力。
过去几年，该榜单吸引了众多国内顶尖NLP团队的参与尽管榜首位置多次易主，但参评AI模型一直未能超越人类成就。
人类成就(86.678)

2022年11月25日，阿里所发布的通义-AliceMind语言大模型以86.685的总分成就缔造了新纪录
AI初度超越人类成就
这意味着意味着AI模型的中文语言理解程度达到了新的高度
我之前研读过《阿里达摩院通义大模型概述》

有点意思的。可能很多人感兴趣对这份陈述的详细解读和AI资料，我会在之后几篇文章里分享
呼应下开头，国内千模大战即将收尾？
其实吧我看：
国内千模大战才方才开始
我们所有的AI教程和资料，会首先发布于

详情，欢迎来同名号【nextAI使用指南】

		自动登录	找回密码
密码			立即注册

怎么评价讯飞入局大模型？怎么看国内大模型千模大战

本帖子中包含更多资源