百度吴甜称「新版文心一言能力已超 ChatGPT 3.5，未来只会有少量大模型」，公司日后如何成长？

zgx333 · 发表于 2023-8-7 16:31:24

7月24日下午动静，近日，IDC发布AI大模型技术能力评估陈述显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一。在面向新浪科技等媒体沟通中，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出，新版本文心一言3.5已超越ChatGPT 3.5，未来国内将只会有少量大模型。“在OpenAI发布ChatGPT之前，真正在做大模型的企业或机构寥寥可数，过去短短几个月内，大量新的模型呈现，这是一个阶段性的现象，在演变的过程傍边，其实各个企业、机构会逐渐找到本身的定位，下一步逐渐会走向本身细分的标的目的。”吴甜暗示。在吴甜看来，大模型的终局将会集中在少量几个大模型上。因为，真正从底层做起来的大模型成本非常高，并不是想做就能做起来的，它需要有多年的堆集，需要非常综合的能力，也需要有绝对的坚定信心，一直投入下去才能够做好。
所以，从这一点上可以看到，将来只能有少数的大模型。吴甜指出，大模型财富化面临着挺大的挑战，总结起来有三方面：第一，大模型的体积确实很大，模型大带来的训练难度高，成本高。第二，对于算力规模要求非常大，性能要求非常高。第三，数据规模也很大。我们今天为什么有这么多千亿参数规模，甚至也有万亿参数规模，它跟海量的数据上自定义强相关。数据的规模也非常大，收集、挖掘、扶植、筛选这些数据，清洗这些数据本身也长短常大的大工程。“其实完全不要存在大量的大模型，而对于应用者来说，也不需要每一个应用都来进行大模型的开发。”吴甜暗示。在他看来，大模型的财富模式，可以类比芯片代工厂，此刻芯片的型号、厂商非常多，但是代工厂只有几家而已，芯片代工厂价值非常大，但整个社会不需要有非常多的企业都来实现这个能力，只要少数几家芯片代工厂，对于有芯片出产需求公司来说，只要出出产方案，交给芯片代工厂出产，就可以得到想要的芯片。

Jevy · 发表于 2023-8-7 16:31:48

新版文心一言能力已超ChatGPT 3.5，这样的结论不敢苟同。
但是未来只会有少量大模型这是确定无疑的。
合久必分，分久必合，大模型这样的巨量基础设施，未来不会出现“满天星斗”的情况，只会是“月明星稀”。

章子仪 · 发表于 2023-8-7 16:32:22

真敢吹，要不是我用过企业版的我差点就信了。
我还非常贴心地给你们的客户支持团队打电话讲了好久我对你们的工程建议，半点回音都没有。

wo2j · 发表于 2023-8-7 16:32:48

1、能力已超ChatGPT3.5没什么毛病，但人家已经ChatGPT4了，百度你什么时候呢？
有进步当然值得肯定，但相信中美两国的竞争，比的是最顶尖的科技。
我没有苛责，只关心后续。
2、超过ChatGPT3.5，我觉得不是特别重要。
特别重要的是，实际应用场景到底如何？实际接入效果如何？
所有的研究最后都看实际应用的效果，对生产力的提升。
百度前期招徕了大量使用文心一言的盟友有感受吗？
可以出来说说啊。
3、国内还有几个大模型，百度有否横向对比过？
比如阿里现在进化到什么地步了？
没有对比就没有伤害。
我对百度文心一言有很高的期待，希望不要跟过去一样只是看什么热就做什么，最后一地鸡毛。

吴大公子 · 发表于 2023-8-7 16:33:11

2023.08.06更,7种LLM结果对比。
秉承实践的原则亲手撕一下就知道了。都说大模型的数学不好，那我们就来对比验证一下，看2道2023高考数学真题：
太长不看版：见文末7种LLM结果分析（GPT-4、GPT-3.5、ChatGLM2、文心一言、通义千问、讯飞星火、360智脑）
第一题

2023年全国甲卷理科数学填空题第1题：正确答案【2】

【GPT-4】给出的答案和解答过程：结果正确得分，推导过程有些错误

【GPT-3.5】给出的答案和解答过程：错误不得分

【文心一言】给出的答案和解答过程：错误不得分

【通义千问】给出的答案和解答过程：结果正确得分

【讯飞星火】给出的答案和解答过程：错误不得分

【360 智脑】给出的答案和解答过程：错误不得分

【ChatGLM2】给出的答案和解答过程：结果正确得分

第二题

2023年全国甲卷文科数学选择题第4题：正确答案选 【D】

【GPT-4】给出的答案和解答过程：正确得分

【GPT-3.5】给出的答案和解答过程：正确得分

【文心一言】给出的答案和解答过程：错误不得分

【通义千问】给出的答案和解答过程：正确得分

【讯飞星火】给出的答案和解答过程：错误不得分

【讯飞星火】给出的答案和解答过程：正确得分

【360 智脑】给出的答案和解答过程：正确得分

【ChatGLM2】给出的答案和解答过程：正确得分

<hr/>结果分析

本人保证这两道题抽选的随机性，没有任何作弊。题目数量过少，不具有统计意义。

LLM name	第一题	第二题	正确率
GPT-4	√	√	100%
ChatGLM2	√	√	100%
通义千问	√	√	100%
GPT-3.5	×	√	50%
讯飞星火	×	√	50%
360智脑	×	√	50%
文心一言	×	×	0%

大雁60914 · 发表于 2023-8-7 16:33:41

指标是人定的
随着算力的廉价化和程序员的职业化，未来所有大模型都打不过开源社区的
ai始终是一个你可以不够好，但你不能没有的东西，目前的任何模型，都无法确定性的告诉你他是稳定的，不稳定的东西只能被作为工具，而无法被作为职业
ai会极大的丰富我们的生活，极高的生产力将会压缩我们人生的各个阶段，而后将是首场对于人类文明怠惰性的究极考验，
如果人可以被替代，我们能否跟得上生产力的飞跃，证明人也依旧存在价值？
如果不存在价值，我很怀疑，全球性的计划生育要开始了……

		自动登录	找回密码
密码			立即注册

百度吴甜称「新版文心一言能力已超 ChatGPT 3.5，未来只会有少量大模型」，公司日后如何成长？

本帖子中包含更多资源