找回密码
 立即注册
查看: 417|回复: 5

国内AI大模型,你看好谁?

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2024-7-15 17:35:29 | 显示全部楼层 |阅读模式
国内AI大模型,你看好谁?
回复

使用道具 举报

0

主题

4

回帖

12

积分

新手上路

积分
12
发表于 2024-7-15 17:36:07 | 显示全部楼层
国产AI大模型越来越多,可以看到互联网大厂开始将自家大模型与业务深度绑定,在to B的战场上发力狂奔;而更多的新兴企业则是在细分领域里寻找机会。
在这个充满变数的关口,我们不禁要问:这场AI大模型的较量中,谁能够最终胜出,成为行业的标杆?是技术实力雄厚的老牌巨头,还是创新能力十足的新兴企业?这个问题的答案,不仅关乎技术本身的先进性,更涉及到生态系统的构建、开放策略的实施、以及实际应用场景的落地。
在这篇文章中,我将带你一探究竟,从技术实力、生态布局、市场表现等多个角度,分析国内AI大模型的竞争格局。我们将一起探讨,哪些因素将成为决定胜负的关键,以及在这场激烈的竞争中,谁最有可能成为未来的领跑者。
“to B”还是“to C”?

在过去的一年里,BAT都发布了自己的大模型。产品刚上线的时候确实激起了一些舆论的水花,然而很快就归于沉寂。原因是他们不约而同地把注意力放在了B端业务上,努力想要向政府和企业证明大模型的价值。
阿里巴巴通过其“城市大脑”项目,利用大模型处理和分析城市数据,包括交通流量、公共安全等,以优化城市管理和服务;百度通过大模型技术推动智能驾驶的发展,其“萝卜快跑”项目在北京、上海等城市进行试运行,展示了大模型在车路协同、智能交通管理等方面的应用潜力;腾讯则是将自研的混元大模型,在内部业务中进行了广泛的应用和测试,如腾讯会议和腾讯文档等,以提升内容生成、智能助手等功能。
三家大厂都以C端应用起家,却在面对大模型的时候,纷纷选择了“抛弃”C端用户。这多半是出于商业的考量,毕竟大模型的研发和运维成本非常高,需要大量的数据、计算资源和专业人才。而且大模型技术还在不断发展和完善中,像OpenAI这样的领先者都还在不断迭代,这个时候先试试水,等到应用成熟之后再跟进也是一种策略。更重要的是,优先选择在B端和G端市场进行投资,可以实现更高的经济效益。
然而我并不太看好BAT的这波操作。从to C到to B,并不只是市场策略的切换,它背后的逻辑是“将C端积累的能力向B端输出”,这是互联网企业的规律。所谓的军工转民用,并不适合新兴技术。


那么怎样的AI企业才具备黑马的潜质呢? 接下来就让我们把镜头拉近,从技术、产品、运营上理解一家AI企业的核心能力。
临渊羡鱼,不如退而结网。我们不仅要能分辨大模型的好坏,更要了解它们的内核。比如它们背后使用的是开源还是闭源模型?模型是transformer架构还是非transformer架构?
我是做后端开发的,可以做大模型应用开发吗?应该从哪里入手?这些内容在知乎知学堂的在线课程里都有涉及,推荐你加入学习!点击链接获取更多信息:
AI时代的计算机与摩尔定律

传统计算机的CPU和内存是构成计算机系统的核心组件,CPU是计算机的大脑,负责解释和执行程序中的指令,内存用于临时存储正在运行的程序和当前使用的数据。CPU决定了计算机能力的高度,内存则直接影响到计算机的速度。
在AI时代,Transformer 架构代表了一种新的计算平台,其核心特征可归纳为两个关键方面。第一个方面是参数规模,这一要素直接影响计算的复杂度,可以类比为传统计算机架构中的CPU。第二个方面是处理上下文的能力,相当于传统计算机的内存,它决定了可同时处理的信息量。
理解了这种架构,就很容易理解一个大模型的能力上限。那么新时代的摩尔定律,是否就只是参数的增长和文本长度的扩张呢?


对于大模型而言,最关键的度量标准是其在不同应用场景中的普及率,即多少场景已经具备了实用性?这一增长应遵循指数规律,而非线性发展。换句话说,模型的能力应每隔一定周期翻倍,这才是新的摩尔定律!


AI企业不能再沿用传统人工智能的做法,即每次仅针对一个新场景或一组新数据进行优化,以期其在特定场景中有效。这种方法无法实现能力的指数级提升。
只有当模型能够适应大量多样化的场景时,它才能真正成为一个全能的接入点。这才是黑马的本色!
微调和开源会是未来吗?

我们现在知道了场景的摩尔定律,那么目前火热的开源和针对大模型的微调,前途几何呢?
我的看法是,开源和微调仍然有着巨大的潜力,但不太可能成为未来的主流。
如今市场上的很多大模型企业,其实都在依赖开源和微调,尤其是以内容生产为主要业务的公司。这样的公司或许可以吃到一波红利,但时间不会太长。
因为随着模型在遵循指令、逻辑推理和保持上下文连贯性方面的能力不断增强,我们只需将所需内容存储于“内存”中即可。例如,大模型内存中包含了众多的前缀(prefix)数据,这些数据有助于模型的跟随功能,且能够显著降低成本。
最终,模型的个性化过程实际上是基于你的所有交互记录,这不仅是你偏好和反馈的汇总,而且这些反馈比以往任何时代的产品都更为即时,因为它们完全通过交互式界面生成。
例如,GPT-4引入了一种新的计算模式,生成GPTs不需要进行微调。过去的定制化通常是通过编程来完成的,而现在,通过让模型的前缀变得极其丰富,从而从通用的数据集中提取出所需内容。这种通过模型自身调整来实现个性化的方法,正是AI原生个性化的体现,而传统的推荐引擎注定会被这种新方法所取代。字节跳动的“豆包”平台就在做这方面的尝试。


开源模型应用于实际项目,虽然不会成为一个主要的枢纽,但它提供了一种成本效益高且灵活性强的解决方案,尤其是在产品开发方面。通过针对特定数据集的微调,可以创造出独有的、具有差异化的附加价值。例如,妙鸭相机这类的产品,通过精准把握用户的具体需求,与用户共创,生成与用户紧密相关的图像内容,从而为用户带来个性化的体验。


AI运营和真正的未来

在当今的AI领域,数量众多的厂家还聚焦于数据处理这一中间环节。即便使用相同的底层模型,但它们最终能够创造出多样化的产品,这背后的决定性因素在于各自采用的数据集不同,比如CodeGeeX和通义灵码。这显然不会是未来。
AI运营的核心在于与用户的共创过程。通过与用户的互动,AI才能更好地理解用户需求,从而提供更加个性化和精准的服务。这种以用户为中心的设计理念,使得AI产品不仅仅是冷冰冰的机器,而是能够与用户共同成长的伙伴。说起来很抽象,但请想象一下有一个陪伴你十年的AI,它记得你们所有的对话,为你解决工作和生活上的问题,你想不想拥有这样的AI ?
回到国内AI市场,不远的将来,我们可以预见至少将有两个主要的接入点成为AI领域的焦点。
一个是工作,它致力于解决实际问题,提供高效的工具和服务,以帮助用户完成具体的任务。传统的信息检索渠道,如搜索引擎,可能会逐渐失去其主导地位。毕竟人们寻求信息的最终目的并不是获取信息本身,而是为了利用这些信息来完成任务。因此,那些能够直接协助用户实现目标的AI Agent有很大的机会。
另一个是娱乐,通过创造性和趣味性的体验,满足用户在休闲和娱乐方面的需求。这种体验不仅限于传统的游戏和娱乐内容,还将扩展到虚拟现实、增强现实以及互动艺术等新兴领域。AI协助创造全新的互动形式,如智能音乐创作、视频创作、个性化的虚拟角色互动,以及基于用户选择动态变化的故事线等等。那些拥有自主IP的企业在这方面潜力巨大。
在这场聚焦于先进大模型和智能技术的竞争中,中国开发的AI产品无疑将持续地进行创新与改进。你是否也不甘于旁观,想要躬身入局? 作为一名开发者,我推荐你报名参加知乎知学堂提供的网络课程,它可以帮你了解大模型应用开发架构,可不仅仅是TensorFlow、PyTorch这样的深度学习框架,而是从LangChain到AI Agents,从搭建环境到部署应用的全套开发资源。邀请你加入学习!点击链接获取更多信息:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

10

积分

新手上路

积分
10
发表于 2024-7-15 17:36:51 | 显示全部楼层
目前国内的AI模型已经近100个商厂,主要以百度,阿里,腾讯,华为为主
比如,一些模型可能在自然语言处理方面表现出色,而其他模型可能在图像识别或多模态任务上表现更好。


从去年开始,就已经风起云涌了
A阿里的“通义千问”4月7日开始企业内测
华为的“盘古”大模型4月8 日亮相
商汤科技4月10日带来了“商量SenseChat”
还有科大讯飞的“1+N”和昆仑万维的“天工大模型”也紧跟其后!
这场面就像是别管行不行,反正你有我也得有!
百度文心一言

目前百度的文心一言大模型,其文心大模型我们接触的居多,其涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用也较为广泛,例如电力、燃气、金融、航天等,构建了国内业界较大的产业大模型。
除了有:文心一言、AI作画应用、文心一格外,还和工业、能源、金融等多个行业领域企业,共同打造了11个行业大模型
举个例子

文心4.0的文案创作能力可谓是空前绝后,我让其这一片500字的科幻小说,结果可想而知,故事很


还可以帮助用户写周报日报,比如让其写1000字的周报


图片生成,比如我们输入提示词:未来科技的大宇宙,产生的效果还是非常可以的


虽然生成图片的能力还是有待于提高,但作为国内第一家基于中文内容开放的 AI 人工智能产品,百度至少走在前列
配置了一些强大的插件,我体验了一把感觉还比较有意思


你只需要在文心界面找到“选择插件”,而后点击、下拉,就能选择心仪的插件啦。选择插件后,在输入框内直接输入,就能得到回答,不用跳转界面。
腾讯的混元模型

其完整覆盖NLP大模型、CV大模型、多模态大模型、文生图大模型及众多行业、领域任务模型,自2022年4月,先后在MSR-VTT、MSVD等五大权威数据集榜单中登顶,实现跨模态领域的大满贯,目前,推出了HunYuan-NLP1T大模型并登顶国内权威的自然语言理解任务榜单CLUE。
借助更先进的大模型作为评委,通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估,评估结果如下:


聊天模型在人类偏好上的显著性能提升;基础模型与聊天模型均支持多语言;所有尺寸模型均稳定支持32K上下文长度
我们来考考它,v它一个2023年全国高考语文作文全国甲卷看看实力:


在腾讯文档中,新建智能文档,按下"/"键,就可以快速调出混元大模型进行文本生成:


看,是不是很有帮助?
目前越来越多的人都在生活,工作中使用这些工具了,能偶有效的减轻工作量,可谓生的上是一个完美的助手,比如当学习者在网络上很难搜索到自己想要的代码实现时,不妨可以尝试使用类gpt的工具来帮助书写代码,这可以帮助学习者在学习的时候节省时间。
此之外,由于近年来机器学习的热度不减,很多优秀的开发者、平台、学者、学校、自媒体都或多或少地发布一些公开课程。这些课程五花八门,涵盖的范围也很广,学习者们可以在互联网上寻找自己合适的课程进行学习。像答主自己也是经常在知乎上找一些课程去学习,这里给大家推荐「知乎知学堂」联合「AGI课堂」推出的【程序员的AI大模型进阶之旅】公开课  
公开课的课程是免费的而且只有2天,大家不妨一试。这次特邀圈内技术大佬全面解读前沿技术,帮大家成为AI技术革新下更大的收益者,恰好可以和上面介绍的AI辅助工具相结合。


阿里:通义大模型

通义大模型基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。QWen支持1.8B、7B、14B、72B、VL等多种参数规模的模型。截止到24年2月16日;
通义千问也支持图片理解


不错不错,理解能力感觉比其他大模型要好很多,完全分析了是属于头像类型。
华为

阿里更重技术,例如M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致


另外其底层技术优势还有利于构建AI的统一底层。
国内的这几家我都体验过,各有各的特色,都是国产先行梯队,表现最好的是百度文心一言,虽然很OpenAl有一些差距,但对中文的理解可能是更能做好本土化。
所以,面对AI的百花齐放,你看好哪一个呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

6

回帖

2

积分

新手上路

积分
2
发表于 2024-7-15 17:36:59 | 显示全部楼层
在市场上,只有做到前三名,才能被用户接受,我们通常会选择第一和第二梯队的产品,第三梯队是备选,基本不会使用。
98% 国内AI大模型,最终都会死掉,这些模型同质化,基本都是开源项目魔改而来,很多甚至仅仅是调整几个prompt参数。
就如同前几年的区块链,很多企业研发自己的链,而不是去开发商业应用。目前AI也是如何,很多企业在做自己大模型,而不是去思考AI的行业落地。
尤其是那些大学的项目,不要期待大学能搞出什么产品。
你认为大学的教授比企业的工程师水平高吗?大学里搞出来的,都是实验室半成品,能运行,但是距离产品化还差十万八千里。
大学里的很多应用都是闭门造车,臆想出来的需求,多数都无法落地。ChatGLM2-6B 玩玩可以,距离产品推向市场,且被市场认可,用户乐意付费,还差十万八千里。
国内大模型的关键壁垒不是技术,而是数据?
英文数据相对纯粹,质量更高,尤其是西方的付费内容质量更高。
而我们在信息这块野蛮生长,人们习惯了白嫖,更没有付费的习惯,知识的生产者也就没有义务生产高质量的内容,同时知识的生产者为了生存,没有下限,通常内容夹杂私货,伪造不实的内容(本人就经常这么干)。
知识生产者也不是表达观点,启发人们思考,而是用户想看什么,我们就写什么,直击用户爽点,这样用户才会为你点赞,打赏。点赞,完播,转发等等有影响到内容流量。你一本正经讲知识,给谁听啊,你算老几,教育用户吗?
这也不能怪知识生产者,我们不能像圣人一样要求知识创作者,中国互联网的现状,可以说是用户和创作者双向选择的结果。
回复

使用道具 举报

0

主题

2

回帖

13

积分

新手上路

积分
13
发表于 2024-7-15 17:37:51 | 显示全部楼层
国产AI大模型“百花齐放”百模大战正在悄然进行!

今年各种基于AI新技术如雨后春笋般拔地而出,7月6日,上海世界人工智能大会携手各大科技公司争相展示最新大模型产品和应用,各种大模型在各个领域中展现出巨大的力量,每个大模型都独具特色,下面来盘一盘~


百度的文心一言大模型主要应用场景为文学创作、商业文案创作、数理逻辑推算、中文理解、多模式生成。文心一言是知识增强的大语言模型。
阿里的通义千问主要应用场景为阿里的所有产品,可以进行多轮对话、文案创作、续写小说、逻辑推理、多模态理解、多语言支持。是个大规模的语言模型。
讯飞的星火认知大模型主要应用场景是面向教育、办公、车载等行业解决办法。有7大核心能力:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
华为的盘古NLP模型主要应用于智能客服、机器翻译、语音识别等多个领域,盘古更注重针对中文语言的优化,采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。
腾讯的混元大模型主要应用于腾讯广告、3D虚拟场景自动生成、对话式智能助手等。
这些大模型已经在医疗、教育、金融等各个行业中发挥着重要作用,无论你的需求是什么,都可以在找到合适的工具。下面给大家分享几个国内用于日常工作中的AI软件工具!
1.图片编辑助手-AI绘画
一款图片专业的软件,当然也有AI绘画的功能,它还有AI社区,可以看到一些AI的优秀作品呢!
打开软件找到AI绘画


可以在上排选择想要的画面风格,在右侧输入关键描述词,设置想要的画面的尺寸大小,就可以开始生成啦!


生成速度也很快!是不是很好看呀!


2.FunAI—AI效率助手
日常的工作有它真的可以解决很多事情!这是一款精准小巧的智能AI问答助手工具,内置了最新一代的ai对话模块,支持多领域方向的提问,还有许多办公中需要的实用功能。


【AI工作】


【AI生活】


【AI角色】



3.ChatEXCEL—AIExcel表格
通过文字聊天就可以实现Excel交互控制,支持一键导出Excel表格,连复制粘贴的步骤都省了,真的实现了做Excel表格,光动动嘴就可以了!


打开表格后输入想要修改的描述,点击执行


就可以看到表格的变化啦~


以上就是我分享的国内的好用的AI软件,用过的小伙伴可以分享一下哦~
想要了解更多实用干货、有趣网站 、点这里@小予的收藏夹

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

16

积分

新手上路

积分
16
发表于 2024-7-15 17:38:22 | 显示全部楼层
2023年上半年国内AIGC投融资一览表


大家这么感兴趣,也分享一波2023年6月截至北美种子轮和前种子轮的人工智能/机器学习投资者列表。
这些轮的范围从300万到1100万美元 VC的股权比例约为20-25%。 因此,AI公司的后期估值范围将在1200万美元至5500万美元之间,这对于种子轮来说非常惊人!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-22 01:54 , Processed in 0.058230 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表