找回密码
 立即注册
查看: 869|回复: 5

chatgpt和文心一言哪个更好用?

[复制链接]

1

主题

1

回帖

22

积分

新手上路

积分
22
发表于 2024-7-15 18:23:46 | 显示全部楼层 |阅读模式
下面是文心一言的地址,大师可斗劲一下:
https://yiyan.baidu.com/welcome(文心一言)
回复

使用道具 举报

0

主题

7

回帖

10

积分

新手上路

积分
10
发表于 2024-7-15 18:23:54 | 显示全部楼层
我只能说各有千秋。GPT的算法迭代是最先进的,但是它毕竟属于国外产品,有着网络限制、注册限制、会员费高昂等弊端,难以让国内用户享受。文心一言是百度主推的大模型,算法迭代在国内大模型中领先但肯定比不上GPT,不过它使用门槛低,打开网页就能用,3.5版本完全免费。
所以到底选择哪一个就得看各位的需求了,如果你对AI算法要求非常高,力求最专业,那就选择GPT,如果你只需要解决平常的写作、聊天、图文需求,那就选择文心一言。
我本人很推荐文心一言,想支持国内产品。除了文心一言,国内还有许多非常优秀的AI工具,我也想推荐给大家呢~你是用 AI 的需求不一定要 GPT 或者文心一言,有很多垂直的 AI 工具,使用更简单、效果很好,推荐大家试试看。
一、笔灵AI写作

直达入口:https://ibiling.cn/
一款200+多场景AI写作工具,轻松生成高质量文案,赠送免费AI字数,还能一键完成续写和改写。操作简单便捷,让每个人都能轻松上手。更有AI对话和专家对话等实用功能,满足各种多样化需求。


值得一提的是,笔灵也入驻了文心一言的插件,强强联合,是对笔灵的强大肯定了。


笔灵适用人群:
运营抖音、小红书、知乎等平台的自媒体小白;
撰写实习报告/论文大纲/作文的中小学生、大学生;
撰写工作汇报/活动方案/年度总结的机关单位、互联网等各行业人员……
笔灵三大功能亮点:
1.操作方便,一键生成文案
三步生成文案:选择一个文稿板块→用关键词描述需求→点击生成。之后,AI在30s内即可给予你最优质的文字输出。我觉得没有任何操作门槛,对AI一窍不通的朋友也能入门。
2.多场景运用
200多个写作模版,不局限于某个领域,包括商务、教育、娱乐等等,只要在上方搜索栏输入关键词,就能找到心仪的模版。


比如我选择「读书笔记」模版,输入书名《霍乱时期的爱情》和作者加西亚·马尔克斯,AI生成的文章有关键情节分析、主题情感分析。


3.智能改写/续写
只需上传文档或者复制粘贴内容,AI即可在原有文稿基础上智能改写,你可以选择5种语气,让文章面貌“焕然一新”;或者点击续写,让文章思路畅通无阻。
比如下面这个「改写」例子,本来是文风比较严肃的文章,立马能变得热情洋溢了。


二、AI对话鸭

直达入口:https://botvip.cn/
一款20+AI大模型、290+AI机器人聚合平台,能写作,能聊天。有时候我觉得它比GPT还好使,因为它能多模型聊天,而GPT只能单模型,下面我会具体聊聊。
1.聚合国内顶尖大模型
你一定没有见过其他任何一个网站聚合了这么多站在金字塔顶端的大模型,AI对话鸭就做到了,它里面的AI大模型包括百度文心一言、字节云雀、阿里通义千问……
这意味着你不仅可以在里面使用文心一言,你还可以使用更多的国内大模型。


2.多模型同时回答
单模型使用已经见怪不怪了,但AI对话鸭能做到多模型同时回答你的问题,这样方便你对比回答,不需要查找一个个模型浪费时间。


3.畅游机器人广场
这个功能可厉害了,相当于一个AI写作工具所有功能了。里面的机器人分为了一个个,可以写心得体会、年度总结、论文大纲、工作方案、功能写作,又方便又齐全。


三、抖音豆包

在中国,百度和阿里是最早两家出大模型对话的平台,名字叫“文心一言”和“通义千问”。在2023年8月份,字节跳动也加入了这个行列,推出了自己的大模型产品,名叫「豆包」,很接地气的名字哈哈哈哈。


你可以在APP商城下载,可以选择手机号、抖音或者Apple ID来注册。
我分别测试了一下「豆包」三个方面的能力:
1.普通问答
首先,我让它介绍自己,从它的回答看,这个「豆包」主要是擅长跟人聊天、回答问题、翻译、概括文章和分析情感这些事。


3.数学计算
数学题对大模型来说需要很强的逻辑。我用老掉牙的“鸡和兔子在一个笼子里”题目来考考它,它用最常见的数学方法给我算出了答案。
我又问了一些关于计算机能力和分数简化能力的问题,给的还算精准,解决基础问题的能力OK。
4.文章写作
我给了它一个“未来AI”的主题,想让它写个科幻故事或小说。结果它写得还不错,文章结构挺清晰,内容比较宏大,质量算是中等的。
四、触手AI

一款专门为插画师、漫画师、设计师等用户打造的AI绘图平台,平台支持文生图、图生图、参考生图、AI模型训练、AI视频、图生文等功能。
GPT的文生图功能挺好用也很稀有,如果你在找具备这样功能的平替产品,那触手AI很适合你。


触手AI支持功能:
1)支持文生图:输入一句关键词文字描述,即可生成精美绘画作品。
2)支持图生图:上传参考图片,输入关键词描述语再进行创作,这个功能比图生图还稀缺多了。
3)支持controlnet的参考图条件检测功能进行创作。
4)支持inpainting的神奇涂抹,可局部修改。
5)支持在模型广场收藏各类画风、IP、场景、人物、设计类模型。


五、吐司TusiArt

吐司TusiArt是一个在线免费生成图像的模型分享社区,你可以在这个平台上分享和使用各种图像生成模型。比国外的C站更进一步,所有模型不仅能下载还能在线运行。
它具备了开放的模型分享社区,所有模型不仅能下载,还能在线运行,在手机上也能使用生成的图片作品,可以一键分享到社区,社区内的作品都能一键做同款。
它使用起来非常简单,只需打开网站,注册并登录账号,然后选择你喜欢的模型,即可在线使用A进行绘画。




好啦,今天的介绍到此就结束了。如果你使用GPT不够方便存在阻碍,那么不妨试试国内这些可以平替GPT的AI工具哦~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

11

积分

新手上路

积分
11
发表于 2024-7-15 18:24:34 | 显示全部楼层
不用不知道,一用吓一跳。
我们凭良心来说,GPT4整体上一定是超过文心一言的,但是在某些特定领域,文心一言的表现也并不差。


李彦宏在发布会上的一席话,让网友们瞬间沸腾了:文心一言在记忆、理解、逻辑和生成这四块,已经取得了非常大的进步。
那么进步有多大?是驴子是马,拉出来溜溜。。
测评大比拼

语义理解

看看大模型能否理解人类语言当中符合当下语境的含义。



GPT4回答



文心4.0

可以看到两者其实都对语义有了较为准确的了解。gpt4偏向于更官方和有逻辑性的解答,看起来一目了然;文心的回答更偏向于表达了小龙女的情感。(ps:感觉都走进了小龙女的内心世界。。)
热梗问答

虽然两者的知识库都只更新到一定期限,但是由于现在大模型都有网页搜索功能,我们来看看他们对于热梗是否有一定的理解能力?
先问它们一个十级冲浪选手才知道的问题:什么是lonely的问题?



GPT4



文心4.0

不愧是十级冲浪选手啊!文心准确识别这是一个热梗,而gpt4依旧稳定发挥着它的学院风。当然,这大概和这是个中文热梗也有一定关系。
逻辑推理

看看大模型是否有良好的逻辑推理能力,考一考它数学题。



GPT4



GPT4



文心4.0

可以看出,两者都给出了正确答案。gpt4用的是python代码的方式进行分析,而文心4.0是用的数学方法进行分析,角度不同,但都给出了正确答案。

GPT的优势?

GPTs

光是一个GPTs就非常能打了。
原本我们写好了结构化提示词,每一次对话都需要向GPT进行输入,这十分麻烦。假设你重新开了一个对话框,就需要反复执行此操作。
现在有了GPTs,你可以将你常用的提示词封装在GPTs中,不必再每次重复地输入这些提示词。效率高了不止一点!

逻辑与推理

GPT逻辑性比较强,对于结构化提示词的理解也更加准确到位。



GPT4与3.5的对比

如果让GPT做数学题,其能力也是杠杠滴。



文心一言


GPT给出了详细的答案和解答过程,可以说相当严谨了,但是文心一言理解题目上面并不是太准确。足以看出GPT的逻辑能力是较强的。

代码能力

GPT以擅长编码出圈,其能力与文心一言相比如何?
提问:请写一个使用逻辑回归模型判断用户更喜欢文心一言还是chatGPT的训练代码



文心一言



ChatGPT

显然,GPT的回答更胜一筹,而文心一言的回答并不是目标问题的解法。

结语

由上面一些简单的测试可以看出,文心一言4.0在这些方面的表现实际上都已经让人较满意,和GPT4比完全不逊色,甚至在一些中文的语义理解上有一些优势。
当然,ChatGPT4仍然是能力最强的大模型,这个是指综合能力。文心一言离它或许还有一定的距离。但是在一些特殊化的场景当中,仍然可以专攻去进行突破。
文心一言相比最初的时候,已经进步了不少。特别是文心一言4.0出来之后,其能力提升了一大截。但是同样是付费,文心一言的吸引力还是差了一些。
GPT是业界内的顶流,标志着整个AI行业的走向,其大模型也是迄今为止用得最好的一个。但是其GPT4的订阅价格相对较高,并不是每个人都能够接受的。
所以,如果只是日常简单使用,可以选用文心一言,但是如果你需要更高质量的输出,咬咬牙把GPT4.0安排了或许更好些。

喜欢的话,记得给我点赞收藏哦~更多AI干货,请移步主页关注@佳雯聊AI

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

6

回帖

6

积分

新手上路

积分
6
发表于 2024-7-15 18:25:11 | 显示全部楼层
只要不是田忌赛马,从能力角度来说,目前肯定是ChatGPT更强大。
但如果说容易被触及,方便使用的话,文心一言明显更胜一筹。
因为众所周知的原因,ChatGPT有使用门槛,很多人没有办法直接接触和使用。
文心一言现在的能力,已经足够应对至少50 % 的应用场景。
完全可以通过和文心一言交流,熟悉和掌握与大模型沟通的方法,以及提升工作效率的各种技巧。
国内目前可堪一用的大模型有很多,也有综合能力目前强于文心一言的,例如Kimi,不妨试一试。
回复

使用道具 举报

0

主题

2

回帖

4

积分

新手上路

积分
4
发表于 2024-7-15 18:25:19 | 显示全部楼层
哈哈   对比一下就知道了~    高下立见!
一、来个问题测试一下:
Q1:“请问如果煮一个鸡蛋需要3分钟,煮10个鸡蛋需要多少分钟?”
Q2:“那么5个鸡蛋呢?”
1、文心一言:

像不像:会抄答案,但还不会做题?  说明逻辑能力还不太行!



笨的要死,只会10个鸡蛋,一换就不会了!

2、GPT-3.5和4.0的回答:

3.5的回答中规中矩,4.0明显质量更高,也更全面!



3.5回答中规中矩,4.0明显质量更高

3、看完这2个的回答,还需要比较吗?差距怎么样?

综合能力对比:文心一言  < GPT-3.5 < GPT-4.0

分享一下我常用的AI工具,希望对你有帮助~
推荐使用AI+智能助手
推荐指数:⭐⭐⭐⭐⭐
推荐功能:各种AI大模型、AI绘画、AI读图、助手功能、插件功能、AI读文件等等
适合场景:工作总结、论文写作、润色文章、文案编辑、翻译文档、代码编程等
特别适合:【学生党】和【打工人】,必备神器之一~


这个网站,吸收GPT的精华,有3.5、4.0、4.0 turbo、GPT-4o等,也有百度、阿里等大模型,方便大家使用~
二、功能特色:

现在AI产品的功能都很丰富,我最看重最喜欢最突出的功能有这几个:
① 各大模型:

不仅仅3.5、4.0、4.0 turbo、4o模型,还有百度、阿里等的大模型。


② AI文件功能:

让文件活过来,支持pdf、word、ppt、markdown、txt等格式;
与文件对话:读文档、读文献、读手册;写汇总、写分析、写报告~



读文档、读文献、读手册;写汇总、写分析、写报告~

③ 插件功能:

灵活好用的插件功能,意想不到的好用~
如:思维导图AskYourPDF学术、搜索引擎、爬虫、图表等等。



思维导图,一键生成,下载导出~

④ 助手功能:

支持助手功能,各种智能指令集,如论文助手公文助手中英翻译等等
助手商店,100+助手好用的模板,自行选择使用,全部免费~
还能自定义助手(想怎么用就怎么用。。)



助手商店,100+模板,全部免费使用~

⑤ AI绘画:

无门槛使用,无需学习咒语,直接中文输入,一键AI绘画。



一句话,自动出图~

⑥ AI读图:

将你的图片发给AI,它能自动解读,并与你对话图片内容~



AI读图,这个步骤回答真不错~

三、小技巧分享:

AI的回答内容有长度限制,如果超出后,只会显示一部分(看下图)
你就把它当人一样对话,回复“继续”或“接着说”、“continue”,它就接着回答全了~



回复“继续”,就接着回答全了~

以上内容是我自己写的,我是小编请别再投诉转载了!
对您有用的话,辛苦【点赞】支持下~
也欢迎加入一起学习、使用、交流、分享~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

5

回帖

20

积分

新手上路

积分
20
发表于 2024-7-15 18:25:41 | 显示全部楼层
需要明确ChatGpt是指3.5还是4,目前文心一言的水平并不比ChatGpt3.5逊色,甚至在中文能力上理解还更加优秀。但是哪个更好用,更加取决于谁来定义,定义的标准是什么?



我的AI绘画作品

百度文心一言和ChatGPT都是基于深度学习技术的自然语言处理模型。它们都有各自的优势和使用场景,因此无法简单地比较它们的功能强弱。
每个模型都有其独特的优点和限制,最终选择哪个模型需要根据具体需求来决定。让我来用实际案例测试下关于中文诗歌的理解能力吧。
一. 案例测试

来看看区别吧,就和菜肴一样,萝卜青菜各有所爱,大家可以自行评价下哪个答案更加适合自己。



我的AI绘画作品

我采用同样的提示词:
  1. 请你扮演一名资深的诗歌作者,创作一篇关于“关于家人团圆的中秋节诗歌”
复制代码


我的AI绘画作品

1. ChatGPT4.0



2. ChatGPT3.5



3. 文心一言



以上只是我个人的一些测试结果,究竟适不适合自己所在的行业,我建议最好还是自己拿自己的需求进行一个测试。
而想要学会怎么测试,需要有一定的AI提示词技巧,俗话说授人以鱼不如授人以渔,我这里也建议没有学习过人工智能的知友先进行一些人工智能AI基础的知识了解。


在这里我也推荐一个能够迅速学会如何掌握这些AI写作工具,最适合初学者学习的课程,知乎知学堂最近推出了一门名为“AI 互动智能办公训练营”的直播课,该课程共计2小时,主要介绍了AI对各行各业工作模式的潜在影响,以及对职场人的新能力要求。


这一门课详细介绍了提示词的原理,只要听完免费的课程就可以从知乎领取上图的那些资料,相信你也能自己做出测试,帮助自己更好地迎合AI时代的到来,规划自己的职业生涯,以应对AI带来的巨变时代。
如果对于人工智能有兴趣的初学者可以去试着听下这门课程,里面的视频课件介绍能够让你更好的了解AI工具的应用
二. 评价依据是什么?

当前,大型语言模型无疑是科技互联网领域的热点之一。2022年年底,OpenAI发布了ChatGPT3.5,迅速在国内人工智能领域引起了广泛的讨论和关注。
根据中国科学技术信息研究所2023年5月发布的不完全统计数据,国内已经有79个参数规模超过10亿的大型语言模型产品,可以说是一场“百模大战”。百度、腾讯、阿里、科大讯飞、商汤、百川智能等知名科技企业,以及一些创业明星,都纷纷参与其中。



我的AI绘画作品

与“百模大战”同样令人眼花缭乱的是,有关大型语言模型产品发布的评测榜单层出不穷。按理论来说,能力相近的大型模型在不同榜单上的结果差距应该不大。然而,实际情况是,它们在不同榜单上的排名结果可能存在天壤之别。
三. 国内榜单排名

8月15日,新华社研究院发布了《人工智能大模型体验报告2.0》,该报告对国内主流大模型进行了横向测评。评测结果显示,讯飞星火排名第一,百度文心一言排名第二,阿里通义千问排名倒数第二。



我的AI绘画作品

另一方面,SuperCLUE于8月28日发布了中文大模型的排行榜。在该榜单中,GPT-4排名第一,百川智能的Baichuan-13B-Chat名列中文榜单榜首。
此外,在学术界评测榜单C-Eval的最新一期中,云天励飞的大模型“云天书”排名第一,而GPT-4仅位列第十。
这三个榜单分别来自权威媒体、业界和学术界,都是各自领域流行的榜单。然而,它们的排名结果存在巨大差异,更不用说其他榜单了。



我的AI绘画作品

报道指出,现在国内外有多达50个知名大模型评测榜单,而它们的排名结果很少一致。
有趣的是,一些榜单甚至使用了相同的评测数据集,但排名结果却存在很大差异。就好像是同一批运动员在不同的场地上比赛,成绩排名却截然不同。那么问题到底出在运动员身上,还是发令枪有问题呢?
四. 大模型的维度评价

从ChatGPT发布到百模大战爆发,过去的8个月中,评价大型语言模型的标准主要有两个:参数量和评测集。



我的AI绘画作品

参数量是指模型中可学习的参数数量,包括权重和偏置。参数量的大小决定了模型的复杂程度,大模型通常具有更多的参数和层数。在2022年,美国发布了一批大型模型,包括Stability AI的Diffusion和OpenAI的ChatGPT,这些模型的参数数量开始进入了百亿和千亿级别。
从表面上看,具有千亿参数的模型通常表现比百亿级别的模型更好。但也有一些例外情况,并且在相同参数级别下,如何区分模型的优劣呢?



我的AI绘画作品

这就引入了大型模型的第二个评测维度:评测集。
评测集是为了有效评估基础模型和微调算法在不同场景和任务上的综合效果而构建的统一基准数据集,可分为公开和封闭两种形态。
这些评测集就像针对不同领域的考卷,通过测试大模型在这些“考卷”上的得分,可以更直观地比较大模型的性能。
在过去,大多数模型机构使用学术类评测集的效果来评判模型的好坏。现在,大模型厂商也开始积极参与学术界的基准测试框架,将其视为权威认可和营销依据。



我的AI绘画作品

例如,在Meta发布开源大模型LIama2时,明确介绍了在多个学术评测集上的表现,并公开了与闭源GPT-3.5在GSM8K和MMLU两个评测集上的对比结果。
目前,MMLU是国际上使用最多的大型模型评测集。它源自伯克利大学,考虑了57个学科,涵盖了人文、社科和理工等多个领域的综合知识能力。它已被直接应用于GPT-3.5、GPT-4和PaLM等大型语言模型的研发过程。国内科技巨头在评测时也多数采用这个框架。



我的AI绘画作品

商汤在最新财报中特别介绍了其新模型InternLM-123B在近30个学术评测集上的表现,并将MMLU评测成绩排在首位,并与Meta的llama2进行了横向比较。
随后,学术界、产业界、媒体、智库、社区以及传统ICT分析机构都敏锐地关注到这一行业热点,并在今年上半年相继发布了各自的大型语言模型评测榜单。
在当前已有的大型语言模型榜单中,UC伯克利领导的LMSYS是英文领域中最具影响力的榜单。而在中文领域,目前存在多个具有接近影响力的榜单,尚无定论哪个榜单最佳。
结语

我觉得语言大模型是否好用这个目前没有统一的榜单标准能够真正客观,同时由于人工智能语言大模型的飞速发展,差距很快会被弥补,因此纠结于哪个好用并不太有意义,成年人不做选择题,我全都要!你们觉得呢?
<hr/>我是德里克文,一个对AI绘画,人工智能有强烈兴趣,从业多年的室内设计师!如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-13 04:28 , Processed in 0.059359 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表