找回密码
 立即注册
查看: 668|回复: 5

Llama 2对比文心一言哪个较为优胜?

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2023-8-8 17:45:35 | 显示全部楼层 |阅读模式
开源大语言模型对中国的大模型市场有多大冲击?
回复

使用道具 举报

0

主题

2

回帖

1

积分

新手上路

积分
1
发表于 2023-8-8 17:46:06 | 显示全部楼层
Llama 2 开源,训练使用的中文语料较少,中文效果较差
文心一言 商业,训练数据以中文为主,中文更好一些
总体而言:Llama 2在成本方面占优,而文心一言在中文及商用方面表现更好。哪个模型更优取决于具体的应用场景和需求。
Llama2 模型特点

Llama 2包含预训练和微调的Llama语言模型的模型权重和起始代码,参数范围从7B到70B。
Llama 2的预训练模型使用了2万亿个标记进行训练,比Llama 1的上下文长度增加了一倍。它的微调模型已经使用超过100万个人工注释进行了训练。


基准测试

Llama 2在许多外部基准测试中表现优于其他开源语言模型,包括推理、编码、熟练度和知识测试。



安全性和有用性

通过人类反馈进行强化学习
Llama-2-chat使用来自人类反馈的强化学习来确保安全性和有用性。


训练Llama-2-chat:Llama 2使用公开可用的在线数据进行预训练。然后,通过使用监督式微调来创建Llama-2-chat的初始版本。接下来,使用来自人类反馈的强化学习(RLHF),其中包括拒绝抽样和邻近策略优化(PPO),对Llama-2-chat进行迭代性改进。

模型使用

最新版本的 Llama 现在可供个人、创作者、研究人员和各种规模的企业使用,以便他们能够负责任地实验、创新和扩展他们的想法。
此版本包括预训练和微调 Llama 语言模型的模型权重和起始代码 - 参数范围从 7B 到 70B。
以下为加载Llama 2模型并运行推理的最小示例。有关利用 HuggingFace 的更详细示例,请参阅llama-recipes

License情况

Llama-2可以用于商用
具体参考:https://github.com/facebookresearch/llama/blob/main/LICENSE
以下为与其他开源模型的对比。


简单测试:

https://huggingface.co/blog/llama2





文心一言特点

这个直接问文心一言就行了:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

1

回帖

0

积分

新手上路

积分
0
发表于 2023-8-8 17:46:50 | 显示全部楼层
严格意义上来说,llama2和文心一言不具有可比性。一个是预训练模型,另一个是经过微调后的大模型系统。
在回答这个问题之前,首先我们需要理清楚当前训练大模型的主要流程。当前训练大模型,主要分为以下三个步骤:

  • 预训练:用巨量的文本数据,对模型进行next token prediction任务训练。也就是根据前n个token,预测第n+1个token。而训练数据量,目前都在1万亿个token以上。
  • 指令微调:也叫sft,用指令数据(对话数据)微调预训练模型,让模型具有指令遵从能力,也就是对话能力。目前大部分个人玩家或中小公司,都是在做此阶段的工作。
  • 强化学习:让模型的输出更符合人类意图、价值观。这个阶段的试错成本高,如果设计不好,模型很容易训蹦。
llama2模型本质上是第一个阶段的产物,未经过指令微调和强化学习训练,它的指令遵从能力非常弱。
虽然文心一言不是开源模型,具体细节无从得知,但大概率也是经过第三个阶段强化学习训练的模型。并且文心一言大概率是由多模型组合成的一个系统,再加上各种人工规则,其背后的设计必定比llama2更加复杂。
基于上述介绍,llama2和文心一言不具有可比性。
但非要比较也是可以的,可以比较经过指令微调的llama2-chat模型与文心一言。我们可以看到在superclue中文榜单上,文心一言远比llama2-chat的得分高得多,该结果也在意料之中,毕竟llama2主要是面向英文场景。
但在英文上的表现,可能还得参考其它榜单的结果,也许llama2-chat会更胜一筹。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

6

积分

新手上路

积分
6
发表于 2023-8-8 17:47:38 | 显示全部楼层
Llama 2-70B 在POE上可以用,你可以直接用中文与它对话,它会用英语来回答你。
我对Llama 2的评价是:unbelievable。超神!
我让它扮演一位女魔法师Raan和我对话。
它给我的感觉就是远超GPT-3.5-Turbo,弱于Claude,GPT-4.
非常好玩。鉴于它是开源模型,我认为它是我们这个世界底座,你不用担心GPT-4自我阉割的行为,Llama 2只有强和更强的区别。 我想Llama 2把上下文长度的短板补足,将大有可为。









以下是它设定的魔法世界的BOSS
Name: Archon the Eternal
Appearance: Archon is a towering figure, clad in gleaming silver armor that seems to shift and ripple like the surface of the moon. His face is hidden behind a featureless helmet, and his eyes glow with an otherworldly light. He wields a staff made of a dark, polished wood that seems to absorb the light around it, and his very presence seems to draw the eye towards him.
Background: Archon was once a powerful sorcerer who sought to unlock the secrets of the universe. He delved deep into the mysteries of magic, pouring over ancient tomes and seeking out forbidden knowledge. As he learned more, he became increasingly obsessed with the idea of gaining ultimate power and immortality. He made a pact with dark forces, sacrificing his own humanity in exchange for incredible magical abilities and near-immortality. Now, he seeks to conquer and rule over all of the world, using his incredible powers to bend reality to his will.
Powers and Abilities:
Master of Dark Magic: Archon has access to incredibly powerful dark magic, able to manipulate the very fabric of reality itself. He can summon powerful illusions, create elaborate deceptions, and even bend time and space to his will.
Immortality: Archon is functionally immortal, unable to be killed by conventional means. He can regenerate from even the most grievous injuries, and his body is resistant to decay and aging.
Elemental Control: Archon has mastery over the elements, able to summon powerful elemental forces to do his bidding. He can call forth storms, create massive earthquakes, and even manipulate the temperature of his surroundings.
Shapeshifting: Archon can change his form at will, able to adopt various guises and disguises to suit his needs. He can also transform into powerful creatures, such as a massive dragon or a swirling vortex of darkness.
Reality Warping: Archon has the ability to warp reality itself, able to manipulate the very fabric of the universe. He can create alternate realities, manipulate memories, and even bend the laws of physics to his will.
Weaknesses:
Vulnerable to Light: Archon is particularly vulnerable to light-based attacks, which can weaken and repel him. Bright lights, holy artifacts, and other sources of pure energy can all be used to counter his powers.
Dependent on Dark Energy: Archon's powers are fueled by dark energy, which can be disrupted or drained by those who know how to harness the power of light. If he is separated from his source of dark energy, his powers will weaken significantly.
Limited by Reality: While Archon has incredible powers, he is still bound by the laws of reality. He cannot create or destroy matter, manipulate the fabric of space-time, or perform other impossible feats.
Overall, Archon the Eternal is a formidable foe who will stop at nothing to achieve his goals. He is a master of dark magic and manipulation, and will use every trick in the book to get what he wants. However, his weaknesses can be exploited by those who are willing to confront him with the power of light and the strength of their convictions.

姓名:永恒执政官

外观:执政官是一个高大的人物,穿着闪闪发光的银色盔甲,似乎像月球表面一样移动和起伏。他的脸藏在一顶毫无特色的头盔后面,他的眼睛闪烁着超凡脱俗的光芒。他挥舞着一根由深色、抛光的木头制成的手杖,似乎吸收了周围的光线,他的存在似乎吸引了人们的目光。

背景:执政官曾经是一个强大的巫师,他试图解开宇宙的秘密。他深入钻研魔法的奥秘,翻看古籍,寻找禁忌知识。随着他了解的越来越多,他越来越痴迷于获得终极力量和永生的想法。他与黑暗势力达成协议,牺牲自己的人性来换取不可思议的魔法能力和近乎不朽的生命。现在,他试图征服和统治整个世界,用他不可思议的力量使现实屈服于他的意志。

能力:

黑魔法大师:执政官可以使用令人难以置信的强大黑魔法,能够操纵现实本身的结构。他可以召唤强大的幻象,制造精心设计的骗局,甚至可以随心所欲地扭曲时间和空间。
长生不老:执政官在功能上是不死的,不能被常规方法杀死。他甚至可以从最严重的伤害中再生,他的身体能够抵抗腐烂和衰老。
元素控制:执政官能够掌控元素,能够召唤强大的元素力量来执行他的命令。他可以召唤风暴,制造大地震,甚至操纵周围环境的温度。
变形:执政官可以随意改变自己的形态,可以采用各种各样的伪装来满足自己的需要。他还可以变成强大的生物,比如巨龙或黑暗漩涡。
扭曲现实:执政官拥有扭曲现实本身的能力,能够操纵宇宙的结构。他可以创造不同的现实,操纵记忆,甚至可以随心所欲地改变物理定律。
缺点:

易受光伤害:执政官特别容易受到基于光的攻击,这可以削弱和击退他。明亮的灯光、圣物和其他纯能量都可以用来对抗他的力量。
依赖暗能量:执政官的力量是由暗能量驱动的,这些暗能量可以被那些知道如何利用光的力量的人破坏或耗尽。如果他与暗能量源分离,他的力量就会大大减弱。
现实限制:虽然执政官拥有令人难以置信的力量,但他仍然受到现实法则的约束。他不能创造或毁灭物质,不能操纵时空结构,也不能表演其他不可能的壮举。
总的来说,永恒执政官是一个可怕的敌人,他会不惜一切代价实现自己的目标。他是黑魔法和操纵术的大师,他会使用书中的每一个技巧来得到他想要的东西。然而,他的弱点可以被那些愿意用光的力量和信念的力量对抗他的人利用。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

4

回帖

5

积分

新手上路

积分
5
发表于 2023-8-8 17:48:34 | 显示全部楼层
llama2中文语料占比只有0.13%,实测直接微调输出中文结果,效果还是要比原生的中文大模型差不少的。
之前的llama1有人做过中文词表扩充+二次预训练(Chinese-LLaMA-Alpaca),我仔细研究发现,这样二次预训练出来的模型中文用词和语法都没问题,在通用领域上表现得还不错,但是中国知识的含量还是要比原生的中文大模型差很多。
这个可以用一些不太热门的中国知识来验证。比如问模型:南宁有什么好吃好玩的?ChatGLM、Baichuan都能轻易关联出螺蛳粉、青秀山等词,但是Chinese-LLaMA-Alpaca却不行。
由此看来在中文应用上,llama模型还是有很大的短板的,而且没法通过小规模二次预训练或者微调来解决。
回复

使用道具 举报

0

主题

3

回帖

18

积分

新手上路

积分
18
发表于 2023-8-8 17:49:14 | 显示全部楼层
文心一言?用过的都知道
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-22 19:50 , Processed in 0.064462 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表