ppll00 发表于 2024-7-15 17:49:58

生成AI:chatGPT,从GPT-4到GPT-5就可以吗?

本年3月的一篇综述“ A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need? “,算是AIGC的一个大模型调研,来自韩国几所著名的研究机构(有一个国内北理工的学者)。
摘要:随着 ChatGPT 如“病毒”式传布,生成式人工智能(AIGC,别名人工智能生成内容)因其分析和创建文本、图像等能力而成为头条新闻。在如此压倒性的媒体报道下,几乎不成能错过不雅察看AIGC的机会。人工智能从纯分析过渡到缔造时代,值得注意的是,ChatGPT 及其最新的语言模型 GPT-4,只是众多 AIGC 任务中的一个东西。许多人对 ChatGPT 的功能印象深刻,想知道它的局限性:GPT-5(或其他未来 GPT 版本)能否辅佐 ChatGPT 统一所有 AIGC 任务,并实现多样化的内容创建?为了回答这个问题,需要对AIGC的现有任务进行全面调研。现代生成式人工智能依赖于各种技术基础,包罗模型架构、自监督预训练和生成建模方式(如GAN和扩散模型)。在介绍了基本技术之后,本文侧重于基于输出类型的各种AIGC任务技术开发,包罗文本、图像、视频和3D内容等,也是ChatGPT未来的全部潜力。此外,还总结了在一些主风行业中的重要应用,例如教育和创新内容。最后,讨论目前面临的挑战,并展望了生成式人工智能的将来。


AIGC面临的挑战:

[*](1)缺乏可解释性。虽然AIGC模型可以发生令人印象深刻的输出,但理解模型如何达到输出仍然具有挑战性。当模型生成不需要的输出时,这尤其令人担忧。这种缺乏可解释性使得难以控制输出。
[*](2)道德和法令问题。AIGC模型容易呈现数据偏差。例如,主要在英语文本训练的语言模型可能方向于西方文化。侵权和侵犯隐私是不容忽视的潜在法令问题。此外,AIGC模型还具有恶意使用的可能。例如,学生可以操作这些东西来做论文作业,为此需要人工智能内容检测器。AIGC模型还可用于为政治竞选活动分发误导性内容。
[*](3)特定范围的技术挑战。当前和将来,分歧的范围需要其独特的AIGC模型。每个范围仍然面临着其独特的挑战。例如,风行的文本到图像AIGC东西Stable Diffusion偶尔会生成与用户期望相去甚远的输出,例如将人绘为动物,将一个人绘制为两个人等。另一方面,聊天机器人偶尔会犯事实错误。
AIGC的未来展望:
(1)控制更灵活。AIGC任务的一个主要趋势是实现更灵活的控制。以图像生成为例,早期基于GAN的模型可以生成高质量的图像,但几乎没有控制。比来在大型文本图像数据上训练的扩散模型可以通过文本指令进行控制。这有助于生成更符合用户需求的图像。尽管如此,当前的文本到图像模型仍然需要更细粒度的控制,以便更灵活的方式生成图像。

[*](2)从属于到微调。目前,像ChatGPT这样的AIGC模型开发集中在预训练阶段。相应的技术相对成熟;然而,如何为下游任务微调这些基础模型是一个尚未开发的范围。与从头开始训练模型分歧,微调的方针需要在基础模型的原始通用性和新任务的适应性之间进行权衡。
[*](3)从大型科技公司到草创公司。目前,AIGC技术主要是大科技公司开发,如谷歌和Meta。在大科技公司的撑持下,一些草创公司已经显示出巨大的潜力,如OpenAI(由Microsoft撑持)和DeepMind(由谷歌撑持)。随着重点从核心技术开发向应用转移,由于需求增加,预计会呈现更多的草创公司。
页: [1]
查看完整版本: 生成AI:chatGPT,从GPT-4到GPT-5就可以吗?