找回密码
 立即注册
查看: 829|回复: 5

人工智能、机器学习和深度学习有哪些区别?

[复制链接]

2

主题

1

回帖

18

积分

新手上路

积分
18
发表于 2023-12-20 10:57:32 | 显示全部楼层 |阅读模式
提供一个学习路线和书单,谢谢!
回复

使用道具 举报

0

主题

2

回帖

0

积分

新手上路

积分
0
发表于 2023-12-20 10:58:23 | 显示全部楼层
2023年,“人工智能新时代”再来看这个问题,感觉在朴素中又透露着一点缺失感。说缺失感意思是彼时人们对人工智能的想象一定没有今天这样丰富和具体,大模型时代让人们对人工智能和其背后的技术原理有了更深刻的认知。因此,我觉得这个问题在当下依然有很大的讨论价值,甚至有重新认识它的必要。
这篇回答主要三个部分。首先介绍人工智能、机器学习和深度学习之间的区别和联系;然后结合当下人工智能最新的发展水平,梳理一些重要的概念;最后提供一个学习路线和学习思路。感兴趣的可以分别跳转到对应部分。



人工智能发展的重要节点。图片来源:OurWorldData

人工智能vs机器学习vs深度学习

首先回答一下题目问题——人工智能、机器学习和深度学习这三个概念到底有什么区别?
人工智能

其实这个问题不难理解,我们可以通过一个类比来解释。假设把人工智能比作一个婴儿的大脑,那么机器学习和深度学习就是让这个婴儿的大脑有能力去观看世界、聆听世界,感受世界以及与世界互动。
直观的说,深度学习只是服务于人工智能的一个工具(也许在若干年以后,随着科技的发展,会出现一种全新的工具可以代替现在的深度学习去以另外一种技术路线实现人工智能),把这个工具用在语音识别领域,就能让机器更会听;把他用在自然语言处理领域,就能让机器更会理解;而把他用到计算机视觉领域,就能让机器更会看。
深度学习

深度学习(Deep Learning)的本质就是各种神经网络,从最早最简单的感知机,到多层神经网络,再到后来引起第一轮AI变革的CNNs、RNNs、Transformers等网络结构,再到如今的AI大模型,其目的都是构建一个合适的神经网络结构,让机器有能力“自己思考”——也称之为“智能”。大模型毫无疑问是当下最火的概念之一,它把人工智能带入了一个全新的时代,基于各类大模型的AIGC产品(如ChatGPT、Midjourney等)的诞生让人们对AI有了重新的想象。甚至很多人把今年2023年看作通用人工智能(AGI)元年,并认为大模型是帮助人类实现AGI的“终极方案”。
机器学习

关于机器学习(Machine Learning),它是比深度学习更为广泛的研究领域,发展的也比较早。在人工智能届有一种说法:认为机器学习是人工智能领域中最能够体现智能的一个分支。从发展历史来看,机器学习也的确是AI领域发展最快的分支之一。
在ML的早期发展阶段,由于计算机运算性能、样本规模等因素的限制,很多ML算法只存在于实验室和paper中,而没法在实际中应用。但是到后来,GPU 、AI芯片和超级计算机的发展很快,使得系统的计算能力和存储能力都有了很大的飞升,数据发掘引领了大数据时代的到来,让原来复杂度很高的算法得以实现,得到的结果也更为精细。
理论上,只要计算机计算能力足够强、样本数据量足够大,就可以不断增加神经网络的层数以及改变神经网络的结构,这就是“深度学习”,深度学习代表了机器学习的最新方向,同时也推动着机器学习的发展。
下面这张图很好的概括了人工智能、机器学习与深度学习三者之间的关系。



图片来源:《Deep Learning》(书籍)

人工智能新时代——AGI与大模型

今年随着ChatGPT、MidJourney和Stable Diffusion等AIGC产品的爆火,人工智能在世界范围内受到前所未有的关注。随之而来的是AI大模型、通用人工智能(AGI)、大语言模型(LLM)等一系列概念走进人们的视野,至今已经演变成“百模大战”。
尤其是ChatGPT犹如惊雷一般的出现刷新了人们对人工智能的认知——创作、翻译、私人教师、变成、润色等等,人们瞬间意识到真的有这样一个“无所不能”先生能实实在在帮助自己提高学习和工作效率。
如果对当下火爆的通用人工智能、大模型等技术感兴趣,或者想学习这方面的知识,这里有一份「知乎知学堂」联合「AGI课堂」推出的【程序员的AI大模型进阶之旅】公开课可以免费体验。2天的课程帮助理清本轮AI变革背后的技术,不管你是从业人员想跟进前沿发展动向,还是AI工具的用户想了解AI产品的技术原理以更好的帮助自己提高工作效率,甚至成为AI超级个体,你都能从课程中获取到有价值的知识。

ChatGPT之所以如此全能,是因为其背后有大模型作为引擎。大模型的独特性(如“涌现”)使得它超越了以往的深度学习方法赋予了人工智能更多的“智慧”和能力。同时也让人们开始对人工智能有了更多的想象和思考。


总体来说,人工智能可以分为三种形态:

  • Artificial Narrow Intelligence (ANI),弱人工智能;
  • Artificial General Intelligence (AGI),通用人工智能;
  • Artificial Super Intelligence (ASI),超级人工智能。
后两者也被统称为“强人工智能”。



各领域人工智能表现水平与人类的对比。图片来源:OurWorldData

严格地讲,我们现在看到的都属于“弱人工智能”——具有特定能力或能完成特定任务的人工智能。例如,赢得国际象棋比赛(RL)或从一系列照片中识别某个物体(CV);包括现在的五花八门的聊天机器人和文生图模型,以及其他各类AIGC产品都应该被划分在ANI范围之内。
而包括AGI和ASI在内的“强人工智能”则更强调具备类似人类的行为能力,例如通过语音文本理解语气和情感的能力。强人工智能的定义是基于其与人类相比的能力。通用人工智能(AGI)的表现将与人类相当,而超级人工智能(ASI),也称为超级智能,将超越人类的智力和能力。
这两种形式的强人工智能尚不存在,但该领域的研究正在进行中。尤其是今年以GPT-4和PaLM-E为代表的多模态大模型的出现,让人们看到了通用人工智能的影子。
两个月前有AI领域的专家曾经提到通用人工智能需具备的4个要素,分别是:

  • 涌现(emergence)
  • 代理(agency)
  • 功能可见性(affordence)
  • 具象(embodiment)
为什么说现在通用人工智能的影子已经初现了呢?
1、首先对于第一点,大模型的“涌现”现象和能力已经被证实。
2、第二点“代理”,意思是AI能够根据用户下达的总任务指令来自动规划并完成一系列子任务以达到最终目标,引入插件功能的ChatGPT,以及前段时间很热门的AutoGPT都属于初步迈进了这个门槛——AI Agent。
3、对于第三点“功能可见性”,它原本是一个认知和行为学领域的概念,描述的是现实世界中某个场景或物体对于人的行为的暗示,告诉人看到某物时应该能联想到它的功能。放到AGI中,其实它的意思就是AGI产品的可用功能应该与用户的需求和操作相匹配。功能可见性更像是在设计AGI系统时应该考虑的产品形态,从而保证人类与人工智能之间更好的进行互动。
4、而第四点“具象”,也称为“具身化”(embodied),则是数字化的人工智能系统与现实世界交流的物理化体现。这个概念听起来有点晦涩,但其实就是指单个AI系统能够接收并理解现实世界中多种模态的信息,比如语音、图像、触觉等等,从而完成复杂的任务。OpenAI的GPT-4模型和谷歌的PaLM-E模型已经初步具备处理多模态信息的能力。
此前谷歌曾在PaLM-E项目中演示过基于该模型的机器人完成“具身推理任务”(embodied reasoning task),比如,对机器人下达“去抽屉里拿一包零食”指令,它能够根据自身搭载的各类传感器感知世界,接收并理解多种模态的信息,然后规划子任务从而完成最终任务。


大模型正在给人工智能带来更多可能,而人工智能同样会给人类带来无限可能。之前有不少人讨论称人工智能将会为人类带来第四次工业革命,虽然我对此种观点持谨慎乐观态度,但是不可否认的是,此前人们不敢想象的一些AI工具和应用,正在出现在我们的生活中,就连看起来离我们很远的AGI也如幽灵一般若隐若现,或许它就隐藏在这些大模型的背后,不时地向我们闪现,预告人类它终将到来。
不管是从业人员,还是普通用户,我都建议大家利用好AI大模型这把火来提升自己的技能和认知。
以我自己为例,我的研究方向是计算机视觉,大(语言)模型原本并不是我关注的重点,但是从今年上半年开始,我补充了很多LLM及相关产品方面的知识。
一方面,作为AI领域的科研人员,当我去了解这些的时候,我发现我学习到的是包括技术路线、数据资源、算力、产品落地等在内的多方面的知识,这对于我提高自身能力和洞悉行业本质都有很大帮助。
另一方面,作为使用AI工具的用户,去了解大模型背后的技术和原理对我更好的使用这些工具也很有帮助,比如,在学习了一些LangChain、提示工程(Prompt Engineering)方面的知识之后,我发现在使用诸如ChatGPT这样的工具时,我可以更高效地让它生成我想要的内容,从而更大限度的发挥AI的能力,同时提高我的学习/工作效率。
这里建议感兴趣的同学可以关注一下上面提到的在线公开课「程序员的AI大模型进阶之旅」。有领域内的资深大佬带领你一起剖解AI大模型和关键技术(比如LangChain,Fine-tune等),还能领到AI大模型资料包和好用的免翻墙AI工具,这个途径要比自己去搜索各种学习资源有效多了,让你快速成为AI大模型这把火的受益者。
如何制定人工智能学习路线

对于那些不仅仅满足于AI大模型,而是希望深耕人工智能领域;以及那些还没怎么接触过人工智能、但有志于以后从事这个行业的知友,我建议应该从两个方面制定学习计划,一是学习专业知识,打实基础;二是及时跟进前沿技术和行业发展动态。
专业基础

专业知识这方面,没有太多的捷径可以走,主要还是要以书籍为主。




上面这两张图是我个人的一部分书单,年头比较多了,有一些是早期仅有电子版的时候下载的。这里重点推荐几本(默认有线性代数、概率论与统计等基础数学知识):
1、《统计学习方法》李航。一直以来都有人(点名马斯克)讽刺人工智能/机器学习就是统计学。


虽有调侃成分,但这一说法也在有它的道理,对统计学的理解很大程度上决定了你在深度学习和人工智能理论方法上的造诣,所以先好好看这本书。


2、《Pattern Recognition and Machine Learning》。如果你基础弱,这本书读起来会有点吃力,而且似乎没有中文版,属于比较难啃的,但好在它理论讲解全面、细致,对于夯实机器学习基础很有帮助。


3、《 Deep Learning: Adaptive Computation and Machine Learning series》,中文名:《深度学习》,这本书不用多说,被称为人工智能圣经,知识新颖、覆盖全面。


4、《Dive into deep learning》,中文名:《动手学深度学习》,适合边学习边实战(实战很重要),有基于不同DL框架的版本。我手里的是一本基于Pytorch的中文版,今年2月份刚出版。


跟踪前沿动态

人工智能是一个技术更新和迭代非常快的领域,及时跟进前沿技术和产品的最新发展动态至关重要。
1、这里以GPT模型为例,第一手资料当然是去阅读原文献,比如GPT-1到GPT-4的论文,以及介绍InstructGPT,RLHF等关键技术细节的论文。
2、考虑到并不是每个人一开始都有扎实的基础以支撑自己读懂原文,这时候可以选择一些专门做技术解读和论文拆解的博客文章或视频进行学习,这类资料通常以一种更通俗的方式讲解技术细节,有利于新手快速掌握关键信息。比如,下面这张图就是别人梳理的GPT模型的发展脉络,一目了然。



https://yaofu.notion.site/GPT-3-5-360081d91ec245f29029d37b54573756

3、如何快速找到某个领域的各类学习资源。
你可以通过类似上文的公开课免费获取到别人已经帮助你整理好的现成资源,但是这种往往是可遇而不可求的。大多数时候还得靠自己去搜索有用的资料。
所以,这里再告诉大家一个很好用的技巧——在谷歌搜索引擎搜索关键词“awesome xxx github”或者直接在GitHub上搜索“awesome xxx”,然后你会发现能搜出来很多项目,里面有各类资源汇总,比如论文列表、开源工具、产品动态跟踪、相关的技术解读的博文列表等等,内容非常全面。这些项目通常有人维护,保证内容及时更新。这是我个人经常使用的查阅资料的方法。



比如在GitHub上搜awesome chatgpt

最后,希望这篇回答对想要了解和学习人工智能的知友有帮助。
以上。打字不易,恳请点赞支持。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

18

积分

新手上路

积分
18
发表于 2023-12-20 10:58:46 | 显示全部楼层
作为一个大数据从业人员,相信大家整天都在被AI、机器学习、深度学习等一些概念轰炸。有时候甚至有点诚惶诚恐,一方面作为一个“业内人士”而自豪,二方面觉得新概念一个接一个,自己不甚了解,有点恐惧。现在就来拆解一下这三个名词:
人工智能(Artificial Intelligence)
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。“人工智能”是“一门技术科学”,它研究与开发的对象是“理论、技术及应用系统”,研究的目的是为了“模拟、延伸和扩展人的智能”。我们现在看到的貌似很高端的技术,如图像识别、NLP,其实依然没有脱离这个范围,就是“模拟人在看图方面的智能”和“模拟人在听话方面的智能”,本质上和“模拟人在计算方面的智能”没啥两样,虽然难度有高低,但目的是一样的——模拟、延伸和扩展人的智能。另外,人工智能在50年代就提出了。
机器学习
   随着人对计算机科学的期望越来越高,要求它解决的问题越来越复杂,已经远远不能满足人们的诉求了。于是有人提出了一个新的思路——能否不为难码农,让机器自己去学习呢?
机器学习就是用算法解析数据,不断学习,对世界中发生的事做出判断和预测的一项技术。研究人员不会亲手编写软件、确定特殊指令集、然后让程序完成特殊任务;相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。这里有三个重要的信息:1、“机器学习”是“模拟、延伸和扩展人的智能”的一条路径,所以是人工智能的一个子集;2、“机器学习”是要基于大量数据的,也就是说它的“智能”是用大量数据喂出来的;3、正是因为要处理海量数据,所以大数据技术尤为重要;“机器学习”只是大数据技术上的一个应用。常用的10大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。
深度学习
  相较而言,深度学习是一个比较新的概念,严格地说是2006年提出的。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点,是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和自然语言处理(NLP)领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者我们可以将“深度学习”称之为“改良版的神经网络”算法。深度学习又分为卷积神经网络(Convolutional neural networks,简称CNN)和深度置信网(Deep Belief Nets,简称DBN)。其主要的思想就是模拟人的神经元,每个神经元接受到信息,处理完后传递给与之相邻的所有神经元即可。所以看起来的处理方式有点像下图(想深入了解的同学可以自行google)。


神经网络的计算量非常大,事实上在很长时间里由于基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一下子火热起来。击败李世石的Alpha go即是深度学习的一个很好的示例。Google的TensorFlow是开源深度学习系统一个比较好的实现,支持CNN、RNN和LSTM算法,是目前在图像识别、自然语言处理方面最流行的深度神经网络模型。事实上,提出“深度学习”概念的Hinton教授加入了google,而Alpha go也是google家的。
总结:人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是需要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还需要更高的运算能力支撑,如GPU。


书单推荐:

1.Deep Learning



这本书介绍很全面,由深度学习领域的专家撰写。被称为 AI 圣经,因为它将这个领域多年的研究汇集到一本书中。
如果你是一个有抱负的学生想要掌握深度学习并深入研究,或者你想教授深度学习课程,那么这本书肯定会对你有帮助。这本书可能是目前关于深度学习最全面的图书。
2.Deep Learning: A Practitioner's Approach



本书使用了 DL4J 这个 Java 库来训练和实现深度神经网络。针对初学者,如果你在 Java 或深度学习领域已经很有经验,可以直接去看它的例子。如果你没有深度学习的经验,但有很好的 Java 基础,建议你逐页阅读本书。如果你不了解 Java,则需要先去入门 Java。
通过阅读这本书,你将大致了解机器学习,特别是深度学习的基本概念。你将了解深度神经网络是如何从基本的神经网络演化而来。了解一些深度网络的架构,例如卷积神经网络(CNN)和循环神经网络(RNN)。
3.深度学习入门:基于 Python 的理论与实现



本书是深度学习真正意义上的入门书,深入浅出地剖析了深度学习的原理和相关技术。书中使用 Python3,尽量不依赖外部库或工具,从基本的数学知识出发,带领读者从零创建一个经典的深度学习网络,使读者在此过程中逐步理解深度学习。
4.模式识别与机器学习



作者是 Christopher M. Bishop。本书提出了近似推理算法和用于描述概率分布的图模型等多种最新分类方法。在阅读本书之前,最好有多变量微积分和基本线性代数等数理基础,面向人群为高年级本科生、研究生和相关研究人员。

更多精彩内容可以关注 华为云技术宅基地

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

19

积分

新手上路

积分
19
发表于 2023-12-20 10:59:38 | 显示全部楼层
看了大家的答案决定简答一波~一张图终结该问题(呸)!


人工智能由人类制造出的机器表现出的智能。这是一个非常大的范围,长远目标是让机器实现类人智能。 不过目前我们还在非常非常初级的阶段,甚至都不能称为智能。
机器学习是指通过数据训练出能完成一定功能的模型,是实现人工智能的手段之一,也是目前最主流的人工智能实现方法
深度学习则是机器学习的分支。深度即层数,超过 8 层的神经网络模型就叫深度学习——目前在语音、图像等领域取得了很好的效果。
所以三者之间是从大到小的包含关系~

书籍的话想要入门不需要太多,2 本书即可——
1、周志华教授的《机器学习》,著名的「西瓜书」,【文科生也不用害怕的机器学习专业书】!
或者李航教授的《统计学习方法》,特点是简洁高效、深入浅出,非常优美~但文科生入门大概不太行。
可根据自己的情况任选其一。
2、Ian Goodfellow、Yoshua Bengio、Aaron Courville 合著的《深度学习》,去年 8 月出了中文版,条理清晰,不论有没有基础都可以根据情况,选择适合自己的章节阅读。
如果对人工智能的学科背景及应用方向感兴趣,推荐轻松有趣的《漫谈人工智能》,编著这本书的集智俱乐部中有有好几位都是人工智能行业的创业者。从基础科普到自然语言处理、群集智能、天气预测应有尽有,是一本【相当有诚意的人工智能类科普读物】。

以上就是我们的答案和推荐,并感谢你看到这里(●°u°●) 」
我们会不定期奉上轻松有趣的科普视频,
及解读人工智能行业、历史的深度文章,
欢迎关注!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

1

回帖

0

积分

新手上路

积分
0
发表于 2023-12-20 10:59:47 | 显示全部楼层
人工智能并不是一个新的术语,它已经有几十年的历史了,大约从80年代初开始,计算机科学家们开始设计可以学习和模仿人类行为的算法。
在算法方面,最重要的算法是神经网络,由于过拟合而不是很成功(模型太强大,但数据不足)。尽管如此,在一些更具体的任务中,使用数据来适应功能的想法已经取得了显着的成功,并且这也构成了当今机器学习的基础。
在模仿方面,人工智能专注于图像识别,语音识别和自然语言处理。人工智能专家们花费了大量的时间来创建诸如边缘检测,颜色配置文件,N-gram,语法树等。不过,这些进步还不足以达到我们的需求。
传统的机器学习:
机器学习(ML)技术在预测中发挥了重要的作用,ML经历了多代的发展,形成了具有丰富的模型结构,例如:
1.线性回归。
2.逻辑回归。
3.决策树。
4.支持向量机。
5.贝叶斯模型。
6.正则化模型。
7.模型集成(ensemble)。
8.神经网络。
这些预测模型中的每一个都基于特定的算法结构,参数都是可调的。训练预测模型涉及以下步骤:
1.  选择一个模型结构(例如逻辑回归,随机森林等)。
2.  用训练数据(输入和输出)输入模型
3.  学习算法将输出最优模型(即具有使训练错误最小化的特定参数的模型)。
每种模式都有自己的特点,在一些任务中表现不错,但在其他方面表现不佳。但总的来说,我们可以把它们分成低功耗(简单)模型和高功耗(复杂)模型。选择不同的模型是一个非常棘手的问题。
由于以下原因,使用低功率/简单模型是优于使用高功率/复杂模型:

  • 在我们拥有强大的处理能力之前,训练高功率模型将需要很长的时间。
  • 在我们拥有大量数据之前,训练高功率模型会导致过度拟合问题(因为高功率模型具有丰富的参数并且可以适应广泛的数据形状,所以我们最终可能训练一个适合于特定到当前的训练数据,而不是推广到足以对未来的数据做好预测)。
然而,选择一个低功率的模型会遇到所谓的“欠拟合”的问题,模型结构太简单,如果它复杂,就无法适应训练数据。(想象一下,基础数据有一个二次方关系:y = 5 * x ^ 2;你无法适应线性回归:y = a * x + b,不管我们选择什么样的a和b。
为了缓解“不适合的问题”,数据科学家通常会运用他们的“领域知识”来提出“输入特征”,这与输出关系更为直接。(例如,返回二次关系y = 5 * square(x),如果创建了一个特征z = x ^ 2,则可以拟合线性回归:y = a * z + b,通过选择a = 5和b = 0)。
机器学习的主要障碍是特征工程这个步骤,这需要领域专家在进入训练过程之前就要找到非常重要的特征。特征工程步骤是要靠手动完成的,而且需要大量领域专业知识,因此它成为当今大多数机器学习任务的主要瓶颈。
换句话说,如果我们没有足够的处理能力和足够的数据,那么我们必须使用低功耗/更简单的模型,这就需要我们花费大量的时间和精力来创建合适的输入特征。这是大多数数据科学家今天花时间去做的地方。
神经网络的回归:
在大数据时代,云计算和大规模并行处理基础架构的共同发展,使得机器处理能力在二十一世纪初得到了极大的提升。我们不再局限于低功耗/简单的模型。例如,当今最流行的两种主流机器学习模型是随机森林和梯度提升树。尽管如此,两者都非常强大,并且提供了非线性模型拟合的训练数据,但数据科学家仍然需要仔细地创建特征以获得良好的性能。
与此同时,计算机科学家重新使用神经网络的许多层来完成这些人类模仿的任务。这给DNN(深度神经网络)带来了新的生机,并在图像分类和语音识别任务方面提供了重大突破。DNN的主要区别在于,你可以将原始信号(例如RGB像素值)直接输入DNN,而不需要创建任何域特定的输入功能。通过多层神经元(这就是为什么它被称为“深度”神经网络),DNN可以“自动”通过每一层产生适当的特征,最后提供一个非常好的预测。这极大地消除了寻找“特征工程”的麻烦,这是数据科学家们最喜欢看到的。
DNN也演变成许多不同的网络拓扑结构,所以有CNN(卷积神经网络),RNN(递归神经网络),LSTM(长期短期记忆),GAN(生成敌对网络),转移学习,注意模型(attention model)所有的这些被统称为深度学习(Deep Learning),它正在引起整个机器学习界的关注。
强化学习:
另一个关键组成部分是关于如何模仿一个人(或动物)的学习,设想感知/行为/奖励循环的非常自然的动物行为。一个人或者一个动物首先会通过感知他或者她所处的状态来了解环境。在此基础上,他或者她会选择一个“动作”,将他或者她带到另一个“状态”。那么他或她将获得“奖励”,循环重复,直到他或她消失。这种学习方式(称为强化学习)与传统监督机器学习的曲线拟合方法有很大不同。尤其是,强化学习学习得非常快,因为每一个新的反馈(例如执行一个行动并获得奖励)都被立即发送到影响随后的决定。
强化学习也提供了预测和优化的平滑整合,因为它在采取不同的行动时保持当前状态的信念和可能的转换概率,然后做出决定哪些行动可以导致最佳结果。
深度学习+强化学习= AI
与经典的ML技术相比,DL提供了一个更强大的预测模型,通常可以产生良好的预测结果。与经典优化模型相比,强化学习提供了更快的学习机制,并且更适应环境的变化。
机器学习 vs 深度学习
在深度探讨machine learning和data science的联系之前,这里简要地讨论一下machine learning 和deep learning。machine learning是一套算法,来训练数据集做预测或者采取行动以使得系统最优化。举例来说,supervised classification algorithms被用来根据历史数据将想要贷款的客户分成预期好的和预期差的(good or bad prospects)。对于给定的任务(比如监督聚类),需要的技术多种多样:naive Bayes、SVM、neural nets、ensembles、association rules、decision trees、logistic regression,或者是很多技术的组合。所有这些都是数据科学的子集。当这些算法自动化后,比如无人驾驶飞机或者无人驾驶汽车,这就叫AI了,或者说的具体一点,deep learning。如果采集的数据来自传感器并且通过互联网传播,那么这就是机器学习或数据科学或深度学习应用于物联网了。
有些人对深度学习有不同的定义,他们认为深度学习是更深层次的神经网络(一种机器学习的技术)。AI(Artificial Intelligence)是创建于20世纪60年代的计算机科学的一个子领域,是关于解决那些对人类来讲非常容易但是对计算机而言很难的任务。值得一提的是,所谓的strong AI可能可以做所有人类可以做的事情(可能除了纯粹的物理问题)。这是相当广泛的,包括各种各样的事情,比如做计划,在世界上到处溜达,识别物体和声音,说话,翻译,社交或者商业交易,还有创造性工作(比如写诗画画)等等。
NLP(Natural language processing)只是AI要处理的语言部分,尤其是写。
Machine learning是这样的一种情况:给出一些可以被以离散形式描述的AI问题(比如从一系列动作中选出对的那个),然后给定一堆外部世界的信息,在不需要程序员手动写程序的情况下选出那个“正确的”行为。通常情况需要借助外界的一些过程来判断这个动作对不对。在数学上,这就是函数:你给一些输入,然后你想要他处理一下得到正确的输出,所以整个问题就简化为用一些自动的方式建立这种数学函数模型。和AI区分一下:如果我写了一段特别机智的程序有着人类的行为,那这就可以是AI,但是除非它的参量都是自动从数据中学会的,否则就不是机器学习。
Deep learning是当下非常流行的机器学习的一种。它包含一种特殊的数学模型,可以想成是一种特定类型的简单块的组合(或者说是块的功能的组合),这些块可以进行调整来更好的预测最终结果。
原文:http://click.aliyun.com/m/1000308131/
更多技术干货敬请关注云栖社区知乎机构号:阿里云云栖社区 - 知乎
回复

使用道具 举报

0

主题

3

回帖

18

积分

新手上路

积分
18
发表于 2023-12-20 11:00:34 | 显示全部楼层
人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。
为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。



图一 人工智能的应用

人工智能:从概念提出到走向繁荣

1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转,或被称作人类文明耀眼未来的预言,或被当成技术疯子的狂想扔到垃圾堆里。直到2012年之前,这两种声音还在同时存在。
2012年以后,得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。据领英近日发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI(人工智能)领域技术人才数量超过190万,仅国内人工智能人才缺口达到500多万。
人工智能的研究领域也在不断扩大,图二展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。



图二 人工智能研究分支

但目前的科研工作都集中在弱人工智能这部分,并很有希望在近期取得重大突破,电影里的人工智能多半都是在描绘强人工智能,而这部分在目前的现实世界里难以真正实现(通常将人工智能分为弱人工智能和强人工智能,前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题)。
弱人工智能有希望取得突破,是如何实现的,“智能”又从何而来呢?这主要归功于一种实现人工智能的方法——机器学习。
机器学习:一种实现人工智能的方法

机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。
举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。
机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。
传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。
深度学习:一种实现机器学习的技术

深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。
最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。
深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。
三者的区别和联系

机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。



图三 三者关系示意图

目前,业界有一种错误的较为普遍的意识,即“深度学习最终可能会淘汰掉其他所有机器学习算法”。这种意识的产生主要是因为,当下深度学习在计算机视觉、自然语言处理领域的应用远超过传统的机器学习方法,并且媒体对深度学习进行了大肆夸大的报道。
深度学习,作为目前最热的机器学习方法,但并不意味着是机器学习的终点。起码目前存在以下问题:
1. 深度学习模型需要大量的训练数据,才能展现出神奇的效果,但现实生活中往往会遇到小样本问题,此时深度学习方法无法入手,传统的机器学习方法就可以处理;
2. 有些领域,采用传统的简单的机器学习方法,可以很好地解决了,没必要非得用复杂的深度学习方法;
3. 深度学习的思想,来源于人脑的启发,但绝不是人脑的模拟,举个例子,给一个三四岁的小孩看一辆自行车之后,再见到哪怕外观完全不同的自行车,小孩也十有八九能做出那是一辆自行车的判断,也就是说,人类的学习过程往往不需要大规模的训练数据,而现在的深度学习方法显然不是对人脑的模拟。
深度学习大佬 Yoshua Bengio 在 Quora 上回答一个类似的问题时,有一段话讲得特别好,这里引用一下,以回答上述问题:
Science is NOT a battle, it is a collaboration. We all build on each other's ideas. Science is an act of love, not war. Love for the beauty in the world that surrounds us and love to share and build something together. That makes science a highly satisfying activity, emotionally speaking!
这段话的大致意思是,科学不是战争而是合作,任何学科的发展从来都不是一条路走到黑,而是同行之间互相学习、互相借鉴、博采众长、相得益彰,站在巨人的肩膀上不断前行。机器学习的研究也是一样,你死我活那是邪教,开放包容才是正道。
结合机器学习2000年以来的发展,再来看Bengio的这段话,深有感触。进入21世纪,纵观机器学习发展历程,研究热点可以简单总结为2000-2006年的流形学习、2006年-2011年的稀疏学习、2012年至今的深度学习。未来哪种机器学习算法会成为热点呢?深度学习三大巨头之一吴恩达曾表示,“在继深度学习之后,迁移学习将引领下一波机器学习技术”。但最终机器学习的下一个热点是什么,谁又能说得准呢。
近期,深蓝学院推出『深度学习:从理论到实践』在线课程,将从基础的数学模型以及算法实现出发,详细讲解CNN、 RNN、 LSTM等常见的深度神经网络模型,以及在计算机视觉、自然语言处理等领域经典任务中的应用。详情如下:
深度学习理论与实践 - 深蓝学院 - 专注人工智能的在线教育<hr/>深蓝学院(https://www.shenlanxueyuan.com/)是专注于人工智能的在线教育平台,致力于构建前沿科技课程培养体系的业界标准,涵盖机器学习、计算机视觉、智能语音、智能机器人等领域。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-22 13:48 , Processed in 0.063202 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表