从应用的角度来看,深度学习怎样快速入门?
本题已插手知乎圆桌进击吧,机器人»,更多相关话题欢迎存眷圆桌参与讨论,一同了解机器人、人工智能和我们此刻、未来相关的那些事。如题,谢谢各位辅佐~ 很简单,边学理论边实战,三个月绝对能快速人深度学习!!!
我用八千字,总结了一份超详细的保姆级深度学习从零入门路线图,分享给大家;
我把这个路线图范围六个部分:
[*]基础知识;
[*]机器学习理论入门;
[*]机器学习竞赛实战;
[*]深度学习理论入门;
[*]深度学习竞赛实战;
[*]深度学习面试题汇总;
整个路线图的思维导图如下,我把对应的视频和github链接全部放在了思维导图备注里面;
也可以搭配着视频观看:
三个月从零入门深度学习,保姆级学习路线图_哔哩哔哩_bilibili
http://picx.zhimg.com/v2-d2175e149992cf82b65438e7fe9725ca_r.jpg?source=1940ef5c
针对这六个部分,我们一个个的来看:
1.基础知识学习
首先,我们来看基础知识部分;
你需要掌握两个方面;第一个是数学,第二个是Python面向对象编程的基础;
首先对于数学来讲,我想很多搜索入门路线图的朋友,都会被推荐很多数学方面的大部头的书籍和视频和科目,比如说:微积分、线性代数、概率论、复变函数、数值计算等等;
我觉得如果当前的任务是入门,而不是做一些开创性的研究,这些并不全是没有必要;
从的建议来说,首先掌握线性代数里面的:向量、矩阵、运算、范数、特征向量和特征值;
我这里推荐一个中文视频,【两个小时快速复习线性代数】;链接看我思维导图思维导图的对应位置;
在复习的时候,不需要你完全记住,但是需要你用笔记画一个大致脉络图出来,把各个细节写上去,在以后需要用到的这个时候,像查字典一样能够查到就可以;
其次对于高数来说,需要掌握的主要就是4个:导数,梯度,泰勒公式,和概率论;概率论快速的过一遍就可以,了解一些基本概念,比如说条件概率,最大似然估计等等,我这里推荐一个视频,【1个小时快速复习概率论】;链接看我思维导图思维导图的对应位置;
有了这些数据基础,对于入门深度学习就够了;之后,如果遇到不懂的,在这个之外,我们再去学来得及;
第二个基础知识是Python;
Python是一种编程语言,是我们后面机器学习和深度学习中数据处理,实现模型的主力语言;
对于Python而言,不需要你很精通,只需要有一定的Python 面向对象编程的的基础就可以;
在这里,理论方面,我推荐廖雪峰的Python课程,这个课程没有必要都看,地址在思维导图备注
这个视频里面的目录,并不是都去学习,我们只需要从第一个简介开始,学习到常用的第三方模块;之后,有了一定的Python基础,就可以不用学习了;
之后需要提升的你的实战能力,我给你大家推荐一本书,学起来也很快,叫做【用Python做数据分析】;
这本书的中文翻译版链接在这里:见思维导图备注
这本书,不用全都看,看重点章节就可以;当然全看了,也很快,因为这本书本身学习起来就很简单;
我为什么推荐这本书呢?首先第一点,这本书确实看起来很简单,入门门槛极低,第二,这本书的内容,在我们往后的机器学习和深度学习关系很密切,因为我们在构建模型之前,需要很多操作去处理数据,用到这本书介绍的这两个api包;
看完廖雪峰的教程和这本书,你会掌握两个东西,一个python基础知识,一个是究竟怎么用Python实战去处理数据;
2.机器学习理论入门
第二个部分,我来重点介绍机器学习理论入门路线图;
对于机器学习理论算法,我推荐一本书籍和一个博客和一个Python包
书籍是:李航的统计学习,主要,不是全都看,我一会会告诉你看哪几个章节;
博客是刘建平老师的博客,Python包是sklearn;
我们先来看这个统计学习,我谈三个准则:
三个准则是:
第一,作为入门选手,不要每章都去看;
第二,不要用python从零去造轮子去实现这本书里面的算法,千万不要这样做,太浪费时间;
第三个,对于重点章节算法必须能做到手推公式,重点算法其实不多,一会说;
这本书一共是分为了11章,你只需要去看其中的六章内容,分别是:1,2,4,5,6,8
我带大家看一下这本书目录:
第一章是统计学习概论;这章是在学习整个机器学习的一些基础概念,比如说什么是回归问题,什么是分类问题;什么是正则化,什么是交叉验证,什么是过拟合等等基础概念;必须掌握,没有商量的余地;
第二章是感知机,是最简单机器学习模型,也和后面的神经网络有关系,必须掌握
第三章是K近邻算法,这个你现在不需要看,跳过它;
第四章是朴素贝叶斯算法,这个非常重要,里面的概念比如说后验概率,极大似然估计之类的,必须掌握
第五章是决策树:这很简单,就是如何特征选择,两个决策树算法;也要掌握
第六章是逻辑回归和最大熵;要看
第七章支持向量机,我说一下我的观念哈,我认为这章不需要看;为什们呢?首先在我自己的工作中,几乎没用过支持向量机;而且现在,在今天,如果你在面试深度学习岗位的时候,有的面试官还在让你手推SVM公式的话,我认为这个面试官是不合格的,这个公司可能未必是你很好的一个选择;
第八章提升树,必看,这个提升树算法非常重要;
第九章第十章第十一章,都不需要看;对于隐马尔科夫和条件随机场,之后你如果想深入学NLP,再来看;对于EM算法,入门之后你碰到的时候再去看;
我刚才谈到,对于重点算法必须能够手推公式,哪几个重要呢?不多,逻辑回归,朴素贝叶斯,以及提升树里的xgboost算法;别的算法,你能够自己复述一遍讲出来,就够了;
在看的过程中,如果有不懂的怎么办?就是我刚才推荐一个刘建平老师的博客;
在这里:见思维导图备注
这个博客很好,有对应理论介绍,也有使用sklearn实现代码;
我刚才还谈到一个准则,是不要去从零造论文实现算法,因为sklearn可以很好的帮助你;
在这个过程中,你要去搞清楚这个算法输入数据,输出数据,每个参数的含义是什么;可以自己自己调一下参数,看看不同参数下最终效果有什么不同;但是在这里不要花费太大精力在调参上,因为你现在代码实现的是一个demo,数据量很小,调参没什么意义;什么调参呢?我一会会讲到;
整个机器学习理论部分,如果你真的认真去学习,三周时间,你肯定能搞定;你想啊,总共看6章,每章你看四天,这四天,你期中三天看理论部分,一天用代码跑一遍熟悉一下感觉;
其实代码这块要跑起来,很快,都不需要一天,两三个小时就可以;四天搞定一章,三周看完一点问题没有;
3.机器学习竞赛实战
然后重点来了,理论部分看完了,也用sklearn做简单的代码实践了,接下来做什么呢?要把这些算法用到实践中去;
也就是我要谈的机器学习竞赛代码实战:在这里,我只推荐一本书,叫做:
阿里云天池大赛赛题解析——机器学习篇;
记住啊,是机器学习篇,不是深度学习篇;
我先说这本书要不要买:首先我自己是买了这本书,但是我发现书很厚,但是有大量的代码占据了很大篇幅;后来发现代码在天池上已经开源了,所以买完之后有一点点后悔;不过就全当为知识付费了;
拿你们要不要买呢?我觉得没啥必要,反正代码是开源的,一会我告诉链接;不过要想支持一下书的作者的话,可以买一本支持一下;就不要下次一定了;
天池是一个竞赛平台,这本书里面它包含了四个实战型的任务:
工业蒸汽预测
天猫用户重复购买预测
O2O优惠券预测
阿里云安全恶意程序检测
我来告诉大家怎么看这本书:
有四个任务是吧,你挑其中的一个或者两个,不需要都看,没必要;
怎么确定把这一个或者两个任务吃透呢?
七个步骤:赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7个步骤
开源代码的链接我放在了思维导图的备注;
就像我说的,四个任务中挑一个或者两个,在一周,七天,三天看一个,七天看两个,或者七天你就看一个,比如第一个,把它吃透就够了;
看完之后,你会对之前学习的统计学习书籍里面机器学习算法有一个非常清楚的认识;
所以整个机器学习的理论和代码时间,花费时间为1个月;
4.深度学习理论学习
我把深度学习的入门仿照机器学习,也分为两个部分,先学理论,再实战打比赛;
其实说心里话,深度学习入门比机器学习入门要简单的多;
在网上很多朋友在推荐深度学习入门路线的时候,会谈到李沐老师【动手深度学习】;我自己也在跟着学习这个课程,我也学到了很多;
但是讲心里话,如果是带入一个初学者的角度去看这门课程,可能会有听不懂的情况;所以这门课程可以先放一放,我给大家推荐两个视频和一本书;
我们都知道深度这块主要就是分为NLP和CV;
NLP任务上大概可以分为四种:文本分类 文本匹配 序列标注 文本生成,
CV任务大致也可以分为图像理解和生成:理解这块大致可以分为:分类、检测、分割、追踪; 生成这块基本就是GAN模型
对于入门来说,我们不用学这么多,我们只需要学籍基础的神经网络,然后通过文本分类和图片分类任务去熟悉掌握整个徐娜林和预测流程,比如数据处理,模型搭建等呢吧;
所以我推荐的这两门课程也是很出名的:
就是大家常说的cs231n 和CS224n;
我来告诉大家怎么看这两个视频,同样不是全部都看;
[*]推荐的视频cs231n;
B站视频链接见思维导图;
整个视频在B站是分为了33讲,作为入门来说,主要是学习p1-p22;
也就是从第一讲课程介绍-计算机视觉概述到循环神经网络;
我们来打开看一眼:
然后这个视频不是让你一直看,看完一部分之后,去完成对应作业;
它的作业有三个,我把实现代码链接放在这里:见思维导图备注
你去做前两个,实现图像分类任务,实现卷积神经网络:bn,dropout,cnn 都要看一下;
第三个作业比较复杂,大家不用去看,只需要做前两个;
注意,不需要自己从零去做这个作业,直接看给的代码仓库,去看人家怎么实现的,当然你如果有自信而且想要锻炼自己,没问题,可以从零去实现。但是对于大部分人,你去对照着代码一行行的看,去理解为什么这儿写,输出输入是什么;
在这个过程,就会涉及到一点,就是框架的学习,我推荐大家使用Pytorch;
框架框架学习,我这里我后面会讲到,我先在这里插一句,就是大家可以去看B站刘二大人,地址在这里:见思维导图备注
它这个pytorch学习曲线比较平滑,大家在在看计算机视觉视频之后,完成代码的部分,如果有不懂的地方,穿插着去看这个刘二大人的视频;
因为刘二大人这个视频会涉及到CNN和RNN,所以如果你一开始就看,可能会有点费劲;
我举个例子吧,比如说你看完CNN网络,然后你去完成第二个作业,突然你发现里面有些不懂,不知道为什么这么弄,然后你去看刘二大人对应的视频讲CNN代码的;是这么个顺序啊;
整个计算机市局视频和代码学习完之后,你必须要掌握到什么程度呢?
必须要把下面这些完全掌握:
反向传播梯度回传,损失函数,优化算法,多层感知机,卷积神经网络,普通的循环神经网络,以及一些dropout和BN掌握住;
2. 自然语言处理:
推荐一个视频,非常经典的 CS224n:
链接:见思维导图备注
这个课程不是需要都看,要有选择的看:
在B站的官方主页,它包含了18讲的内容;在入门阶段,你只需要看P1-P5和P8,P9,P11;
通过看这个视频你要能够达到什么地步呢?
其实这个视频和cs231n在基础部分是重叠的,对于基础部分,大家可以都看,两者兼学会更好
必须熟悉的掌握:反向传播,词向量,RNN,GRU,Lstm,Seq2Seq以及attention机制;初步了解卷积神经网络;
有作业,一定要认真做,自己写不出来,仿照着别人的写:见思维导图备注
作业也不是都写:重点看a1,a2,a4,a5;其实a5这个不做的话,也没问题,把前面给的这个三个一定自己走一遍;
作业涉及到词向量和机器翻译;
有的朋友常常会和我反应,不知道att这种细节是如何实现的,其实这些都是最基础的东西,一定要从零看代码,有余力的话,可以自己实现一遍,非常有帮助;
在学习这两个视频的过程中,视频是英文的,而且涉及到的一些经典概念,不太容易理解,那么必须要看这本书:
邱锡鹏
代码的学习过程中,不用去过度的关注调参之类的,而是关注代码是怎么写的;因为调参这块tricks后面我会有专门的部分提升;
3.Pytorch框架学习
pytorch框架的学习:其实这个pytorch学习应该是融合在上面这个计算机视觉学习中的;可以在看完视频只有,写作业之前,先刷一遍这个Pytorch教学视频;
B站的刘二大人:《PyTorch深度学习实践》完结合集 https://www.bilibili.com/video/BV1Y7411d7Ys?from=search&seid=1631997590037031874&spm_id_from=333.337.0.0
但是它好像没有源代码,评论区有小伙伴手敲了代码,地址在这:https://blog.csdn.net/bit452/category_10569531.html
5.深度学习竞赛实战:
重点来了,上面谈到的这些深度学习的东西,都是在给你打基础;
但是要记住,我们学习深度学习是为了实战:我给大家准备了两个学习曲线非常平滑的实战项目;
一个是新闻分类项目,一个是街景字符识别,也就是图片分类项目,有的人可能会认为这两个项目非常简单,但是我认为千万不要小瞧这两个项目,扎扎实实做完这两个项目,对你的帮助绝对比你想象的要大;
先说NLP的新闻文本分类任务;地址在这里:见思维导图备注
就像我所说的,这个任务是一个NLP中一个基础任务-文本分类任务;这也是绝大部分从业的业务型NLP工程师日常工作最常见的工作需求;所以掌握好这个任务非常关键;
那么怎么掌握呢?在天池上,有开源的赛题解析,我挑选几个我认为很好的notebook给到大家;
task1:赛题理解:
jupyter notebook 链接,见思维导图备注
就是仿照你工作的时候,运营人员怎么给你提的需求,你听完需求要去分析它是什么问题,是个分类问题,回归问题,NLP问题,CV问题,多模态问题?
task2:分析数据:去看字符分布,最大长度,链接思维导图备注
task3:基于机器学习的文本分类任务:先做一个baseline出来,不是先搞大模型复杂东西出来;
链接见思维导图备注
task4:不同深度学习模型:
fastext:它是一种词向量,也是一种文本分类模型:对应的论文链接在这里:对应的我的博客解读,在这里,链接见思维导图备注
w2C:在视频有介绍对应的论文链接对应的我的博客解读在这里
textcnn:也就是用CNN模型来做,链接见思维导图备注
textrnn:使用RNN做,链接见思维导图备注
之前深度学习视频学了,CNN,RNN等基础网络,这里你就去实战这些模型;
bert;这个可以先不看,等你入了深度学习的门,认为自己想搞NLP这个方向了,你再去看相关的论文;我把链接放在这里吧:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.24.6406111aE3Lglg&postId=118259
第二个任务是CV任务:图片分类任务: 街景字符编码识别
链接:见思维导图备注
task1 赛题理解
链接见思维导图备注
task数据读取与数据扩增
链接见思维导图备注
task3构建
链接思维导图备注
task4模型的训练,链接思维导图备注
task4模型的集成:
链接见思维导图备注
做完这个任务,你会对在CV领域,如果加载自己的图片数据集,如何构建CV模型,增强数据,模型验证都有一个很清晰的了解;
在这两个任务实施的时候,大家可以尽情的调参,尝试各种各样的tricks提升自己的成绩;
整个深度学习
面试题:
百面机器学习;视频最后面我会提供给大家这本书非常好,真的非常好; 思维导图
从应用的角度来看,不推荐买大部头书籍,一般大部头买来都扔书架上吃灰了(都看完的算你nb),最实用的还是一些工具的document。实际场景,一般是遇到问题,查阅,遇到问题,查阅的循环过程,光啃书不实践,记不住啊,还体会不到乐趣,消磨积极性。
以下罗列一下常用document和网站,少而精才是有效推荐
竞赛
kaggle、阿里天池
document
编程工具:Python、PyTorch、OpenCV
代码库
图像分类:pytorch-image-models 基本上涵盖所有主流网络
目标检测: MMDetection、Detectron2 这两个都是优秀的代码库,值得学习借鉴
查阅各个领域的最新进展,可以查阅这个网站,会记录一些sota的paper和code链接:paper-with-code
学习视频只推荐三个
机器学习:李宏毅机器学习 (打包到Smarter了) 上课太有趣了
计算机视觉:李飞飞cs231n (打包到Smarter了)
经典paper解析:AI百篇经典论文
如果非要买书,机器学习可以买一些书籍,比如统计学习方法、西瓜书
《机器学习》俗称西瓜书,图例多容易理解,缺点较厚实,推理过程不详细。
《统计学习方法》比起西瓜书,更干,推理详尽,篇幅少,但是图例少不容易理解。
从实用主义出发,以上入门完全够用了,对深度学习和计算机视觉有了一些了解,后面就可以自己愉快的玩耍了。
欢迎关注Smarter,构建CV世界观,输出优质内容
欢迎加入Smarter交流群,添加微信「cjy094617」,备注「学校-方向」即可
陀飞轮:Smarter交流群 深度学习算法的应用领域非常多,例如医疗、自动驾驶、诈骗检测、手写数字生成、视觉识别、语言翻译等等。如果只是对某一个应用领域感兴趣,可以专门阅读相关的文献。
深度学习的应用(网络图片)
如果是深度学习在机械设备故障诊断方面的应用,可以考虑深度残差收缩网络。
https://www.etssolution-asia.com/blog/condition-monitoring-techniques-applications-and-tools
残差收缩网络是在残差网络中添加了软阈值化,或者将Squeeze-and-Excitation Network的特征加权改成了软阈值化,从而更利于含噪声、高冗余数据的特征学习。
深度残差收缩网络
深度残差收缩网络事实上是一种通用的特征学习方法。这是因为很多特征学习的任务中,样本中或多或少都会包含一些噪声,以及不相关的信息。这些噪声和不相关的信息,有可能会对特征学习的效果造成影响。例如说:
在图片分类的时候,如果图片同时包含着很多其他的物体,那么这些物体就可以被理解成“噪声”;深度残差收缩网络或许能够借助注意力机制,注意到这些“噪声”,然后借助软阈值化,将这些“噪声”所对应的特征置为零,就有可能提高图像分类的准确率。
在语音识别的时候,如果在声音较为嘈杂的环境里,比如在马路边、工厂车间里聊天的时候,深度残差收缩网络也许可以提高语音识别的准确率,或者给出了一种能够提高语音识别准确率的思路。如何写人工智能方面的sci? 我们是产品公司,所以技术对于我们而言就是应用为主。深度学习在产品上肯定是有应用的。至于题主说的快速入门问题,一句话结论就是:
跟随一门专业课程例如斯坦福公开课,学完,做完题,然后练习kaggle比赛,再接触实际项目就会很轻松了。
我博士读的是机器学习,当时根本不敢说自己是做“人工智能”的,人工智能包含太多的学科了,除了计算机科学,还包括认知科学,心理学,哲学等等。但媒体炒作出了AI的概念,所有的东西变成了AI了。
而深度学习,我认为其实上手更容易,也不需要懂很多数学理论性的东西,深度学习严重依赖于经验和调参。尤其是现在利用现成的框架如TensorFlow,PyTorch,MXNet等,一个没有接触过深度学习的同学会很容易上手并成为“专家”(专业的调参师)。但鲜有人真正在理论上做出突破。
所以我们面试的时候,其实不是很关注深度学习的能力,而是更关注面试者的数学、传统机器学习能力以及逻辑能力。
可以跟大家再啰嗦一下人工智能的现状。下面一些资料都源自我以前的演讲以及一些文章。我们都知道,目前人工智能第三波热潮是随着深度学习的发展而来的。
下图是去年Gartner发布的技术曲线(之所以用2018的图,是因为正好深度学习处于巅峰往下降的过程。注意波峰的那个浅蓝点。)
以大数据为基础的深度学习,其实在理论上并未有突破,而是随着软件硬件的进步,达到了以往不可能企及的效果。因此,随着数据红利的消失,深度学习的天花板也逐渐显现。
上面的图就是Gartner每年都会发布的技术趋势曲线,会聚焦在未来5到10年间,可能产生巨大竞争力的新兴技术。在图中我们可以看到,深度学习(Deep Learning)已经走到高原期(Peak of Inflated Expectations),而知识图谱(Knowledge Graph)还是在起步阶段(Innovation Trigger),更不用说脑机接口(Brain-Computer Interface)、通用人工智能(Artificial General Intelligence)这些技术,在图中的标记还是黄色三角,也就是起码10年会后才能到达高原期。
一个说法是,某一技术的代表性人物拿到图灵奖,就证明了这个技术已经不会再有突破性进展。而今年,深度学习的三位创造者Yoshua Bengio, Yann LeCun, 以及Geoffrey Hinton获得了2019年的图灵奖。所以深度学习的天花板也就到了。
人工智能技术远未达到媒体中所宣传的神通广大,无所不能,从技术发展现状也可一窥端倪。AlphaGo可以战胜最好的人类棋手,但却不可能为你端一杯水。著名机器人学者Hans Moravec早前说过:机器人觉得容易的,对于人类来讲将是非常难的;反之亦然。人可以轻松做到听说读写,但对于复杂计算很吃力;而机器人很难轻松做到用手抓取物体、以及走上坡路,但可以轻而易举地算出空间火箭的运行轨道。人类可以通过日积月累的学习,轻松完成各种动作,但对于机器人来讲完成这些简单的动作难如登天。专家们称此理论为“莫拉维克悖论”(Moravec's Paradox)。机器学习专家、著名的计算机科学和统计学家Michael I. Jordan近日在《哈佛数据科学评论》上发表文章,也认为现在被称为AI 的许多领域,实际上是机器学习,而真正的AI 革命尚未到来。
在目前,即使是最先进的AI智能体,在适应环境变化的能力方面,也无法与动物相提并论。近期,英国帝国理工学院和剑桥大学研究人员共同组织了一场特别的AI竞赛,希望把动物能够完成的“觅食任务”交给AI智能体来完成,让AI和动物世界来一场虚拟比赛。我们也期待着这项比赛的结果。
另外,从商业角度上来看,AI企业拿到A轮之前的融资都还算是容易的。但所有的技术都需要经历市场的考验,到了A轮和B轮,AI企业的落地和盈利能力更被投资人所看重,但目前的事实是,AI技术落地仍然相当困难。即便落地为产品,其成本也极其高昂。所以,2018和2019年,有一大批的初创AI企业死于寒冬。
鲍捷老师曾经给出上面这幅图,体现了人工智能至今所经历的三次大的热潮。这次热潮过后,是衰落还是稳定发展,我们也拭目以待。这三次热潮分别如下:
第一阶段(20 世纪50 年代中期到80 年代初期):深耕细作,30 年技术发展为人工智能产业化奠定基础。在1956 年之前,人工智能就已经开始孕育。神经元模型、图灵测试的提出以及SNARC 神经网络计算机的发明,为人工智能的诞生奠定了基础。1956 年的达特茅斯会议代表人工智能正式诞生和兴起。此后人工智能快速发展,深度学习模型以及AlphaGo 增强学习的雏形——感知器均在这个阶段得以发明。随后由于早期的系统适用于更宽的问题选择和更难的问题时效果均不理想,因此美国、英国相继缩减经费支持,人工智能进入低谷。
第二阶段(20 世纪80 年代初期至21 世纪初期):急功近利,人工智能成功商用但跨越式发展失败。80 年代初期,人工智能逐渐成为产业,第一个成功的商用专家系统R1 为DEC 公司每年节约4000 万美元左右的费用。截止到20 世纪80 年代末,几乎一半的“财富500 强”都在开发或使用“专家系统”。受此鼓励,日本、美国等国家投入巨资开发第5 代计算机——人工智能计算机。在90 年代初,IBM、苹果推出的台式机进入普通百姓家庭中,奠定了计算机工业的发展方向。第5 代计算机由于技术路线明显背离计算机工业的发展方向,项目宣告失败,人工智能再一次进入低谷。尽管如此,浅层学习如支持向量机、Boosting 和最大熵方法等在90 年代得到了广泛应用。
第三阶段(21世纪初期至今):量变产生质变,人工智能有望实现规模化应用。摩尔定律和云计算带来的计算能力的提升,以及互联网和大数据广泛应用带来的海量数据量的积累,使得深度学习算法在各行业得到快速应用,并推动语音识别、图像识别等技术快速发展并迅速产业化。2006年,Geoffrey Hinton和他的学生在《Science》上提出基于深度信念网络(Deep Belief Networks,DBN)可使用非监督学习的训练算法,使得深度学习在学术界持续升温。2012年,DNN技术在图像识别领域的应用使得Hinton的学生在ImageNet评测中取得了非常好的成绩。深度学习算法的应用使得语音识别、图像识别技术取得了突破性进展,围绕语音、图像、机器人、自动驾驶等人工智能技术的创新创业大量涌现,人工智能迅速进入发展热潮。
然后,人工智能的发展,有人给出了这样一张路线图:
1. 弱人工智能Artificial Narrow Intelligence (ANI): 弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。
2. 强人工智能Artificial General Intelligence (AGI): 人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。Linda Gottfredson教授把智能定义为“一种宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。”强人工智能在进行这些操作时应该和人类一样得心应手。
3. 超人工智能Artificial Superintelligence (ASI): 牛津哲学家,知名人工智能思想家Nick Bostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。超人工智能也正是为什么人工智能这个话题这么火热的缘故。
<hr/>http://www.animalaiolympics.com/ 谢 @叶竹 邀请。
什么是人工智能?
按照UCLA教授朱松纯教授的定义,AI大概可以分为一下六类:
(1)计算机视觉 -> 人类的视觉能力
(2)自然语言处理 -> 人类的语言文字能力
(3)语音识别与生成 ->人类的听与说能力
(4)机器人学 -> 人类的运动能力和运动智能
(5)博弈与合作 -> 人类对抗与合作的能力
(6)机器学习 -> 人类的学习能力
可以看出以前的技术是让新工具取代旧工具。而人工智能不同,它的目标就是模仿人类的智能,取代人类的智能,超越人类的智能。
那现阶段的AI到底是个什么东西呢?
我觉得现在的AI核心理念还是统计推断或者函数拟合。说人话就是找一个函数或者一个映射,使得一段声波进去能映射到语言,一张猫咪的图片进去能映射到猫咪。你跟siri说hi自动映射到回答hello~
一天学会深度学习-李宏毅
入门人工智能小书单
给大家推荐一些书,同时提醒大家一些坑。书大致可以分为三类『科普书籍』『机器学习算法书籍』『编程书籍』。
1.科普书籍:
《数学之美》:用妙趣横生的语言讲述了自然语言处理和搜索引擎里的数学原理
《浪潮之巅》:讲述IT产业发展和美国硅谷IT公司的兴衰沉浮
《黑客与画家》:本书是硅谷创业之父Paul Graham的文集,程序员的世界观和眼里的世界兴趣是最好的老师,阅读科普书籍有助于积累兴趣,对人工智能领域有个大概的了解。
2. 机器学习算法书籍:
《统计学习方法》:李航博士的经典教材。用最精炼的语言描述机器学习算法,转行AI必读书籍
《机器学习》:周志华教授的西瓜书。统计学习方法涵盖面太窄,配合西瓜书来扩展宽度。
《python机器学习及实现》:适合入门,学习曲线平滑,理论书看腻累了,就跟着这本书打一遍代码,对kaggle就会大致的了解。
《集体编程的智慧》:有各种算法的实现代码,配合理论书看,能更深入的理解算法。
《PRML》:机器学习经典,贝叶斯经典。
《神经网络与深度学习》:邱老师的开源书(https://nndl.github.io/)3. 编程书籍:
《廖雪峰Python教程》:最好的Python入门教程,https://www.liaoxuefeng.com
《流畅的Python》:Python最好的进阶教程
《Python for Data Analysis》:作者是Python Pandas的作者,分析数据就用Pandas4. 一些坑:
《Tensorflow实战》:真的还不如就看官方教程或者斯坦福的课程CS 20SI
《深度学习》:Goodfellow的大作,但真心不适合入门,适合进阶5. 面试书籍:
《百面机器学习》:俗称葫芦书,已提问的方式归纳机器学习面试中的种种知识点,面算法建议准备一本
《剑指offer》: 面试必刷书籍,因为很多面试官都是从里面找题入门人工智能小视频
入门阶段:
斯坦福CS229机器学习(Machine Learning)- 吴恩达(Andrew Ng):
首推吴恩达的CS229,吴恩达真是天生的好老师,讲课清晰条例清楚,难度事宜,学习曲线平缓
2009版视频:斯坦福课堂视频,内容比较充实,但要看板书,而且有些没必要的课堂互动,容易分心
知道你们都是伸手党,链接也准备好了。链接:斯坦福大学公开课 :机器学习课程
2014版视频:这是吴恩达在coursera上的授课视频,一段视频一个主题,更加精炼清晰链接:机器学习(Machine Learning)- 吴恩达(Andrew Ng) | 斯坦福大学课程CS229(2014)
机器学习基石和机器学习技法-林轩田:
吴恩达的课程一大问题是英文授课,有些小伙伴畏惧英语,就退缩了。
这样的话,台湾大学林轩田老师的机器学习基石及技法是非常不错的选择。
这门课深度深一些,更数学一些,会讲一些非常基础的机器学习理论,如VC维,KKT条件等
我的建议是一开始听不懂直接过,学完之后再来反刍链接:机器学习基石,完整版_演讲•公开课_科技_bilibili_哔哩哔哩
进阶阶段:
机器学习与神经网络-Hinton:
讲神经网络恐怕没有比祖师爷更好的了,hinton老爷子的思想非常深邃,换句话说可能不太好懂
但这不影响这是非常优秀的课程链接:Hinton机器学习与神经网络中文课程 - 网易云课堂
斯坦福CS231-深度学习计算机视觉-李飞飞:
计算机视觉无疑是这波深度学习浪潮的弄潮儿,搞计算机视觉方向经典的入门视频
里面会介绍各式各样的卷积神经网络链接:斯坦福李飞飞-深度学习计算机视觉 - 网易云课堂
斯坦福CS224-深度学习自然语言处理-Chris Manning
人工智能另外一个重要领域是自然语言处理,搞这个方向经典的入门视频莫过于CS224链接:斯坦福2017季CS224n深度学习自然语言处理课程(by Chris Manning & Richard Socher)(英文字幕)
【官方】【中英】CS224n 斯坦福深度自然语言处理课
机器学习-李宏毅
上面的视频虽然经典,但是英文授课,这让很多小宝宝很崩溃,但没事,来看台湾大学的深度学习吧!链接:【深度学习】李宏毅Machine Learning (2017,秋,台湾大学) 国语
机器学习-李宏毅(2019) Machine Learning
机器学习-白板推导系列
条理清晰,重点明确,而且每个章节讲解才20分钟左右,up主语速偏慢,1.5或2倍速看也没有问题,非常适合入门
链接: 哔哩哔哩 ( ゜- ゜)つロ 乾杯~ Bilibili
看到这里,大家会发现,其实只要你想学,视频大把大把的,互联网让知识的获取不再困难,真正阻碍你的只有你的决心和毅力了。
最后,提个坑,别去看张志华老师的统计机器学习视频,张老师的水平是很高的,但视频里满屏幕的公式,又让我回想起大学期间被各种定理推论支配的恐惧。中国大学的课感觉就一直都在劝退,提醒你学不会的,你听不懂的,你智商不够的。然而吴恩达的课不会,他觉得没有学不会的学生,只有教不好的老师~
入门人工智能学习方法
初学机器学习可能有一个误区,就是一上来就陷入到对各种高大上算法的追逐当中。动不动就我能不能用深度学习去解决这个问题啊?我是不是要用boosting算法做一些模型融合啊?我一直持有一个观点,『脱离业务和数据的算法讨论是毫无意义的』。
实际上按我们的学习经验,从一个数据源开始,即使是用最传统,已经应用多年的机器学习算法,先完整地走完机器学习的整个工作流程,不断尝试各种算法深挖这些数据的价值,在运用过程中把数据、特征和算法搞透,真正积累出项目经验 才是最快、最靠谱的学习路径。
那如何获取数据和项目呢?一个捷径就是积极参加国内外各种数据挖掘竞赛,数据直接下载下来,按照竞赛的要求去不断优化,积累经验。国外的Kaggle和国内的DataCastle 以及阿里天池比赛都是很好的平台,你可以在上面获取真实的数据和数据科学家们一起学习和进行竞赛,尝试使用已经学过的所有知识来完成这个比赛本身也是一件很有乐趣的事情。和其他数据科学家的讨论能开阔视野,对机器学习算法有更深层次的认识。
有意思的是,有些平台,比如阿里天池比赛,甚至给出了从数据处理到模型训练到模型评估、可视化到模型融合增强的全部组件,你要做的事情只是参与比赛,获取数据,然后使用这些组件去实现自己的idea即可。不废话,直接划重点上干货。如果你觉得机器学习难,那一定是你打开的方式不对(认真脸)。
机器学习看似难度大,但对入门者来说,也还是有一条通用的学习路径。正如前几个专栏里介绍的,还有很多优秀的入门资料可以大大降低学习门槛,同时激发学习的乐趣。
简单的说,学习方法大概如下:
编程技能
机器学习知识 ----> 动手实践撸代码 ----> 数据科学比赛 ----> 实际项目经验
数学基础机器学习是一个将理论算法与计算机工程技术紧密结合的领域,你需要扎实的理论基础来帮助你分析数据,同业是需要工程能力去开发模型和部署服务。所以需要【编程技能】【机器学习知识】【数学基础】三个方面军齐头并进,才能最终夺取胜利的果实。
转行AI的人里也可以分三类,一类是程序员出身,具有很好的工程经验;一类是统计学数学电子通信类出身,具有较为扎实的理论基础;还有一类既没有丰富的编程经验也没有扎实理论基础,例如我们学材料的...这三类同学入门AI,需要加强的部分是不一样的。
1.编程技能-python
Life is short, I use python!
在google, facebook等巨头钦定之后,人工智能领域的当红辣子鸡莫过于python。Python的工具库还是满全的,从数据获取到数据清理和机器学习算法应有尽有。与R相比,更加全面。
对于python, 除掌握其自身语法外,还应该着重掌握下面这些库:
pandas:超级excel,表格式操作数据,数据清洗和预处理的强大工具。
numpy:数值计算库,快的不要不要的。
matplotlib:模仿MATLAB的数据可视化工具。
scikit-learn:封装超级好的机器学习库,一些简便的算法用起来不要太顺手。
ipython notebook:数据科学家和算法工程师的笔记本,强力推荐。
2.数学基础
微积分:是机器学习中的核心知识之一,无论是梯度下降法中的求梯度还是反向传播中的误差传递的推导都需要用到微积分。
线性代数:神经网络中大量的计算都是矩阵乘法,这就需要用到线性代数的知识了。计算向量的余弦相似度也要用到内积运算。此外,矩阵的各种分解办法也出现在主成分分析和奇异值分解中。
概率论与统计学:广义的说,机器学习的核心是统计推断。所以机器学习的巨头不少都是统计学大师,如迈克尔乔丹,杨乐坤,辛顿等。机器学习中大量的用到贝叶斯公式,隐马尔科夫模型等等。
诚然,数学很重要,但是我建议,具有本科数学基础的你,不要花费太多时间去刷数学书,这是南辕北辙,最好的办法还是直捣黄龙学习机器学习算法,到了看不懂的地方再去补充相应的数学知识,斯坦福的教程里就有大量的数学补充材料,很多时候读明白这些补充材料就够了。
3.项目经验
一个误区:很多新手初学机器学习,上来就追求复杂的深度学习模型和高大上的算法如AlexNet, ResNet。tensorflow和keras各种API全部调用一遍,却不知道自己在干什么,俗称调包侠。
一个观点:脱离实际业务和数据的算法都是空中楼阁。
一条路径:按照我的学习经验,从数据清洗到特征工程,再用最传统的算法把整个流程走一遍,不断的比较和尝试各种算法,把特征和算法搞透,才是最快最靠谱的学习方法。
两个项目:国外的Kaggle和阿里云天池都是获取项目经验的好途径。我的建议是每个入门机器学习的人都应该参加两个项目。一个传统机器学习应用场景的项目,如阿里移动推荐算法。通过传统应用场景熟悉逻辑斯特回归,支持向量机和梯度增强决策树等算法。一个深度学习应用场景的项目,如肺癌识别和诊断,通过深度学习应用场景熟悉深度学习各种算法的优势和应用场景。
就说这么多,大家放手去干吧!美丽的天使在远方召唤你,勇敢的少年啊,快去创造奇迹!
页:
[1]