找回密码
 立即注册
查看: 667|回复: 1

《动手学深度学习》---新手该如何快速进入人工智能

[复制链接]

1

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2023-10-6 10:16:15 | 显示全部楼层 |阅读模式
在 2015 年的时候,笔者结束了数十年的数学生涯,分开了学术界投身工业界。作为一个方才转行的新人,无论是从经验上还是技能上都与老员工和资深人士有着很大的差距。当时进入互联网公司的时候,身边的同事都有着多年的工作经验,但是由于文档扶植和参考资料的缺掉,导致我当年上手机器学习和深度学习的时候走了不少弯路。
当时,市面上的机器学习册底细对较少,在翻阅了藏书楼和网上资料之后,笔者自行阅读了一系列资料,包罗《机器学习实战》,《机器学习》(西瓜书),《数据挖掘:概念和技术》等册本,也包罗网上的各种博客资料。在上面三本书中,第一本书强调剂论与实战相结合,会在书中讲解机器学习的理论常识以及向读者展示其算法的源代码;此外两本书则方向理论讲解,会向读者全方位地介绍机器学习各种常识点,这些都是入门机器学习的优秀册本。



安防系统

随着人工智能在互联网中的应用场景越来越多,人工智能的从业者也越来越多,互联网也大量招募了许多应届生和社招人员来从事机器学习的研发工作。无论是计算机视觉,自然语言措置,语音理解,都在互联网的诸多业务中得到了应用。在日常生活中,人工智能也逐渐改变了大师的生活。很多年前,在人脸识别技术还不发家的时候,安防系统和手机的验证系统都不会大量推广人脸识别系统。但是随着深度学习技术在图像竞赛中的成就越来越高,准确率与日俱增的同时,这些技术从学术界走向工业界,进一步地走进大众的生活就成为了现实。



人工智能出书物

随着人工智能从业者的增加,人工智能的出书物总数也在持续增加,而且人工智能的专利数也在飙升,相较于 2015 年超出跨越 30 多倍。这对于想要入行的新人,实在长短常的友好。近些年能够找到的人工智能入门册本很多,无论是计算机视觉还是文本挖掘,都可以让每一个新人迅速走上研究人工智能的道路。
作为一位数学系布景的学生,笔者深知从数学界转行到工业界的困难与辛苦。毕竟两者的思维方式是不太一样的,数学系开设的课程以理论为主,不会过多地讲解其应用场景和实战案例;而且数学系的学生在持久的学习过程中会养成一个“短处”,就是要等全部看完一本书才会想到应用它。这在工业界的工作中是完全不成取的。工业界强调的是实战和理论相结合,会强调一边做一边学,在学习中使个人成长,让项目来带动学习。
因此,对于数学系或者其他理论标的目的的学生,如果想要快速进入人工智能范围,那么最好的就是选择一本合适本身的册本。此时,过于理论的册本则不必然很适合,需要的是一本能够快速上手的东西书和入门书。人民邮电出书社近期推出了一本册本,非常适合理论学科的学生上手学习,那就是《动手学深度学习(PyTorch版)》



思维导图

这本书是一本适合新手的入门册本,它不仅对深度学习道理进行了全面的阐述,还提供了丰硕的代码逻辑给初学者参考。强调一边学习一边实战的不雅概念,通过 Jupyter 记事本让读者体验深度学习的美妙,让读者在最短的时间内快速上手深度学习,避免只学了理论却不会应用的尴尬。
从本书的目录可以看出,本书大致可以大致分成几个部门:

  • 预备常识:带领读者回顾线性代数,微积分,概率论的基础常识;也讲解了机器学习的几个基本概念,让读者在后续的阅读中更加顺畅;
  • 神经网络:包罗线性神经网络,多层感知机,卷积神经网络,循环神经网络;而且会介绍注意力机制这一个非常重要的概念;
  • 优化算法和计算性能:神经网络的训练是需要基于优化算法来做的,分歧的优化算法带来的收敛速度是纷歧样的;而且神经网络在离线训练和上线使用的时候,都需要对它的性能进行必要的调优和提升。本书也花了很多篇幅在讲解这个部门;
  • 实战经验:除了上述理论之外,本书还会向读者展示如何参加 Kaggle 比赛,以及比赛的相关算法和数据措置经验。从整理数据集开始,数据增广,训练和预测,在线提交成果,作者们都向读者进行了详细的介绍。除此之外,在自然语言措置部门,作者介绍了工业界的情感分析案例,教大师如何按照情感的数据集和循环神经网络来分析数据。最后也介绍了 Bert 模型的微调方式。



册本拍照1



册本拍照2

《动手学深度学习(PyTorch版)》面向的读者是深度学习的从业者,高校学生。对于没有任何基础的学生,也能够在这本书的辅佐下很轻松地上手深度学习。从上面这两页可以看出,作者们在介绍一个数学概念的时候,会把其数学定义和相关的 Python 代码展示给读者,让读者在初学或者回顾这个数学概念的时候,能够找到其背后对应的 PyTorch 代码,在这种情况下,读者就可以很轻松地将数学概念和计算机法式联系到一起,为以后走向工业界扫清了部门障碍。



册本拍照3



册本拍照4

本书在向读者讲解机器学习方式的时候,除了介绍该方式的理论之外,更加强调实战应用。就以“线性模型”这一章为例,作者以案例的方式,向读者展示了构建线性模型的初衷和动机,然后介绍了线性模型的模型布局和损掉函数等关键点。接着,作者们向读者展示了如何才能够从零到一地构建一个线性回归模型,大体法式分成以下几个:

  • 生成数据集和读取数据集:为了简单起见,作者用了一个构造的数据向大师介绍模型;
  • 定义线性模型,损掉函数,优化方式:这是构建很多机器学习模型需要经历的关键法式;
  • 训练模型,得到模型成果:基于构造的数据集,可以得到相应的线性模型,未来可以用作预测。
为了让读者们掌握开发代码的技巧,这本书还有一个官方网站(http://zh-v2.d2l.ai/index.html),在这个官方网站上,读者可以看到源代码,而且可以将其拷贝出来进行阅读和运行。避免读者每次都需要从头敲写所有的代码。



册本的官方网站

读者只需要按照书中的法式,就可以轻松完成一个线性模型的整体训练过程。通过理论与实战相结合的方式,读者就可以相对容易地掌握这个模型。除此之外,作者还贴心地为诸多自学的读者筹备了必要的操练题,通过做这些操练题,读者可以自我验证是否掌握了这些必要的基础常识,毕竟在没有学校老师的监督下,能否做出操练题就是是查验本身是否掌握常识的关键了。



册本拍照5



册本拍照6

与其他的机器学习教材有较大分歧的就是《动手学深度学习(PyTorch)》会讲解不少实战和 Kaggle 竞赛的案例,包罗:

  • 房价预测:使用多层感知机;
  • 图像分类(CIFAR-10)和狗的品种识别(Image Dogs):使用卷积神经网络;
  • 情感分析:使用循环神经网络。
在介绍这些实战案例的时候,本书城市从第一步入手,那就是从数据集的获取开始,然后就是数据预措置,再就是训练模型和模型调优,最后就是上传数据成果进行效果的评测。只要按照书本上的流程走一遍,每个读者都能够完成建模工作,给未来的学习和工作做好筹备。
对于数学系或者其他理科院系的学生,在学习数学的过程中,必定会强调打下坚实的基础再进行实战。但是这种学习方式在搞人工智能的过程中是不太可取的,就个人的经验来看,实在不行不主张学完所有的理论常识再开始实践,因为人工智能是一个非常依靠实战经验的行业。在工作的过程中,需要从业者对数据措置,特征构建,模型选择和训练有丰硕的经验,而这些经验是只学习理论无法获得的,只有通过实战和理论相结合的方式,才有机会真正掌握机器学习和深度学习的相关技术。
为了让读者尽快地入门人工智能行业,《动手学深度学习(PyTorch版)》还贴心地为大师提供了所有源代码和彩色图片,将本书的源代码和理论常识相结合,读者就可以一边阅读理论常识,一边阅读源代码,一边进行新代码的开发。除了这些,本书还免费提供了教学视频和讨论区,让学习者在互相辅佐中共同成长。多方位的交互式学习可以给读者带来全新的学习感到感染。本书的英文本 Dive into Deep Learning 是加州伯克利分校的深度学习教材,而且被全球多个高校作为深度学习的入门册本。



官方网站

在多种资源相辅助的情况下,读者掌握深度学习的速度将会迅速加快,在很短的时间内就可以成为一个深度学习的从业人员。在掌握了这本书之后,如果读者可以做一个或者多个尝试室或者工业界的项目,那么读者对深度学习的理解必定会更进一步。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

4

回帖

2

积分

新手上路

积分
2
发表于 2023-10-6 10:16:30 | 显示全部楼层
由于这本书我失业三年了[大哭],https://zhuanlan.zhihu.com/p/611882439
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-22 13:46 , Processed in 0.057213 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表