动手学深度学习PyTorch篇直播总结
持续了5个月的直播终于在上周周末迎来了完结。一共讲了34节课、51小时。2万多名同学参与了直播,录像在B站上累计了一百万+次播放。上个月跟斯坦福老师Jure Leskovec交流,他说”一门好的课程需要很多年的打磨“,深表为然。这是这门课的第三次教学,我个人感觉比前两次的质量要提升了很多。在这里给大师分享下我的经验。内容设置
这门课的定位是深度学习入门。作为基础需要覆盖经典模型例如感知机和LeNet。此外也不能假设同学必然学过机器学习,需要解释常用的技术例如优化、模型选择。按照视频回放次数,大师最感兴趣的还是新经典算法,例如ResNet,物体检测的R-CNN和YOLO系列,以及异军突起的注意力机制,它俨然成为了卷积神经网络和循环神经网络之外的另一大类模型。里面的热门模型Transformer和BERT自然也是存眷重点。
这门课的最重要的一个特点是像教编程语言一样教深度学习。Mike Jordan曾说机器学习和统计学习是同一个东西在统计和计算机分歧的面。那么深度学习则更多在计算机这边。我感觉神经网络像是一门编程语言,你将本身对一个机器学习问题的理解描述成一个神经网络的架构。跟此外编程语言纷歧样的是你声明一个数组时,不需要直接赋值,而是通过数据和法式可导性来填值。
对于一个模型或者一个应用,这门课里一半时间讲它是什么,一半时间讲它的代码实现。看到一名同学留言说,LSTM听过几次都没懂,此次通过看代码终于懂了。
我在直播中的一个不雅察看是,当讲代码,而且讲得斗劲慢的时候,大师的提的问题最多。用文字或公式讲算法,或者代码讲得稍微快了点的时候,提问频率就会下降了。所以我感觉用代码来讲是值得的,而且节奏不能快。
当然,讲很多代码也有代价。等于一个东西需要花两倍的时间来讲。在同样的课时里,能讲的模型就变少了。例如大师对GAN呼声很高,但没有时间讲。还有很多新的模型,例如anchor-free的检测模型,只概略提了几句。
如果让我从头设计一次内容,我会拉长一下课时,出格是RNN和Attention部门,花话更多时间来讲代码。可以砍掉其他一些模型的代码,例如NiN和样式迁移。同时也应该多讲讲一些模型之后的变种和新思路的介绍。
在节奏上,一个话题不管是文字还是代码,都是平均8张幻灯片。在RNN之前平均2分钟讲一张幻灯片,1.8分钟讲一张代码幻灯片。这样一节课讲四个话题。虽然这个节奏我感觉斗劲慢,担忧大师不耐心,但从反馈来看大师感觉挺好。反而在RNN之后我加快了节奏有很多同学感觉太快。所以要对峙节奏,不要被大师催更影响了。
直播设置
此次直播的一个重要的决定是在直播中露脸。这样交流跟自然,否则大师看着静态的幻灯片,很容易疲劳。露脸导致设备复杂了很多。 前后改良了三版,最后的成果我还是斗劲对劲(不提花费的话 )。这也是此次直播中我个人的一大乐趣。
http://pic4.zhimg.com/v2-8a11f4d3dd06d008af83cb215ebb9147_r.jpg
首先我用OBS直播,平台是机器之心在小鹅通的账号。但小鹅通海外不管是上行还是下行网速都很一般,所以码率得设得斗劲低。花了好几次直播才调到一个合适的码率。
直播机器用的是M1芯片的Mac Mini。买它的主要考虑是安静,而且视频编纂速度不错(比之前用的Imac快了一倍)。不外在一次直播中绿屏了一次。这是我用Mac系列十几年来第一次绿屏,新芯片不变性还是有点小问题。
我在Ipad Pro上用keynote来连接到电脑上,这样可以用笔来划线和用光点来引导大师的注意。也可以在Ipad上预览下一张幻灯片,甚至还可以做白板用。但因为我不习惯手写,用得很少。不外注意一点这个模式下Ipad出格耗电,需要外接电源。此外有一次直播中笔连不上了。最后是重启Ipad才解决,所以需要提前测试。还有就是容易误操作,不小心手一碰就到下一张了。
我用了提词器,相机放后面,提词器屏幕放的是OBS,这样我能看到直播的实际画面,网络信号和声音强度,同时也保证了眼睛一直看着屏幕。网络信号斗劲重要,因为偶尔会丢包几秒钟,导致大师会说卡。这时可以停几秒。声音的话可以知道注意声音不要太大,也不要太小。
因为我想把人的布景透明,这样头可以大一点,而且不那么占处所。最便利的法子是加块布景绿布。但因为用了提词器,而且人靠得斗劲近(否则看不清上面的小字),导致了一是相机得用广角(18mm),二是绿布得够大,三是人跟绿布不能太远。有一个没解决的问题是如果手太快,会有绿色的残影。可能是码率太低的缘故。
我用了三个灯。两个照明绿布,一个是正脸。如果有空间的话,正脸灯可以更大点(例如大伞灯),来减小脸上暗影。因为幻灯片布景一般是白色,人脸很容易显得很暗。这里应该还有很多可以调整的处所,包罗相机的参数,灯光亮度。但因为没有辅佐,调整斗劲费时,所以没有花很多时间在上面。
最后所有的设备要么挂在桌子上,要么订在墙上。这样直播前的设置简单。每次直播时间我这边是晚上10点,之前需要分秒必争安放好两个娃睡觉,所以能省5分钟都挺好。而且直播完都快12点了,省5分钟时间收东西也很好。
最后,这是直播效果。
http://pic4.zhimg.com/v2-78ee7b5af6384d36d0274a13cbd2c0b3_r.jpg
结语
教一门课,不管是内容的筹备,还是教课的形式,都有太多可以琢磨和改良的处所。虽然做这个有些”不务正业“,但我感觉很有价值。过去一些年里,看到了很多新的形式来普及常识和技术,从微信公众号、到直播、到小视频。但愿这篇文章能启发到更多小伙伴插手到中间来。这便是一个自我学习的过程,也是一个便利他人的处事。
最后,此次直播的课程主页在:
所有视频在:
也欢迎大师提供反馈让我们下次做的更好: 从MXNet到了Pytorch,课程质量很高,赞! 辛苦沐神! 给沐神点赞! 在b站追完了全部课程,无论是模型思路或者QA环节,都能开拓思路,增广视野。看完不仅学到各种算法,更对深度学习的发展有了总体的认知。非常感谢沐神。 辛苦沐神!! 沐神太强了! 很喜欢这门课,我都在知乎专栏做了笔记,有些还在整理中。感谢大佬。[大笑] 正脸的灯太亮的话,对眼睛伤害比较大,慎用。年初我为了录课,在一个棚里自己录了两天,后来很长一段时间双眼都感觉有个光球挥之不去,过了两三个月才好,但是感觉视力下降了。 辛苦了 还差两节没看完 期待下次课程