数据科学方向要学哪些课程?
本人目前在美国就读data science master, 本科是统计专业的,所以数学基础还算牢固(虽然我也不知道自己的statistical foundation到底够不够…)。 我现在在UW的DSI(Data Science and Innovation)项目里,这个项目总共8门课(32个学分),分为四个track(商业,分析,机器学习和优化)每个track上四门课。因为我是以full time身份进来的,所以选了16门,40个学分。这些学分除了两门机器学习跟优化的课需要一定的编程基础(Python和R)之外,其它的都不需要太多的先修课或者前置知识。
这里我想重点讲的是这个program的课程设置。因为我见过很多类似msf这样的master,虽然也分topic,但是一般一个topic下会分很多subtopic,这样每个学生可以根据自己的兴趣选择自己感兴趣的主题去学习。而在这个项目是,所有学生一起上课,一起学习,然后老师会根据你的背景和经验分配不同的项目去做。换句话说,你不可能选择自己喜欢的主题,而是跟着老师走。可能有的同学会喜欢这一点,因为可以学到更多的东西,但我个人觉得由于老师的注意力是分散的,很难对某个主题深入讲解。另外就是项目的规模很小,我今年跟明年一起上的课加在一起不到50个人。这种小规模的项目的好处就在于老师能够很认真的去关注到每一个学生,能够很快的做出反应并且给予有针对性的帮助。
再说回课程设置上,我觉得这个项目最吸引我的地方在于他教给我如何解决问题。比如说我们最近在学习随机过程,这门课的主要内容是教random process如何来构建,以及他的性质。同时老师也会提供许多实际的应用案例来让学生去分析。我在这门课上学会了如何去检索相关的文章,如何提取信息,如何建立模型,怎么去用代码来实现。这是非常重要的一个技能。还有HMM, NLP, Bayesian analysis等等。每堂课老师都会给很多的作业跟project, 这让我的实习经历有了很好的补充。每次上完课我都会觉得我的toolbox又增加了新的内容。