python选课系统_【精选】在Monash读Data Science,人人都拥有这样一份选课指南。
點(diǎn)擊上方“藍(lán)字”,關(guān)注最適合你的學(xué)習(xí)咨詢
前言
1、課程難度因人而異,課程作業(yè)也可能每學(xué)期變動(dòng),所以大家結(jié)合個(gè)人實(shí)際情況參考借鑒。
2、本指南系列只描述了比較最主流的課,冷門課程資訊希望大家留言,我們盡力解答。
3、持續(xù)關(guān)注我們文章,應(yīng)該是市面上最全的選課指南。
4、2020屆的學(xué)生應(yīng)該是只能選修course map之外的一門選修課,所以大家選課的時(shí)候別太嗨了,注意政策改動(dòng)!!
5、一定不要著急選課,開學(xué)后很大概率你不喜歡你選的tutor,即使是個(gè)黃金時(shí)間,給你錢你也要換課。所以沒選到好時(shí)間沒關(guān)系,選老師 + 選興趣最重要!
6、DS選課指南沒有提到的課請(qǐng)打開其他IT/BIS借鑒
必修課 - FIT5145
Introduction to Data Science
課程概況:
學(xué)習(xí)數(shù)據(jù)科學(xué)背景知識(shí),python語言,R語言,Linux的一門課,Lecture和作業(yè)沒有關(guān)系,考試考的是百科知識(shí)。
作業(yè)概況:
Ass1是用python代碼寫一些題目,配合自己對(duì)題目理解加一些文字性的敘述,沒有什么高難度。
Ass2是個(gè)report,寫一些自己對(duì)于數(shù)據(jù)在實(shí)際生活中的應(yīng)用,例如墨爾本的水利系統(tǒng)如何利用處理等。
ass3是個(gè)會(huì)用到linux和r回答一些題目,也不是很難,類似于ass1的形式,加上個(gè)人對(duì)答案的理解。
是否有用:
python和r學(xué)個(gè)入門,不能說有用的課吧,在代碼和report中游走能大概有個(gè)數(shù)據(jù)應(yīng)用的邏輯思維。
考試概況:
相對(duì)簡(jiǎn)單,沒有很超綱,考試復(fù)習(xí)sample很重要,考試沒有代碼題,都是些common sense和結(jié)合概念舉例子。
溫馨提示:
都是個(gè)人作業(yè),tutorial的代碼很有用記得看,好過的課,也是monash比較火的課。
必修課 - FIT5196
Data Wrangling
課程概況:
這門課學(xué)的是數(shù)據(jù)預(yù)處理,用的語言是PYTHON。總共有4個(gè)GROUP ASSIGNMENT,2人一組,全部是CODING,沒有考試。
作業(yè)概況:
一共4個(gè)assignment:
ASS 1: 用REGULAR EXPRESSION 在不同類型的文本中提取數(shù)據(jù)。(25%)
ASS 2: 文本預(yù)處理 (25%)
ASS 3: 數(shù)據(jù)清理 (30%)
ASS 4: 數(shù)據(jù)合拼 (20%)
是否有用:
DATA SCIENCE 必學(xué)技能之一,一個(gè)DATA SCIENCE 項(xiàng)目有80% 以上的時(shí)間都在做DATA WRANGLING。這門課是MDS 的必修課程。
溫馨提示:
由于這門課沒考試,ASSIGNMENT 的工作量都比較大,特別是ASSIGNMENT 3,沒一個(gè)星期寫都寫不完。如果同學(xué)可以免修MAT9004,建議把FIT5197 跟這門課分開來學(xué),在第一個(gè)學(xué)期先把FIT5197 完成。
選修課 - FIT5201
Machine Learning
課程概況:
教材用的是Alexandria上面Reza寫的Machine Learning,學(xué)的都是一些比較入門的算法,用R來實(shí)現(xiàn)。
作業(yè)概況:
代碼量不是很多,更多的形式是補(bǔ)全代碼。六個(gè)online quiz,都是教材上有的內(nèi)容,基本算是送分(9%)。
coding題 25%
coding題 16%
這門課不好拿高分。
是否有用:
依然是偏傳統(tǒng)機(jī)器學(xué)習(xí),但是一個(gè)module 介紹神經(jīng)網(wǎng)絡(luò),屬于基礎(chǔ)向的機(jī)器學(xué)習(xí)基石,推導(dǎo)內(nèi)容更接近5197。跟5149相比更深,但是考察相比而言簡(jiǎn)單。
考試概況:
考察范圍比較廣,但是較為簡(jiǎn)單。
溫馨提示:
這門課要用到微積分,有不少數(shù)學(xué)推導(dǎo),數(shù)學(xué)不是很好的同學(xué)慎選。
選修課 - FIT5149
Applied Data Analysis
課程概況:
這門課學(xué)的是如何運(yùn)用一些AI 的算法,跟FIT5201 有很多重復(fù)的課題。語言是PYTHON / R.
作業(yè)概況:
ASS1 是一個(gè)傳統(tǒng)回歸模型,主要是課堂上介紹的關(guān)于R 的線性回歸模型的實(shí)踐,以掌握方法論為主(15%)。
ASS2 是一個(gè)文本相關(guān)的kaggle competition,組隊(duì)完成,評(píng)分根據(jù)模型表現(xiàn)和report質(zhì)量。不管是kaggle 比賽還是report 都很有鍛煉價(jià)值(25%)。
是否有用:
由于這門課有大部份課題跟FIT5201 重復(fù),感覺給2門的錢,只學(xué)到1.5門的東西。跟5201比起來更寬,更應(yīng)用,沒有理論推導(dǎo)。
考試概況:
期末復(fù)習(xí)一定要把ISLR的對(duì)應(yīng)章節(jié)的理論習(xí)題給做一遍;kaggle 想拿高分基本要用deep learning方法。
溫馨提示:
盡量跟著學(xué)校進(jìn)度走,老師給分還是蠻大方的
TUTORIAL 一定要上,老師會(huì)拿以往得HD 的作業(yè)跟大家分享。ASSIGNMENT 2 的隊(duì)友可以在不同的TUTORIAL,一定要慎選。作業(yè)量比較大,如果想拿HD,這個(gè)作業(yè)一定要用DEEP NEURAL NETWORK,但是這門課不教。FINAL 主攻ISLR 的課后練習(xí)題。
必修課 - FIT5147
Data exploration and visualization
課程概況:
介紹前端知識(shí),清洗數(shù)據(jù)需要注意的地方,用R/Tableau實(shí)現(xiàn)數(shù)據(jù)可視化,做一些交互設(shè)計(jì)。
作業(yè)概況:
作業(yè)由三部分構(gòu)成
第一個(gè)作業(yè)是3 個(gè)小作業(yè),分別是Tableau,R和D3。
第二個(gè)作業(yè)project 1 需要自己找data,然后進(jìn)行data cleaning,data wrangling,最后用R/Tableau實(shí)現(xiàn)visualization。
第三個(gè)作業(yè)project 2 在project 1基礎(chǔ)上,使用D3/R實(shí)現(xiàn)interactive visualization。
是否有用:
對(duì)以后想從事數(shù)據(jù)分析或者WEB前段開發(fā)的同學(xué)有一定幫助。
溫馨提示:
Project2想用D3的同學(xué)需要事先了解學(xué)習(xí)一下Javascript不然很痛苦。
選修課 - FIT5202
Data Processing for Big Data
課程概況:
利用Spark進(jìn)行分布式大數(shù)據(jù)處理(50%) 以及利用Spark進(jìn)行Machine Learning(50%)。這門課程在去年進(jìn)行課改之后,主要偏向于Spark的實(shí)際應(yīng)用,對(duì)接觸過Pandas和部分機(jī)器學(xué)習(xí)內(nèi)容的小伙伴是非常友好的一門課程。
作業(yè)概況:
以去年為例:
Assignment1,利用Spark進(jìn)行各種數(shù)據(jù)處理。
Assignment 2, 利用Spark進(jìn)行一個(gè)簡(jiǎn)單的天氣預(yù)報(bào)建模(直接使用Spark內(nèi)建的模型)。
PS:作業(yè)均為獨(dú)立作業(yè)
是否有用:
適合對(duì)分布式大數(shù)據(jù)處理和機(jī)器學(xué)習(xí)入門感興趣的同學(xué)。難度不算特別高,去年給分整體比較良心,但是對(duì)編程能力有一定的要求。由于課程偏向于實(shí)際應(yīng)用,對(duì)找數(shù)據(jù)科學(xué)相關(guān)工作有很大的幫助,畢竟現(xiàn)在很多數(shù)據(jù)公司都開始使用Spark對(duì)大數(shù)據(jù)進(jìn)行清洗,預(yù)處理和部分建模。
考試概況:
手寫部分Spark代碼,基本都是幾行的內(nèi)容。以及手算部分模型和優(yōu)缺點(diǎn)(類似FIT5197,但是難度低一點(diǎn)點(diǎn))。
溫馨提示:
多做research自學(xué),對(duì)知識(shí)廣度要求還蠻高的
必修課 - FIT5197
Modeling for Data Analysis
課程概況:
最開始學(xué)概率論相關(guān)的知識(shí)點(diǎn),還有一些分布(例如高斯、伯努利和泊松分布等),接下來是算熵;然后就會(huì)學(xué)習(xí)統(tǒng)計(jì)學(xué)的知識(shí)如Confidence Intervals和Hypothesis Tests;最后就會(huì)涉及一些建模,如線性回歸、幾種分類器和采樣模擬等;總得來說這門課要學(xué)的內(nèi)容很多,需要有良好的數(shù)學(xué)基礎(chǔ);
作業(yè)概況:
這門課感覺每周都在寫assignment,一共有三個(gè)assignment:
第一個(gè)Assignment分成6部分,有點(diǎn)像weekly test,每部分3到5題不等;
Assignment2和3都屬于大作業(yè),作業(yè)難度中等偏上;
是否有用:
統(tǒng)計(jì)學(xué)和概率論的知識(shí)在數(shù)據(jù)分析中是非常非常重要的,如果你的大學(xué)數(shù)學(xué)知識(shí)都忘光了,之后也想從事數(shù)據(jù)分析工程師的工作,特別有用!
考試概況:
這門課的期末考試需要十分認(rèn)真對(duì)待,考試的內(nèi)容非常多,計(jì)算量十分龐大,通常很少人能寫完,所以考試難度我認(rèn)為是非常難的,題目都是大題和計(jì)算題,
溫馨提示:
平時(shí)上課好好認(rèn)真對(duì)待,多花時(shí)間在這門課上,其實(shí)也沒那么可怕。
選修課 - FIT5212
Data analysis for semi-structured data
課程概況:
這門課學(xué)的是如何處理半結(jié)構(gòu)化的數(shù)據(jù)的,內(nèi)容分為NLP + recommendation system。
作業(yè)概況:
作業(yè)完成不是很難,因?yàn)閏ode基本上都在tutorial提供了,照葫蘆畫瓢。但是想要得高分需要做很多research。老師的評(píng)分標(biāo)準(zhǔn)是希望看到大家如何開發(fā)東西的流程,并且體現(xiàn)在report里面:
第一個(gè)作業(yè)是做topic modelling + paper abstract classification。
第二個(gè)作業(yè)是recommendation system + node classification
是否有用:
我覺得取決于你對(duì)這個(gè)技術(shù)是否感興趣,比如第一個(gè)作業(yè)是對(duì)比nn方法 一個(gè)非nn的方法,學(xué)生沒有nn的coding基礎(chǔ)就會(huì)學(xué)習(xí)的比較艱難,需要research很多東西,感興趣的話這門課還是挺有意思的能學(xué)到很多之前沒接觸過的知識(shí)。
考試概況:
平時(shí)理解了每周的知識(shí)點(diǎn),考試不至于什么都不知道,注意做題的速度即可。
溫馨提示:
需要自學(xué)蠻多東西,對(duì)于研究型學(xué)術(shù)感興趣的同學(xué)比較推薦。這門課的作業(yè)對(duì)于學(xué)習(xí)中等或者沒有很用心的同學(xué)來說鑒別度不高,因?yàn)槟愀鴗utorial的code就能完成大概七八十。Wray教的東西不太適合學(xué)生理解,Shirui的口語比較拙計(jì),重點(diǎn)講的不是很透徹。
更多DS專業(yè)學(xué)習(xí)信息
歡迎Monash IT學(xué)院Data Science的學(xué)生聯(lián)系后臺(tái)尋找組織。可以獲取最更多與你相關(guān)的DS的學(xué)習(xí)經(jīng)驗(yàn)。同時(shí)你也可以看到其他同學(xué)在討論什么熱點(diǎn)內(nèi)容~
往期精彩文章??
【收藏】在墨大讀IS,人人都擁有這樣一份選課指南
【收藏】在Monash讀BIS,人人都擁有這樣一份選課指南
在Monash讀IT,人人都擁有這樣一份選課指南
如果你覺得文章對(duì)朋友有用就告訴他~總結(jié)
以上是生活随笔為你收集整理的python选课系统_【精选】在Monash读Data Science,人人都拥有这样一份选课指南。的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 函数不可访问_C++之访问控制与继承
- 下一篇: ubuntu python版本切换_ub