我的MIT微碩士SDS歷險ing(四)Fundamentals of Statistics
這是我所修的最後一門課,也是項目的最後一門必修課:Fundamentals of Statistics,終於在兩個禮拜前結束了。在考Final前,一想到是Statistics,就不自量力得計畫拼個95過;但考完後,別說95了,全90計畫還差點因爲爆炸的Final不保😂;由此可知,還是別小看統計,即便它的名稱前面加了Fundamentals這個單字,它也是能讓你陰溝裡翻船。
其實從課程從結束到現在已經過了2個禮拜,但因為最近得了一種下班後不想努力症候群,再加上開啟曠廢多時的PS4(審判之眼還不錯玩…)而導致的輕度拖延併發症,所以自己遲遲沒下筆寫這篇文。但隨著為期一週的長假即將結束,且項目的最終測驗日期也逐日逼近,想著是該做點事來收收心了,就以此篇作為一個開頭吧(由於離測驗日期太近了…一孔之見系列估計得測驗後才能繼續了😭)。
Fundamentals of Statistics(MITx — 18.6501x)
這門課的英翻中名稱,我想也沒什麼歧義空間了,可翻成「基礎統計」或「統計基礎」,而課前知識以及我對於這門課的綜合評比如下:
課前必備知識點:機率論、大一微積分、線性代數
課程難易度:中高
應用度:高
平均單週耗時:30~40 hours
短評:以武俠小說設定來說,如果第三篇說到的「資料分析:統計模型與計算應用」指的是外功,那這門課,就是奠定所有外功基礎的內功。
以SDS項目的所有課程來說(嗯…我的確因緣際會得把所有必修跟選修課都修過一輪了),即便排除出身統計系這個事實,這門課仍然會是其中我最喜愛的一門課;教授口條清晰,時不時又有點幽默;課程內容雖紮實,但邏輯清楚,所以整體吸收起來相當得舒適。
在課程的一開始,會先探討統計與機率的分歧點;什麼樣的問題是機率範疇,而什麼樣的問題是統計範疇,我覺得這點還蠻有必要釐清的。當了解了統計主軸會圍繞在「估計」這件事時,才能理解接下來的三個月,表面看似反覆,但細看卻會發現細節有些不同的各種計算,是用來做什麼的。
接著會稍微回顧一些機率論,並且將之後會用到的數學符號定義好;其中包含樣本空間、機率模型的表示方式。這一部分出乎意料得深得我心,尤其對於我這種筆記學生,若能將一些概念以統一且正確的符號表示出來,在釐清觀念上會有很大的幫助。
再來就開始正式進入統計的世界了,開始會探討什麼是收斂,收斂分為哪幾種,接下來會介紹幾個統計大神提出的收斂理論,並進而衍生出統計中,最萬用的一個法則與一個理論:大數法則與中央極限定理。緊接著,以機率論的角度,介紹信賴區間以及兩種型別誤差的核心觀念,相當於為日後我們各種花式計算出的估計值定義一個評分標準。最後,便是一連串的估計與檢定方式的介紹了;其中像是:MLE(Maximum likelihood estimator)、Moment Estimator、Chi-Square distribution、T distribution以及各式各樣在統計領域裡耳熟能詳的test。
我覺得很特別的是,在課程的最後,這門課還單獨教授了線性回歸以及邏輯回歸兩種回歸分析(這門在大學時也稱得上學分界的一把鋒利小刀啊…),有利於為數學模型擬合以及機器學習奠定紮實的理論基礎。
課程在Final結束後,還提供了主成分分析(PCA, Principle Component Analysis)的延伸課程,雖然不列入Final考試範圍,而且這門課在另一門課「資料分析:統計模型與計算應用」裡也有提過,但因為我實在太喜歡這個教授的講課方式,再加上PCA在數據裡的應用非常廣泛,所以也還是花了點時間再重新看過一遍。
綜合來說,我覺得這是一門打通統計任督二脈的課,很多觀念在這門課裡會得到更深且更紮實的講解,幫助學生釐清很多過去容易混淆的觀念,是非常推薦的一門統計領域裡的必修課。
最終成績:92