數理統計課的回顧,也給一些打算讀統計系的學弟妹參考
兩學期數統課快告一段落,數統號稱是統計系最重要的課,回顧一下到底學了什麼,順便講一下心得
記得老師第一堂課講到數統學兩樣:機率和統計,上學期的課前三分之二在講基本的機率論,後來才進入統計,統計量、估計量、幾個特殊估計量、估計量的一些性質
下學期的前幾堂課提到重點會放在「估計和檢定」,繼續探討估計量的性質,在不久前進入檢定的部份
這學期不曉得從哪時候開始,我發現老師不太講定理的證明了,猜測可能是因為需要用到高微,估計量的大樣本性質那裡一直用到函數、序列的極限,除此之外,遇到的函數常常是多變數的,沒學過高微根本沒轍,修課的大部分人沒學過,這樣講證明意義就不大,但是不談又不至於對理解定理造成妨礙,折衷下來就不提了
那我們到底在學什麼和做什麼?本質上就是應用定理來解題,解決問題的過程則以計算為主,大多時候用微積分、偶爾用用矩陣
從這裡也可以看到統計系與數學系著重點很不一樣,就我所知,數學系最重要的必修課高微﹑代數,都是搞抽象結構和概念邏輯推導,沒什麼計算
有兩個特別重要的基本概念,iid和random sample,它們是這門課裡分析和解大部分問題時的前置條件,沒有它們,那學過的很多方法都不能用,像是數統裡最重要的兩個定理:中央極限定理﹑大數法則﹑以這兩個為基礎發展的方法…
iid和random sample感覺上是很理想的情況,我不確定現實中常不常遇到,我舉個例子來說明它們的概念:
現在要調查20~30歲男生的身高資料,你沒時間﹑金錢做普查,只能抽樣調查,根據平時觀察,150cm以下和190cm以上是非常稀少的,大部分人都是160, 170左右,於是你「假設20~30歲男生的身高資料接近某個常態分配」(1),而且當你抽樣時,抽出目前這一個不會影響到下一個結果,「每一個樣本之間不相干」(2),有了(1)和(2),就可以考慮用這門課學過的一些方法來估計整體資料
事實上,統計的發展跟政府普查、抽查資料有很大的淵源,當時關注的問題,用iid, random sample為前提發展出來的理論跟方法大致上都滿有用的,只是世界當然沒那麼單純,又怎麼知道我們所見的有限觀察數據背後是有某種規律存在呢?而且怎麼確定樣本之間互不相干?有時候用前面提到的這種方法來處理問題會得到離譜的結果,所以後來又發展出其他新方法,不過這部份我就一無所知了
學這門課必要的基礎是微積分和線性代數,微積分學的好解問題就解的好,矩陣則是到多維時的一個表示工具,線代沒學好,多維時的一些性質會學的霧煞煞
這代表就理論部份,如果數學讀的好,數學系的要跨過來讀統計相當容易,反之則不一定,那統計系的能拿什麼跟人競爭?我想除了理論基礎要深化外,就是軟體分析數據的能力要夠強,不然現在好用的軟體那麼多,理工學院的其他人查清楚理論能用的前提是什麼,懂得操作,自己都可以分析,就用不著你了
講的好像我認為統計專業的門檻不高一樣,嚴格說起來應該是數統並沒一些人想的難,數學讀的好的要跑過來修數統很容易,但讀統計的跑過去修高微就不一定,另外,數統老師教的那麼好,講解非常清楚,若還是學不好,某些科那悲劇的教學我還真不曉得要怎麼辦了
我甚至曾經覺得,要學習數統裡的重要概念,找個有紮實學過的人討論 ,省去中間那一堆搞計算的部份(有需要再算),搞不好一個月內就可以把這科的主幹學起來了吧,因為概念本質並不難理解,而那些計算麻煩的問題解方通常訴求微積分技巧﹑、矩陣的熟練度,跟數統概念沒什麼關係
最後我條列一些數統裡的重要名詞
機率論三公理、隨機變數(連續型、離散型)、distribution、cdf、期望值、變異數、相關係數、條件機率、條件分配、隨機變數的轉換、動差生成函數、特殊分配、統計量、估計量、估計量的一些性質、中央極限定理、大數法則、檢定…
我後來突然想到這篇文對打算讀統計或正在讀統計系大一的學弟妹搞不好有幫助,所以原本文章標題只有「數理統計課的回顧」,再加上後面那句,這樣應該就可以被GOOGLE搜尋到了吧?本來只是單純抒發心得、寫爽的,這倒是意外的效果,數統是統計系裡最重要的課沒錯,了解它到底是怎麼一回事,對參考要不要讀統計系應該有幫助,題外話,我覺得我們(成大統計)系的定位滿奇怪的,這之後有機會再談吧
最後我條列一些數統裡的重要名詞
留言
張貼留言