
上一堂 ML4T 算是個暖身,而 CS 7641 - Machine Learning 才是真正的挑戰。這是 OMSCS 中公認最難的課程之一,修完之後我可以很負責的說,這個名聲並非浪得虛名。
在前一個學期我修了 ML4T1,算是對 Machine Learning 有了基本的認識。但 CS7641 完全是另一個層次 —— 更深、更廣、也更痛苦。
[1] CS 7646 - Machine Learning for Trading,一堂用 Python 和股票數據來入門 ML 的課程。 我是 2025 Fall 的學生。課程內容和作業可能每學期有所不同。
這堂課圍繞著四大機器學習的核心領域,每個都有對應的實驗報告:
上課方式蠻特別的,是兩位教授對談的形式,有點像在聽 Podcast。雖然影片長度不短,但比起傳統講課至少不那麼容易睡著。
但說實話,光看上課影片對寫作業的幫助非常有限。課堂上教的是理論和概念,而作業要求的是實際的實驗設計和程式實作,這中間的落差非常大。很多術語我都是第一次看到,得自己去搜尋,也看了不少額外的 YouTube 影片才真正理解一些比較抽象的概念。
這大概是整堂課最花時間也最痛苦的部分。
總共有 5 份報告:一份練習用的 Hypothesis Report,然後依序是 SL、UL、OL、RL。除了 RL 以外,每份報告都建立在前一份的基礎上,所以前面如果做不好,後面會更辛苦。
每份報告的 Spec 非常詳細,但也非常長。我常常要來回看好幾次,而且有時候要求還會互相矛盾,所以必須密切關注 Ed2 上的公告和討論才能跟上最新的狀況。
[2] Ed Discussion,課程使用的學生論壇。教授和助教會在上面發公告、回答問題。
我的第一份 SL 作業是在 Deadline 前一週才開始的。那真的是慘痛的教訓 —— 數據集很大,模型訓練動不動就是好幾個小時,我幾乎是日夜不停的在跑實驗。強烈建議至少提前 2-3 週開始。
報告撰寫反而是最簡單的部分。每份都是正式的 8 頁論文格式,要求包含假設、實驗設計、結果分析等完整的研究流程。
而最讓我困惑的是評分的一致性。說實話,我的 SL 報告因為趕工,有些數據其實不太準確。但後來幾份我花了大量時間認真做的報告,分數有時候反而沒有比較高。所以到底評分的標準是什麼,至今還是個謎。
其實整堂課最大的挑戰是:沒有任何實驗程式碼的指引。 不像有些課會給 Starter Code 或教你怎麼跑實驗,這堂課從資料處理到模型實作到視覺化,全部都得自己想辦法。做好心理準備吧。
相比作業,考試算是比較輕鬆的部分。只要把所有課程影片看完,基本上就能應付。不過影片的總長度也不短就是了。
這堂課的難度確實名不虛傳。我問了幾個做 Data Science 和 MLE 的朋友,他們的回饋是:這些確實都是很實用的知識,但對於一堂研究所等級的第一門 ML 課來說,教得有點太深太廣了。
但我不得不承認,這堂課讓我對傳統機器學習有了非常扎實的理解。加上之前 ML4T 打下的基礎,回頭看這些知識確實是一步一步堆起來的。
如果你正在考慮修這堂課,我的建議很簡單:提早開始,做好心理準備,然後享受被虐的過程。
本文由小貓貓工程師與 AI 協作完成
我是小貓貓工程師
希望我的分享能給正在考慮繼續深造的你一些啟發
找到自己繼續學習的動力