【机器学习应用】还没期末考试,算法却说我的物理一定挂科
By 超神經(jīng)
場景描述:大學(xué)物理是理工科學(xué)生的基礎(chǔ)必修課程,但也因為有一定的難度,令很多學(xué)生望而生畏。研究人員提出了用 AI 算法預(yù)測,哪些學(xué)生物理課有掛科風(fēng)險,好讓老師更好地進(jìn)行教學(xué)指導(dǎo)和調(diào)整教育資源的分配。
關(guān)鍵詞:隨機(jī)森林 決策樹 大學(xué)物理 預(yù)測
不得不說,算法的預(yù)測能力越來越強(qiáng),小到預(yù)測夫妻是否會吵架,大到預(yù)測地震洪水等何時發(fā)生。
現(xiàn)在,算法甚至連你的物理課會不會掛科,都能預(yù)測出來。
這是最近西弗吉尼亞大學(xué)和加州理工大學(xué)的學(xué)者們,在 arxiv.org 上發(fā)表的一項最新研究。
他們發(fā)表了一篇有趣的論文:《Using Machine Learning to Identify the Most At-Risk Students in Physics Classes》(《使用機(jī)器學(xué)習(xí)來識別物理課上,最有掛科風(fēng)險的學(xué)生》)。
愛因斯坦:讓我看看是誰會掛科?
論文中表示,通過機(jī)器學(xué)習(xí)算法,可以評估物理基礎(chǔ)課中學(xué)生的畢業(yè)成績,該預(yù)測模型將學(xué)生分類為成績 A、B、C、D、F 和 W(退選)。
注:美國大部分院校采用的評分等級與百分制分?jǐn)?shù)對應(yīng)規(guī)則大約為:A:90+;B:80+;C:70+;D:60+;F:不及格;W:退選課程(Withdrawal 的簡寫)。
?預(yù)測成績:敲響警鐘,你還可以搶救一下
還記得被大學(xué)物理支配的恐慌嗎?
對很多理工科學(xué)生來說,大學(xué)物理的難度系數(shù)與高數(shù)相當(dāng),是最讓人頭禿的科目之一。
國外一項研究顯示:曾主修工程和科學(xué)(統(tǒng)稱為 STEM)但最后轉(zhuǎn)專業(yè),或者沒能拿到學(xué)位的學(xué)生中,其中一小半的人就是因為物理和數(shù)學(xué)等主修課程,實在是太難。
學(xué)好高等數(shù)學(xué)、微積分也是掌握物理的前提之一
STEM 學(xué)生,尤其是基礎(chǔ)學(xué)科的流失率逐年提高,而與此同時,社會對他們的需求卻依舊很高,出現(xiàn)了不小的人才缺口。
因此,西弗吉尼亞大學(xué)和加州理工大學(xué)的研究人員提出,用 AI 算法來拯救這些學(xué)生吧。
他們認(rèn)為,用機(jī)器學(xué)習(xí)算法,來識別哪些學(xué)生有掛科風(fēng)險。這樣教師就可以根據(jù)預(yù)測結(jié)果,有針對性地進(jìn)行指導(dǎo),從而提高學(xué)生的通過率,也能及時了解他們的掌握情況。
?算法:參考過往表現(xiàn),預(yù)測未來成績
?樣本抽取?
研究人員從來兩所大學(xué)的抽取了三個樣本,來訓(xùn)練預(yù)測學(xué)生表現(xiàn)的人工智能算法。
這些樣本數(shù)據(jù)包括了:學(xué)生的 ACT(美國高考)成績、大學(xué) GPA 、物理課上收集的數(shù)據(jù)(比如課后作業(yè)成績和考試成績)。
其中,樣本一和樣本二來自于美國東部一所大學(xué)的物理科學(xué)和工程專業(yè)的學(xué)生。
樣本一:包括 2000 年至 2018 年,完成大學(xué)物理 1 課程的所有學(xué)生,樣本量為 7184 人。
樣本二:?2016 年秋季至 2019 年春季學(xué)期的數(shù)據(jù),樣本量為 1683 人。樣本包括了課堂表現(xiàn)數(shù)據(jù),比如平均答題次數(shù)、課后作業(yè)平均成績、學(xué)期考試分?jǐn)?shù)等。
樣本三:數(shù)據(jù)來自于 2017 年整個學(xué)年的力學(xué)入門課。樣本三收集于另一所大學(xué),該大學(xué)位于美國西部。
?變量?
本研究中所使用的變量,都是來自大學(xué)和班級內(nèi)部。同時,也將一些人口統(tǒng)計信息如性別、族裔等信息納入其中。
學(xué)生的高中成績、是否有微積分基礎(chǔ)等都是考慮的變量
?隨機(jī)森林算法預(yù)測?
研究中,采用隨機(jī)森林機(jī)器學(xué)習(xí)算法,來預(yù)測學(xué)生的入門物理學(xué)課程最終成績。算法最后會將學(xué)生分為獲得 A、B 或 C 的學(xué)生(歸為 ABC 類學(xué)生)和獲得 D、F 或 W 的學(xué)生(歸為 DFW 類潛在掛科學(xué)生)。
為了了解算法的性能,他們將數(shù)據(jù)集分為測試和訓(xùn)練數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于開發(fā)分類模型,以訓(xùn)練分類器。
測試數(shù)據(jù)集則用于表征模型性能。
分類模型預(yù)測測試數(shù)據(jù)集中每個學(xué)生的測試結(jié)果后,會將預(yù)測結(jié)果與實際結(jié)果進(jìn)行比較。
?結(jié)果:尷尬了,準(zhǔn)確度 57 %?
經(jīng)過模型調(diào)整與驗證,研究者得出了預(yù)測結(jié)果,但準(zhǔn)確率實在不太樂觀……
模型在三個樣本集的表現(xiàn)
他們指出,在對整個樣本預(yù)測結(jié)果中,女性和少數(shù)民族學(xué)生較多的樣本,DFW 準(zhǔn)確性較低,他們指出,這需要對人口統(tǒng)計學(xué)進(jìn)行模型調(diào)整。
在第一個樣本上訓(xùn)練的算法,預(yù)測「DFW 類學(xué)生」的準(zhǔn)確性僅為 16%,研究人員分析,這可能是因為訓(xùn)練集中,成績?yōu)?DFW 的學(xué)生比例很低(12%)所致。
樣本一中,模型的最佳表現(xiàn)準(zhǔn)確度僅僅達(dá)到 57%,也就是僅比隨機(jī)概率好一點點而已。
?結(jié)果準(zhǔn)確率低,模型引爭議
面對這個結(jié)果,他們認(rèn)為:對于教育工作者和正在努力學(xué)習(xí)的學(xué)生來說,此類機(jī)器學(xué)習(xí)分類模型,可能是一個強(qiáng)大的工具,可以更好指導(dǎo)教育干預(yù)和教育資源的分配。
研究人員:任何模型都不能達(dá)到 100% 的準(zhǔn)確度
網(wǎng)友:可是... 57% 是不是有點低?
但是,也有批評者認(rèn)為,像這樣的技術(shù),可能會帶有偏見或誤導(dǎo)性的預(yù)測,給學(xué)生造成傷害。
一直研究表明,即使接受了大型語料庫的訓(xùn)練,人工智能在預(yù)測復(fù)雜結(jié)果方面,仍會存在偏差問題。
此前,亞馬遜的內(nèi)部 AI 招聘工具,就因為表現(xiàn)出對女性的偏見,而被停用。
因此,人們也擔(dān)心,這種成績預(yù)測算法,不僅不能起到提高 STEM 學(xué)生保留率,反而會加劇不平等現(xiàn)象。
當(dāng)然一切的結(jié)果都只是預(yù)測,考試嘛,三分天注定,七分靠打拼,剩下的九十分靠老師的心情。
祖師爺:想考好?得有這個
—— 完 ——
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)專輯獲取一折本站知識星球優(yōu)惠券,復(fù)制鏈接直接打開:https://t.zsxq.com/662nyZF本站qq群1003271085。加入微信群請掃碼進(jìn)群:總結(jié)
以上是生活随笔為你收集整理的【机器学习应用】还没期末考试,算法却说我的物理一定挂科的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【深度学习】深度学习的发展方向: 深度强
- 下一篇: 【CV】使用Keras和迁移学习从人脸图