研究生的早期科研之路
作者:中國人民大學(xué)教師趙鑫
主頁:http://aibox.ruc.edu.cn/
之前寫了一篇文章《計算機系本科生開展科研學(xué)習(xí)的九問九答》,主要是關(guān)注本科生。這一篇繼續(xù)談一下研究生的早期科研之路。因為大家的背景不同、經(jīng)歷不同,所以我也只是從個人角度來說一下,內(nèi)容僅供大家參考。
1. 跨越人生的舒適區(qū)
研究生階段是連接本科和社會的關(guān)鍵節(jié)點。很多同學(xué)進(jìn)入研究生階段往往經(jīng)歷了保研或者考研的洗禮。能夠進(jìn)入心儀的學(xué)校甚至實驗室學(xué)習(xí),已經(jīng)是一個重要的收獲。本科階段側(cè)重基礎(chǔ)學(xué)習(xí),保研或者考研對于應(yīng)試能力有著較高的要求;研究生階段則更為關(guān)注實戰(zhàn)能力和解決問題的能力。
研究生階段與本科生的整體學(xué)習(xí)方式和訓(xùn)練方式不太一樣。不總會有教科書教你如何科研入門,不總會有資料直接將idea傳達(dá)給你。很多同學(xué)做的轉(zhuǎn)型實際上不好。經(jīng)歷了保研和考研,很多同學(xué)可能慣性認(rèn)為本科的學(xué)習(xí)方式仍然適用于自己,畢竟這些原有的學(xué)習(xí)方式幫助大家走到了這個階段。然而原有的學(xué)習(xí)方式不是最優(yōu)的方式,需要進(jìn)行調(diào)整和摸索。
確定了研究生階段已經(jīng)確定無疑后(例如考研填報完成或者考研復(fù)試通過),要及時開始下一段的規(guī)劃。越早上路的人還是會有優(yōu)勢的。過去的“輝煌經(jīng)歷”(例如GPA達(dá)到年級第一名、獲得過ACM金獎等)應(yīng)該早點“丟”進(jìn)箱子里了,新一程的奮斗又要開始了。不要躺在舒適區(qū),每天沾沾自喜,實際上你會發(fā)現(xiàn)之前同水平的同學(xué)可能早已在科研上領(lǐng)先你很多了。千萬不要固化自己的學(xué)習(xí)方式,要勇于做改變,勇于接受新的挑戰(zhàn)。第一步就是在心理上做好準(zhǔn)備,嘗試新的學(xué)習(xí)方式,也要接受忽然不能得心應(yīng)手的落差。
2. 學(xué)習(xí)過程必須專業(yè)化
很多同學(xué)用了很多功夫,但是做不好科研,除了天賦外,一個很重要的原因就是不專業(yè)。科研是一個系統(tǒng)化的學(xué)習(xí)過程,可能包括閱讀英文原版書籍、學(xué)習(xí)基礎(chǔ)理論(機器學(xué)習(xí))、使用標(biāo)準(zhǔn)規(guī)范編寫代碼、使用科學(xué)寫作方法攥寫論文等等。每一個環(huán)節(jié)不應(yīng)當(dāng)對標(biāo)某本教科書某篇論文,而是要對標(biāo)學(xué)術(shù)界的標(biāo)準(zhǔn)。這樣所有環(huán)節(jié)都下來,才能真正達(dá)到一流。
我強烈建議初學(xué)者一定要真正地學(xué)習(xí)一兩門頂尖學(xué)者開設(shè)的視頻課程,從教材、講義以及課后作業(yè)都認(rèn)真完成一遍。通過閱讀相關(guān)經(jīng)典論文,可以最接近學(xué)術(shù)界的科研語言;而獨立做作業(yè)會讓大家有足夠的思維訓(xùn)練和動手訓(xùn)練。另外一個好處是,無人監(jiān)督的情況下,自己是否能夠完成一個學(xué)習(xí)過程,我覺得學(xué)公開課程實際上是很好的一個檢測手段。
專業(yè)的論文從寫作、理論以及代碼等多個維度都是專業(yè)的;相反不專業(yè)可以體現(xiàn)在糟糕的排版、英文術(shù)語不規(guī)范、代碼復(fù)用性很差。說到這里,我強烈建議研究生一旦發(fā)表論文后,能夠創(chuàng)建一個project web page,讓你的所有東西可以復(fù)現(xiàn),接受學(xué)術(shù)同行的考量。當(dāng)然,這個要求很高,能做到的人不多。很多學(xué)生,包括很多狂發(fā)論文的研究生,有一個心態(tài),一個工作被發(fā)表了,這個工作就結(jié)束了。那么原來的代碼為了趕論文寫的差一些就差一些吧,論文里的圖片區(qū)分度不高就不高吧。學(xué)術(shù)成果是研究人員的名片,一份“邋遢”的工作會是一段抹不去的黑歷史。既然做了,就要專業(yè),也要持續(xù)維護這種專業(yè)。
3. 打好基礎(chǔ)才能“騏驥千里”
很多研究生有的時候會經(jīng)常立flag,譬如,今年無論如何都發(fā)出來一篇A類論文。我想說的是好的工作人人渴望,但是工作不是靠期望得來的,當(dāng)然不可否認(rèn)信念和信心的重要性。大部分研究生都需要循序漸進(jìn)的科研,需要將各種基礎(chǔ)打好后,才能出一個較為滿意的工作。一般來說,這個過程可能花費1-3年。就和游戲機里過關(guān)一樣。例如,塞爾達(dá)第一場剛出來的林克是無法搞定游戲后期的妖怪的(不排除有一些游戲達(dá)人能夠完成)。別著急,從基礎(chǔ)做起。
很多研究生經(jīng)常將無法發(fā)表論文歸為自己能力不夠、導(dǎo)師指導(dǎo)不好、運氣太差等因素,但是我想說,科研這東西,只要按照專業(yè)的方式持之以恒學(xué)習(xí),或多或少都會有些結(jié)果的(例如論文)。
如果暫時沒有發(fā)表論文的同學(xué)也不要著急。為什么呢,因為很有可能是真沒有達(dá)到這個水平。可以對標(biāo)一個理想狀態(tài)“熟讀論文百篇、白紙推公式、vim寫代碼”,你是否達(dá)到了呢?當(dāng)你很輕易地實現(xiàn)這個理想狀態(tài),能不能發(fā)論文只是時間的問題(但是好工作未必一定能出來,論文和好工作是兩回事)。
“高筑墻、廣積糧”。所有好的工作最終都?xì)w結(jié)為持續(xù)的付出與積累,不要隨便喊口號、立flag。只有把一件事情做得專業(yè)、打好基礎(chǔ),才能有所成績。
想想馬斯克發(fā)射火箭和人造衛(wèi)星,這可不是一句口號外加雞血能搞定的。日復(fù)一日,年復(fù)一年。總之,為什么有的人那么厲害,因為他比你更加拼命而又堅強。我看到很多同學(xué)因為一兩次論文的被拒,就認(rèn)為自己不適合科研的想法。我很理解這種心態(tài),但是同時也想說,有志者事竟成。雞湯有的時候講起來真的特別虛偽,但是有的時候又特別應(yīng)景。有大付出者,才有大回報。
4. 善于發(fā)現(xiàn)以及跟追熱點
首先想說,熱點這東西不總是好事。如果所有人只關(guān)注熱點,那么科技創(chuàng)新可能就會受到影響。想想三劍客們在主題模型(topic model)“橫行十年”的背景下,安心去做神經(jīng)網(wǎng)絡(luò),其定力、判斷真是非同一般。
但是,對于初學(xué)科研的人,我不建議盲目追蹤冷門課題。因為,我們的基礎(chǔ)不夠做足夠的探索。相反,熱點問題的討論和基礎(chǔ)很多,可以很好地切入并且空間很大。同樣地,即使一個老的課題,里面可能也有一些新興的熱點,也是值得初學(xué)者高度關(guān)注的。
能夠早期預(yù)見以及鎖定一些熱點,這是一種很強的科研嗅覺。想想BERT剛剛出來的那一個月,如果我們能馬上吃透這個模型,并且將其應(yīng)用在之前一個很難被提升的任務(wù)上,我想這樣的一個工作可能也會是不錯的一個研究工作(對于初學(xué)者)。雖然我不是特別鼓勵這種套模型的研究,但是還是覺得對于初學(xué)者這真的已經(jīng)很厲害了:能在第一時間預(yù)判熱點、能在短期階段學(xué)會并且掌握該模型、能夠很好地遷移該工作或者該想法在自己的任務(wù)上。
不過現(xiàn)實是,我看到的是,追蹤熱點的同學(xué)往往都不是新手;相反都是一些前期功力深厚的研究組或者研究生。說起來,這有點像投資專家,你觀察他選擇一支股票的過程,經(jīng)常會不服氣吐槽他好像沒啥技術(shù),但是他就是對于商機把握的好,著實買到了潛力股(注:我個人確實沒有任何投資經(jīng)驗,如果舉錯了例子,還望包容)。
5. 做好“模仿學(xué)習(xí)”
模仿是人類成長的重要手段。從嬰兒階段學(xué)習(xí)語言表達(dá)到進(jìn)入一個領(lǐng)域?qū)W習(xí)新的技術(shù),都需要找到一些可參照可學(xué)習(xí)的目標(biāo)。當(dāng)你還不清楚什么是正確的、什么是重要的科研時,那么請模仿吧。
有些同學(xué)會說,我也沒有國際大師作為導(dǎo)師啊,我也沒有什么好心的師兄師姐啊。有些同學(xué)總會抱怨導(dǎo)師對自己關(guān)注不夠,沒有親自告訴自己做啥題目。我想說模仿是一種能力,就和預(yù)見熱點一樣。在線課程、大佬兒的論文、極客的代碼等等,只要你抱著學(xué)習(xí)心態(tài),就有大把可供模仿學(xué)習(xí)的途徑。
有的同學(xué)說我不會寫論文,寫的亂糟糟的。我想問一下是否認(rèn)真讀過幾篇論文的寫作,從標(biāo)點到用詞是否真的揣摩過作者的意圖、是否用英英詞典查過每個詞的具體意思以及用法、是否定期摘抄一些好的句子。總結(jié)起來一句話,模仿做的不夠。
模仿不是抄襲。打過游戲的同學(xué),我想可能對這句話有著深入的體會。我想看過一些專業(yè)游戲玩家的一些高級操作后,你以后也會在一些類似的場景下受到啟發(fā)。同理,在奧數(shù)比賽里,很多同學(xué)都會總結(jié)一些常見的規(guī)律結(jié)題法,比如連線證明三角形相似。總之,模仿要深入骨髓、模仿要活靈活現(xiàn)、模仿要適當(dāng)創(chuàng)新。
但是模仿必須專業(yè)。比如寫作。要找到寫作達(dá)到國際水準(zhǔn)的論文,然后逐詞逐句分析。很多A類會議論文的寫作可能未必達(dá)標(biāo),千萬別隨便拿到一篇論文就開始模仿,以免照錯學(xué)錯。看看別人是為什么要做一個工作、如何論述一個工作的意義、如何介紹模型、如何進(jìn)行公式推導(dǎo)等等。總而言之,模仿能夠做到位,第一個工作不會做的太差。
6. 集中精力攻堅
研究生沒有特殊情況,不要總是更改題目。正常來說,一個研究生只有2-3年時間做科研學(xué)習(xí),中間再換2、3個題目,那么產(chǎn)生的再次學(xué)習(xí)代價會很高。
有的同學(xué)可能要問,我這個題目我已經(jīng)做了很久了,就是不出成果、就是效果不好,怎么辦啊。首先,判斷一下研究領(lǐng)域是否是處于國際學(xué)術(shù)的熱點。比較簡單的方法是,找到對應(yīng)的頂級會議,看看每年發(fā)表的相關(guān)論文(包含大的關(guān)鍵字)是否有5-10篇,甚至更多。這是在檢查當(dāng)前問題是否還有可研究的空間。其次,判斷所提出的idea在所使用的數(shù)據(jù)是否合適。研究人員要不斷培養(yǎng)對于數(shù)據(jù)的敏感性,以便減少對于方法的試錯時間。很多idea或者思路,看一下具體的數(shù)據(jù)其實就可以判斷是否會work。如果說,一直無法說清楚自己的數(shù)據(jù)有怎樣的特點,反倒指望黑箱模型去提升效果,這種途徑失敗的概率是很高的。而且很多想法也是從數(shù)據(jù)而來。當(dāng)然,這和看著test data去調(diào)參數(shù)是完全不同的。注意,idea不是去跟著bad case去走的,idea要普適、要適應(yīng)于多個數(shù)據(jù)集合。
如果上述這兩點沒問題,相信我,這是你自己的問題。很多同學(xué)剛開始接觸科研,經(jīng)常抱怨自己的效果總是不好。實際上,這是缺少數(shù)據(jù)的敏感性以及實踐能力(比如調(diào)參等)缺乏造成的,甚至很多時候還是代碼寫錯了。
那么這個時候該怎么辦?不要換題目,至少從相關(guān)工作、模型設(shè)計、代碼設(shè)計以及錯誤分析多條途徑不斷檢查、修正和改進(jìn)。多讀多想多嘗試,持續(xù)推動對于這一問題的理解。攻克困難需要持續(xù)發(fā)力,使自己處于不斷在進(jìn)步的狀態(tài)。大家一起爬山,有的人路好走一些,有的人難走一些。但是一座山過不去,盲目換到另一座山,結(jié)果就是很大概率也爬不上去。
7. 動手去做吧
很多學(xué)生會問我如何能做好科研呢?我想借用一句話,那就是“實干興邦”。在科研上,真的,想太多捷徑、立太多flag、說太多牢騷,都是沒有太多意義的。
我有的時候經(jīng)常被問到“讀論文有什么方法嗎”、“寫作有什么方法嗎”、“有什么辦法可以想到好的模型”。我想肯定是有一些技巧的,但是很多時候不愿意回答這種問題。相反我會反問,你精讀過50篇論文嗎?你完整寫過一篇論文嗎?你試過了五種以上的模型嗎?沒有的話,那么先去踏實地做。馬步還沒有扎好的話,可以先不用想太多的技巧。同樣的技巧,如果配以經(jīng)驗,會得到不一樣的感悟。
所以初學(xué)者,別想太多,安心推進(jìn)。今天你是否讀了新的論文、寫了新的代碼、有了新的想法等。科研很多時候很枯燥。科研工作者需要日復(fù)一日的重復(fù)固定流程來強化自身能力,讀論文、寫代碼、想idea、跑數(shù)據(jù)等等。科研沒有輕松和捷徑,去做就好了。
我給初學(xué)者的建議是,堅持讀完若干經(jīng)典書籍、堅持復(fù)現(xiàn)若干經(jīng)典模型的代碼、堅持每天不斷閱讀新的論文、堅持寫作、堅持跑不同的實驗、堅持去做錯誤分析。。。這就是秘籍。
到任何時候,別小看時間的力量。研究生3年能夠堅持上述的過程(每年有300天以上),我相信畢業(yè)時,你會發(fā)現(xiàn)一個“強大的自己”,強大到你曾經(jīng)不敢相信自己能夠做到。相反,也可能讓你“泯然眾人矣”。科研前期是一場自律與放松的博弈。然而入門后,你會發(fā)現(xiàn)閱讀論文其實也是在放松、也是在享受。我回顧自己認(rèn)識做科研較好的同學(xué),往往都是執(zhí)行力很強的同學(xué),我想這一點也必須在這里再強調(diào)一下。
8. 加強學(xué)術(shù)表達(dá)與交流
有了行動后,我覺得再聊聊“說”和“寫”。表達(dá)與交流是很重要的。“酒香也怕巷子深”。即使再好的工作,不被別人接受,不為他人所知,可能也失去應(yīng)有的價值。我感覺國內(nèi)學(xué)者其實有的時候很謙虛。相反,老外實際上是注重宣傳的。一旦有了一個新工作,經(jīng)常會說“proud of”、“important progress”。當(dāng)我們有了新工作后,也要適度進(jìn)行宣傳。
首先,把論文寫清楚。最近幾年,頂會論文的數(shù)量不斷增多,而其中有的時候會遇到一些不知所云的論文。在這種情況下,論文讀得懂全靠猜的準(zhǔn)。科研工作者有義務(wù)讓自己的工作表述是清楚的。我一直覺得論文寫得清楚不清楚,和通用的英語寫作關(guān)系不是特別大。英語技巧只會是讓論文讀起來感覺美不美。之前智源做過一次英文寫作的講座,我也參與給了一個報告。關(guān)于此部分,我想大家也可以在網(wǎng)上搜到很多談科學(xué)寫作的文章,這里不再這里贅述。但是我還是想強調(diào)一下,用詞和邏輯。不要隨便用一些當(dāng)前領(lǐng)域文章沒有出現(xiàn)的名詞,不要想當(dāng)然地用一些自以為正確的單詞。其次,就是邏輯。論文不是堆砌內(nèi)容,而是要循序漸進(jìn)引導(dǎo)讀者閱讀。
其次,做好交流報告。現(xiàn)在越來越多的報告交流會,這都是很好的和其他學(xué)者交流的機會。講報告最忌諱就是自我沉醉。講報告是為了讓聽眾有收益,在作報告之前,要反復(fù)問自己,聽的人能聽懂嗎、聽的人能有收獲嗎?這樣,讓自己置身自己的工作之外,才能講好自己的工作。一般來說,20分鐘主要的報告,要講清楚動機、模型以及實驗結(jié)論,不要陷入細(xì)節(jié)講個沒完。剛開始作報告的同學(xué)有個誤區(qū),就是希望把自己工作的所有細(xì)節(jié)都告訴給聽眾。實際上,聽眾的重點和關(guān)注通常在固定時間內(nèi)都是極為有限的,重要內(nèi)容傳遞過去已經(jīng)很不容易了。
9. 保持心態(tài)平和
科研中心態(tài)是非常關(guān)鍵的。能做好科研的人,一定要相信自己能夠做好。如果沒有這種內(nèi)在的力量,而要靠其他人的鼓勵來維持心態(tài),可能確實很難做好科研了。
很多時候,我們做的課題,和做投資是一樣的,因為你并不能看到整個全景。起步的時候只是一個idea,加上自己的經(jīng)驗,但是你必須提前決策做還是不做。中間整個過程會遇到各種各樣的困難,包括想不出來模型、實驗效果不好等等。面對科研,不是所有的同學(xué)都是幸運到順風(fēng)順?biāo):芏啻笈W(xué)者,可能都是科研入門的遲到者。要堅信自己可以做好科研,它有各種不順利都是正常的。相反,太容易被困難嚇怕了,早早結(jié)束自己的科研經(jīng)歷,也是一次對于自我能力的否定。
如果有幸進(jìn)入一個強組,從一方面是一個很好的機會,從另一方面又是會有很強的peer pressure。甚至,可能整個研究所內(nèi)部、國內(nèi)相關(guān)研究領(lǐng)域內(nèi)部一些明星學(xué)者都會傳達(dá)一定的壓力。有適當(dāng)?shù)母偁幮睦?#xff0c;我覺得是很好的事情。特別是研究生同學(xué),如果身邊能找到一個和自己實力相仿,甚至比自己厲害一些的同學(xué)作為參考,能夠起到互相交流、互相促進(jìn)的作用。
但是要控制這種心態(tài)的蔓延,不要盲目攀比論文的多少。要保持一顆平和的心態(tài),不能看到別人在某一個任務(wù)上發(fā)了很多論文,自己就盲目更換題目追隨。還是要有一個核心的研究目標(biāo),不斷地做好規(guī)劃,不斷地持續(xù)推進(jìn)。不要因為他人的進(jìn)步而對自己產(chǎn)生過大的負(fù)面壓力,而影響了自己的判斷能力和執(zhí)行能力。
10. 將科研融于生活
如果說讓我用一句總結(jié)“快樂科研”的秘訣,我想要說就是將科研融于生活。
將科研融于生活的好處是不會覺得“太辛苦”。有同學(xué)馬上會反問,啥,這還不痛苦嗎,這不是瘋了嗎?實際上,當(dāng)人形成了一定的習(xí)慣后,略微加上一些正反饋,就可以很適應(yīng)不斷重復(fù)慣性行為。相反,隔幾天做一次,才會覺得痛苦。就拿健身來說,一般堅持過1年以上天天鍛煉的人,之后斷的可能性很小。但是每周去2次左右的人,很容易放棄健身。偶爾一次健身,要不覺得很興奮,要不覺得很難受。平和、自然其實是最好的狀態(tài)。將科研融于生活,你慢慢適應(yīng)它了,你對他的心態(tài)就會逐漸平和了。有一天,你發(fā)現(xiàn)你好像每天科研就像吃飯睡覺一樣,那么即使連續(xù)工作多個小時,也并不會覺得太辛苦,因為那是生活的一部分。因為你心態(tài)平和了、自然了,你甚至沒覺得你在吃苦。
要做好一件事,你就每天都想每天都做。所謂念念不忘,必有回響。我不太認(rèn)同那句話“work hard, play hard”,把工作和放松完全割裂開。作為一個科研工作者,你的靈感要發(fā)生在每一次有意義的情景思考中。還清楚地記得,我自己第一個長文(EMNLP 2010的論文)模型就是在公交車上想出來的。時至今日,我都能清楚記得那一刻的興奮。有的時候,我特別羨慕現(xiàn)在的學(xué)生:這樣年輕的你們,而我又是曾經(jīng)這樣年輕過。在研究生階段,大家操心的事情很少,可以一心一意做科研。
作為結(jié)尾,還是再次強調(diào)這篇文章僅是個人觀點,談的也是我們普通人的科研入門。在當(dāng)前復(fù)雜的國際形勢面前,我們科研工作者要有所擔(dān)當(dāng),至少要有這股決心,要把科研做好,至少把手頭的研究工作做好。一名優(yōu)秀的研究生,至少應(yīng)該有兩年為科研奮不顧身的一段經(jīng)歷。那會是一段美好的回憶,甘之如飴。
原文鏈接:https://mp.weixin.qq.com/s/MDB_er6rfKhXkDp-m1w-tg
總結(jié)
以上是生活随笔為你收集整理的研究生的早期科研之路的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AI】人工智能深度学习入门路线
- 下一篇: Python class 类中 __in