人工智能时代背景下,NLP方向或将悄悄崛起
自然語言處理是目前人工智能領域內的一個很重要的方向。它的目的是實現人和計算機程序之間使用自然語言(漢語、英語等語言)進行有效通信。但是自然語言處理也不是單純地研究自然語言,而是集語言學、計算機科學、數學等多種學課為一體的領域。簡單來說,就是計算機接受來自輸入用戶自然語言形式的輸入,通過程序中存儲的算法對輸入參數進行拆分計算等等操作,來達到類似人類理解語言的目的,并對處理結果進行分析,針對性的返回期望的輸出結果。作為人工智能領域公認的最高境界,自然語言處理(NLP)也被稱為“人工智能皇冠上的珍珠”。
1 自然語言處理(NLP)發展前景
首先來說,NLP屬于認知智能,相對于圖像語音識別來說,其實現起來更加復雜和困難。這也是為何在人臉識別和語音輸入等功能逐漸完善的當下,NLP方面還沒有什么成型可以商用的技術的原因。
而NLP算法的應用場景有很多,像是對話系統,翻譯系統,圖像的多模態等等。目前國內許多NLP方向的人才都被像BAT之流的大公司壟斷了。因此市面上的NLP方向人才較少。在此時,趁著人工智能領域還有著較大人才缺口的時候,學習NLP相關算法,抓住時代帶來的機遇,可以說是一個不錯的選擇。
不僅在就業方面,NLP方向大有可為,在學術方面,NLP作為人工智能完全的課題,其中很多的難點重點都還沒有解決。也很值得同學們為此終身奮斗。
2 如何學習NLP算法
知識結構梳理
和大多數本科生在學校期間學習的爬蟲或者網站開發等技術向方向不同,想要很好地掌握NLP算法,需要我們掌握的知識量要大很多,對于其中包含的基礎知識及其分類,可以大概劃分如下:
面對如此大量的知識體系,我建議可以通過線上視頻課或者線下課程的形式,來系統完整地學習NLP算法。和其他編程算法不同,NLP算法設計的基礎知識較多。下面會對上述知識進行分步介紹:
首先是基礎原理部分,這部分的知識以機器學習和深度學習為主,首先是機器學習部分。
相信對于理工科的同學來說,這些課程有部分是在學校內學過的,但無論是學過還是沒學過的同學,都可以著重看一下線性分類、支持向量機(SVM)、樹模型和圖模型這四方面的知識,作為深度學習的入門,這部分知識我們要熟練掌握。
接下來是深度學習,在這部分中我們盡量先弄明白神經網絡的正向和反向傳播過程,接下來了解其中的詞向量和編碼器解碼器的內部構造思想。可能之前有些同學使用過Word2vec或者其他,但這次我們要從內到外的去學習,在下圖中提到的神經網絡類型都是比較重要的,還是希望同學們能夠好好掌握。
在有了以上的知識貯備后,我們可以著手開始學習模型結構和論文了。下一步的任務是學習了解各種NLP經典任務的Baseline,盡量地看懂源碼。
NLP的幾大經典任務有:文本分類、文本匹配、序列標注、文本生成、語言模型等。
像是NLP算法中最為常見的文本分類任務,TextCNN可以說是第一Baseline,往后的發展就是加RNN、加Attention、用Transformer、用GNN了。第一次看可以對每個編碼器都粗略看一下,之后可以回過頭來仔細閱讀代碼。
在這里我推薦兩個我在學習過程中個人感覺講課效果很好的兩個網上公開課。
吳恩達CS229
吳恩達教授在斯坦福大學開設的機器學習課程CS229,可以說是很多人入門機器學習最先看到的課程了。這門當時爆火的課程直到現在仍然是很經典很有意義的機器學習課程之一。
在CS229中,吳恩達教授主要講授了機器學習和統計模式識別兩種內容。和其他課程相比,這個課程由于是在大學中教授的課程,所以對于數學原理方面的講解要更多更深入一些。對于想要深入學習機器學習的同學來說是很不錯的選擇。但是對于我這種想要直接應用到工作中的人來說,這門課程的導向和我的需求不太相符。
吳恩達教授的課程在嗶哩嗶哩有很多,這里我就不放鏈接了,需要的小伙伴可以自己去搜索。
臺大李宏毅
臺大李宏毅教授的機器課程,也是在網絡上受眾廣泛的一套視頻課程。李教授的這門課程,包含了從機器學習入門到OpenCV,從人工智能到NLP算法在內的許多內容。李教授的講課風格也深受同學們的喜歡。所以對于想要選擇視頻課的同學來說,可以跟著李教授進行學習。但是李教授的視頻課程內容極其豐富,倘若時間有限的話,需要選擇符合自己導向的課程進行學習。
NLP算法的知識結構十分復雜,我剛剛開始學習的時候也沒能立即上手,學習完基礎知識準備進入框架學習階段時發現遇到的問題實在太多了,這時我在網上看見了貪心科技推出的AI就業班,在這門課程的幫助下,我更好地完成了由理論到實踐的過程。
貪心科技AI就業班
在入門機器學習的時候,我所學習的就是貪心科技推出的機器學習中級課程。所以這次我再次回到貪心科技的官網查看,發現了這款AI就業班。
和一般的網絡視頻課不同,貪心科技的這款AI就業班有著明確的導向,也就是就業。
整個課程可以分為兩個階段,第一個階段是基礎知識的學習和案例實操;第二個階段是參與真實企業中的AI項目。
第一個階段又分為了三個部分,一是python語法基礎和數據分析基礎。作為NLP算法的最為基礎的知識,貪心科技的這款課程在一開始就進行了重點的講解,不管是有沒有機器學習操作經驗的學生,都能夠聽懂這次課程并有所收獲。
在基礎知識學習之后,還配有兩個實際案例的詳細講解和一次陌生的案例實戰。確保同學們能夠完全掌握爬蟲和數據分析相關知識并能夠運用到實際生活中去。
在掌握了爬蟲和數據分析相關知識后,就可以進入下一個階段的學習了。那就是機器學習基礎。再這一部分中,貪心科技從多種回歸分析的理論部分入手,講解了包含決策樹和隨機森林的樹模型,以及包含神經網絡和支持向量機等模型的聚類分析和神經網絡。
在AI就業班課程的第三部分,也是最重要的部分,貪心科技的老師分了九大板塊,來介紹包括文本處理、搜索引擎技術、深度學習基礎、LSTM模型、Seq2seq模型、自注意力機制、關系抽取和模型壓縮等技術。之后也選取了多大九個經典案例,來幫助同學們在實際操作中進一步學習。
在下一個階段,也就是參與真實AI企業項目階段。這個階段也是我當時收獲最大的階段。在這個階段,我們將會分組進入到某一個項目組,具體進入哪一個項目組取決于個人的職業發展方向以及當時的項目的情況。比如今后想做對話系統,我們可以選擇加入對話系統項目組;今后想做醫療知識圖譜,也可以選擇加入知識圖譜項目組。處于對科大訊飛的對話機器人的好奇,我加入了企業問答機器人項目組。
而這一階段的具體流傳如下圖所示。
在企業的實習過程中,我學到了在視頻課程中完全學習不到的內容。在企業環境中進行算法搭建,面對的是和平時自己操作時完全不同體量的數據。在企業真實的開發環境中,我能清楚地感受到自己的算法水平,有了非常快速的進步。
而且和線上課程不同,在線下學習時,有著一群志同道合的伙伴,在我學習累了的時候,他們伏案的背影成為了我繼續努力的動力。我和線下班的同學們在課程結束后各自奔向了不同的企業,可是這段一起拼搏學習的經歷,成為了我們共同難忘的回憶。
對于沒有時間進行線下學習的同學來說,也可以選擇線上視頻課的形式。在這里我簡單介紹一下我學習NLP算法的過程中所了解的幾種網上視頻課程吧。
3 書籍推薦
在學習人工智能的過程中,有本合適的參考書會使學習事半功倍。而對于內容豐富的人工智能領域,有了參考書會對我們的學習產生很好的輔助作用。以下是我自己使用過的很不錯的經典書籍:
首先是周志華的《機器學習》,由于封面上的西瓜,這本書也被大家稱為西瓜書。
作為機器學習領域極其經典的入門教材之一,這本書對機器學習的解釋可以稱得上是大而全面,是一本非常適合用來作為入門書籍的書。但是美中不足的是,書中對于公式的解釋并沒有其對于原理解釋地那樣細致。因此初學者可以選擇跳過其中部分難懂公式的講解,等有了一定基礎之后再回過頭來學習。
另一本書是數理知識方面的書籍,由李航編寫的統計方法學習,可以算是對上書公式不足的補充。在這本書中,對于機器學習中的公式有著極其細致的推導,看完這本書之后會對機器學習有著更深入的了解。
在有了機器學習和相應的數理基礎后,可以學習這本《動手學習深度學習》。和傳統的教材不同,這本書中不僅有著深度學習的算法原理和運行過程,還有著可以下載并且運行的Jupyter記事本。在書中,你可以看到文字、公式、代碼完美地融合在了一起,是我們學習深度學習路上不可多得的一本好書。
4 一點建議
不管我們在學習何種知識,都一定不要忘記我們是為了什么學習。我想大部分人學習深度學習,都是為了之后就業有所幫助。那么在我們學習的過程中,就一定要牢記就業這個方向。單純的做題看視頻是遠遠不夠的,最有效、最快速的方法便是跟隨一個個項目來進行實踐。
而網絡上能找到的項目資料,有的過于陳舊,沒有了參考價值;有的資料不全,做到一半沒法進行下去。這時候我就不得不安利一下之前提到的貪心科技AI就業班了:
貪心學院有著實力雄厚的導師團隊,教研團隊成員由亞馬遜、谷歌、微軟高級工程師構成,擁有極強的理論基礎和商業實戰經驗:
在這些老師的幫助下,我和同學們都迅速地提升著自己的專業水平,很快地成為了一名合格的NLP算法工程師。而且貪心科技AI就業班自從開班以來,歷屆學員的就業待遇是十分驚人的。平均18900的月薪已經達到甚至超過了211大學本科畢業生的薪資,88%的就業班畢業生,都能找到在AI崗位的工作。如此華麗的就業數據,是大部分輔導機構難以望其項背的。
最后,能在貪心科技的AI就業班中和老師同學相遇,使我一生難忘的事情。在班級中結識的老師,也是我工作道路上的領路人和指引者。從我自身角度而言,貪心科技的這款AI就業課,真的是物超所值。
總結
以上是生活随笔為你收集整理的人工智能时代背景下,NLP方向或将悄悄崛起的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 军队文职联勤保障部队面试分64.8是在什
- 下一篇: 印度的国防教育的主要内容包括国防法制教育