MIT自然语言处理第一讲:简介和概述(第三部分)
自然語言處理:背景和概述
Natural Language Processing:Background and Overview
作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
譯者:我愛自然語言處理(www.52nlp.cn?,2009年1月5日)
四、 這門課程將包含哪些內容(What will this course be about)?
1、 對不同層次(句法、語義、篇章)的語言知識建立合適的計算模型和有效的表達方式(Computationally suitable and expressive representation of linguistic knowledge at various levels: syntax, semantics, discourse)
2、 從文本樣本中學習有關語言特性的算法:平滑估計,對數線性模型,概率上下文無關文法,EM算法,聯合訓練,…..(Algorithms for learning language properties from text samples: smoothed estimation, log-linear models, probabilistic context free grammars, the EM algorithm, co-training, …)
3、 以文本處理技術為基礎的應用:機器翻譯,文本摘要,信息檢索(Technologies underlying text processing applications: machine translation, text summarization, information retrieval)
五、 教學大綱(Syllabus)
簡介和概述(Introduction and Overview)——1課時(1 class)
簡單的語言統計學(Simple Language Statistics)——1課時(1 class)
語言模型(Language Models)——1課時(1 class)
標注(Tagging)——1課時(1 class)
句法分析(Syntactic Parsing)——1課時(1 class)
無監督語法歸納(Unsupervised Grammar Induction )——1課時(1 class)
詞匯語義學介紹(Introduction to Lexical Semantics)——1課時(1 class)
詞義消歧(Word Sense Disambiguation)——1課時(1 class)
語義分析(Semantic Parsing)——1課時(1 class)
語篇處理介紹(Discourse Processing)——1課時(1 class)
指代消解(Anaphora Resolution)——1課時(1 class)
主題劃分(Topical Segmentation)——1課時(1 class)
語篇分析(Discourse Parsing)——1課時(1 class)
對話處理(Dialogue Processing)——1課時(1 class)
自然語言生成(Natural Language Generation)——1課時(1 class)
文本摘要(Text Summarization)——1課時(1 class)
信息檢索(Information Retrieval)——1課時 (1 class)
機器翻譯(Machine Translation)——3課時 (3 classes)
六、 預備知識(Prerequisites)
1、 對語言感興趣并了解英語的基本知識(Interest in language and basic knowledge of English)
2、 懂一些基本的線性代數,概率統計知識(Some basic linear algebra, probability and statistics)
3、 有基本的編程基礎(Some programming skills)
七、 評價(Assessment)
1、 期中考試(Midterm)——35%
2、 兩個家庭作業(Two homeworks)——每個15%
3、 一個提交工程(Project)—— 35%
八、 總結(Summary)
1、 統計方法 vs “手工制作”系統(Statistical approaches vs. hand-crafted systems)
a) 許多規則都需要編碼成人類知識(Many rules are required to encode human knowledge)
b) 很難對規則間的交互建模(Hard to model rule interaction)
c) 常見的限制比較彈性(Frequently constraints are soft)
2、 關于NLP的機器學習(Machine Learning for NLP)
a) 我們需要對語言信息更有效的計算表示能力(We need computationally effective representation of linguistic information)
b) 我們需要對處理語言數據更合適的學習算法(We need new learning algorithms suitable for processing linguistic data)
下一講(Next lecture):單詞計數(Word Counting)
第一講結束!
第二講:單詞計數
附:課程及課件pdf下載MIT英文網頁地址:
http://people.csail.mit.edu/regina/6881/
注:本文遵照麻省理工學院開放式課程創作共享規范翻譯發布,轉載請注明出處“我愛自然語言處理”:www.52nlp.cn
from:http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-third-part/
總結
以上是生活随笔為你收集整理的MIT自然语言处理第一讲:简介和概述(第三部分)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MIT自然语言处理第一讲:简介和概述(第
- 下一篇: MIT自然语言处理第二讲:单词计数(第一