MIT自然语言处理第一讲:简介和概述(第一部分)
自然語言處理:背景和概述
Natural Language Processing:Background and Overview
作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
譯者:我愛自然語言處理(www.52nlp.cn?,2009年1月3日)
這堂課將要回答的問題(Questions that today’s class will answer):
1、什么是自然語言處理(What is Natural Language Processing (NLP))?
2、為什么自然語言處理比較難(Why NLP is hard)?
3、我們能夠構建一個可以從文本中學習的程序嗎?(Can we build programs that learn from text)?
4、這門課程將包含哪些內容(What will this course be about)?
一、 什么是自然語言處理(What is Natural Language Processing)?
1、計算機將自然語言作為輸入或輸出:
圖略……
輸入對應的是自然語言理解(NLU: Natural Language Understanding);
輸出對應的是自然語言生成(NLG: Natural Language Generation);
2、關于NLP的多種觀點:
A、人類語言處理的計算模型(Computational models of human language processing):
——程序內部按人類行為方式操作(Programs that operate internally the way humans do)
B、 人類交流的計算模型(Computational models of human communication):
——程序像人類一樣交互(Programs that interact like humans)
C、有效處理文本和語音的計算系統(Computational systems that efficiently process text and speech)
3、NLP的應用(NLP Applications):
A、“寶貝魚”機器翻譯(Machine Translation with Babel Fish)…….
B、MIT翻譯系統(MIT Translation System)……
C、文本摘要(Text Summarization)……
D、對話系統(Dialogue Systems)……
E、其他應用(Other NLP Applications):
——語法檢查(Grammar Checking)
——情緒分類(Sentiment Classification)
——ETS作文評分(ETS Essay Scoring)
二、 為什么自然語言處理比較難(Why NLP is hard)?
1、 歧義(Ambiguity)
“At last, a computer that understands you like your mother”
對于這句話的理解:
A、 它理解你就像你的母親理解你一樣(It understands you as well as your mother understands you);
B、 它理解你喜歡你的母親(It understands (that) you like your mother);
C、 它理解你就像理解你的母親一樣(It understands you as well as it understands your mother)
D、 我們來看看Google的翻譯:最后,一臺計算機能夠理解你喜歡你的母親(譯者附加上去的,看上去Google的理解更像B)。
A到C這三種理解好還是不好呢?(1 and 3: Does this mean well, or poorly?)
2、 不同層次的歧義(Ambiguity at Many Levels)
A、 聲音層次的歧義——語音識別(At the acoustic level -speech recognition):
——“ … a computer that understands you like your mother”
——“ … a computer that understands you lie cured mother”
B、 句法層次的歧義(At the syntactic level):
圖略
不同的結構導致不同的解釋(Different structures lead to different interpretations)
更多的句法歧義例子(More Syntactic Ambiguity)…….圖略
C、 語義(意義)層次的歧義(At the semantic (meaning) level):
Two definitions of “mother”:
——a woman who has given birth to a child
——a stringy slimy substance consisting of yeast cells and bacteria; is added to cider or wine to produce vinegar
這是一個詞義歧義的例子(This is an instance of word sense ambiguity)
更多的詞義歧義例子:
——They put money in the bank
= buried in mud?
——I saw her duck with a telescope
D、話語(多語)層次的歧義(At the discourse (multi-clause) level):
——Alice says they’ve built a computer that understands you like your mother
——But she …
… doesn’t know any details
… doesn’t understand me at all
This is an instance of anaphora, where she co-referees to some other discourse entity
未完待續:第二部分
附:課程及課件pdf下載MIT英文網頁地址:
http://people.csail.mit.edu/regina/6881/
注:本文遵照麻省理工學院開放式課程創作共享規范翻譯發布,轉載請注明出處“我愛自然語言處理”:www.52nlp.cn
from:http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-first-part/
總結
以上是生活随笔為你收集整理的MIT自然语言处理第一讲:简介和概述(第一部分)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 最有影响力的自然语言处理NLP论文
- 下一篇: MIT自然语言处理第一讲:简介和概述(第