《统计自然语言处理》(宗成庆)学习笔记(一)
緒論
一、提出問題
- 如何讓計算機自動或人機互助的完成語言處理功能?
- 如何讓計算機對海量信息進行自動處理、知識挖掘,進行有效利用?
二、基本概念
1、語言學與語音學
語言的兩個基本屬性:語音、文字
2、語言學:研究語言的學科,包含語言的本質(zhì)、結(jié)構(gòu)、發(fā)展規(guī)律
3、語音學:研究發(fā)音特點
4、計算機語言學:計算技術和概念、語言學和語音學問題
5、自然語言處理 or 自然語言理解
關于“理解”的標準:計算機智能——表現(xiàn)、反映、人機交互——圖靈
測試
三、自然語言處理研究的內(nèi)容和面對的困難
(一)研究內(nèi)容
等等…
(二)自然語言涉及的幾個層次
1、形態(tài)學
2、語法學:語法規(guī)律、句子結(jié)構(gòu)
3、語義學(根本問題):詞的含義——句的含義——段落篇章的含義
4、語用學:特定環(huán)境的文字用法
(三)面臨的困難
1、歧義:語義歧義、結(jié)構(gòu)歧義
eg:Put the block[ in the box on the table].
Put [the block in the box] on the table.
2、未知的語言
四、自然語言處理的基本方法及其發(fā)展
(一)基本方法
| 知識來源 | 與生俱來 | 大量的語言數(shù)據(jù) |
| 研究對象 | 語言知識結(jié)構(gòu)、符號、規(guī)則 | 語言數(shù)據(jù) |
| 理論 | Chomsky的語言原則 | Shannon的信息論 |
| 應用 | 形式語言 | 統(tǒng)計模型 |
(二)發(fā)展和現(xiàn)狀
1、萌芽期(1946年)——發(fā)展期(1966年)——繁榮期(20世紀80年代末)
2、目前已經(jīng)取得了一定的研究成果,但是根本問題還未解決。
3、新的研究方向不斷涌現(xiàn),具有極大發(fā)展前景。
總結(jié)
以上是生活随笔為你收集整理的《统计自然语言处理》(宗成庆)学习笔记(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: graphpad7.04多组比较p值_同
- 下一篇: 易管理摘