NLP自然语言理解-中科院(宗成庆) P1~P4
自然語(yǔ)言:人類語(yǔ)言,人類歷史發(fā)展過(guò)程中所產(chǎn)生的;
機(jī)器翻譯、網(wǎng)絡(luò)安全文本挖掘;
俠義:自然語(yǔ)言到機(jī)器內(nèi)部的一種映射;
被動(dòng)統(tǒng)計(jì)語(yǔ)言存在的規(guī)律,主動(dòng)讓計(jì)算機(jī)完成某樣功能,為人類提供服務(wù)。機(jī)器翻譯、信息檢索、自動(dòng)形成Summary;
應(yīng)用:機(jī)器翻譯、信息檢索、自動(dòng)文摘、問(wèn)答系統(tǒng)、信息過(guò)濾、信息抽取(屬于關(guān)聯(lián)、關(guān)系)、文檔分類(情感文本的分類)、文字編輯和自動(dòng)校對(duì)、語(yǔ)言教學(xué)和文字識(shí)別、語(yǔ)音識(shí)別(語(yǔ)音->文本)、語(yǔ)音合成(文本->語(yǔ)音)、說(shuō)話人識(shí)別;
完美的理論體系以及實(shí)用的技術(shù);
NLP發(fā)展中的基本問(wèn)題:
(1)形態(tài)學(xué)(詞、詞素)
分詞,詞的邊界;詞的構(gòu)成規(guī)律和詞的識(shí)別方法;西方語(yǔ)言詞尾變化如何還原到原型;
(2)語(yǔ)法學(xué)問(wèn)題;
句子為什么這樣寫(xiě),語(yǔ)法規(guī)律,建立快速有效的句子結(jié)構(gòu)的分析方法;
(3)語(yǔ)義問(wèn)題(根本問(wèn)題)
語(yǔ)義的理解;由詞的意義推演到句子的意義;
(4)語(yǔ)用學(xué)問(wèn)題;
一句話在不同的上下文中,不同語(yǔ)言環(huán)境,不同的含義;特定環(huán)境的含義;
(5)語(yǔ)音學(xué)問(wèn)題
發(fā)聲的規(guī)律,發(fā)聲的特點(diǎn),聲音和文字的對(duì)應(yīng)關(guān)系;
NLP發(fā)展中的主要困難:
(1)大量歧義現(xiàn)象。
(2)大量未知語(yǔ)言現(xiàn)象;
記錄語(yǔ)言習(xí)得的過(guò)程,分析語(yǔ)言學(xué)習(xí)的過(guò)程;
中間需要大量的知識(shí)庫(kù)、語(yǔ)料庫(kù)做支撐;
基于關(guān)鍵詞的搜索引擎;
信息論、數(shù)學(xué)中的工具、方法處理自然語(yǔ)言;
統(tǒng)計(jì)方法需要大量數(shù)據(jù)的支撐;
總結(jié)
以上是生活随笔為你收集整理的NLP自然语言理解-中科院(宗成庆) P1~P4的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 5月JC学习总结
- 下一篇: Nexus下载安装及对接