【中文树库标记---CTB】
北大標注集
| 詞性編碼 | 詞性名稱 | 注解 |
| Ag | 形語素 形容詞語素。形容詞代碼為a,語素代碼為g前面置以A | |
| a | 形容詞 | 取英語形容詞adjective的第1個字母 |
| ad | 副形詞 | 直接作狀語的形容詞。形容詞代碼a和副詞代碼d并在一起 |
| an | 名形詞 | 具有名詞功能的形容詞。形容詞代碼a和名詞代碼n一起 |
| b | 區別詞 | 取漢字“別”的聲母 |
| c | 連詞 | 去英語連詞conjunction的第1個字母 |
| Dg | 副語素 | 副詞性語素。副詞代碼為d,語素代碼g前面置以D |
| d | 副詞 | 取adverb的第2個字母,因其第1個字母已用于形容詞 |
| e | 嘆詞 | 取英語嘆詞exclamation的第1個字母。 |
| f | 方位詞 | 取漢字“方” |
| g | 語素 | 絕大多數語素都能作為合成詞的“詞根”,取漢字“根”的聲母 |
| h | 前接成分 | 取英語head的第1個字母 |
| i | 成語 | 取英語成語idiom的第1個字母 |
| j | 簡稱略語 | 取漢字“簡”的聲母 |
| k | 后接成分 | |
| l | 習用語 | 習用語尚未成為成語,有點“臨時性”,取“臨”的聲母 |
| m | 數詞 | 取英語numeral的第3個字母,n,u已有他用 |
| Ng | 名語素 | 名詞性語素。名詞代碼為n,語素代碼g前面置以N |
| n | 名詞 | 取英語名詞noun的第1個字母 |
| nr | 人名 | 名詞代碼n和“人(ren)”的聲母并在一起 |
| ns | 地名 | 名詞代碼n和處所詞代碼s并在一起 |
| nt | 機構團體 | “團”的聲母為t,名詞代碼n和t并在一起 |
| nz | 其他專名 | “專”的聲母的第1個字母為z,名詞代碼n和z并在一起 |
| o | 擬聲詞 | 取英語擬聲詞onomatopoeia的第1個字母。 |
| p | 介詞 | 取英語介詞prepositional的第1個字母 |
| q | 量詞 | 取英語quantity的第1個字母 |
| r | 代詞 | 取英語代詞pronoun的第2個字母,因p以用于介詞 |
| s | 處所詞 | 取英語space的第1個字母 |
| Tg | 時語素 | 時間詞性語素。時間詞代碼為t,在語素的代碼g前面置以T |
| t | 時間詞 | 取英語time的第1個字母 |
| u | 助詞 | 取英語助詞auxiliary |
| Vg | 動語素 | 動詞性語素。動詞代碼為v。在語素代碼g前面置以V |
| v | 動詞 | 取英語動詞verb的第1個字母。 |
| vd | 副動詞 | 直接作狀語的動詞。動詞和副詞的代碼并在一起。 |
| vn | 名動詞 | 指具有名詞功能的動詞。動詞和名詞的代碼放在一起。 |
| w | 標點符號 | |
| x | 非語素字 | 非語素字只是一個符號,字母x通常用于代表未知數、符號 |
| y | 語氣詞 | 取漢字“語”的聲母 |
| z | 狀態詞 | 取漢字“狀”的聲母的前一個字母。 |
| un | 未知詞 | 不可識別詞及用戶自定義詞組。取英文Unknown首兩個字母。 |
| (非北大標準,CSW分詞中定義) |
賓州中文樹庫標記及其解釋
Part-Of-Speech tags:33tags
| AD | adverbs | 副詞 |
| AS | Aspect marker | 體態詞,體標記(例如:了,在,著,過) |
| BA | 把 in ba-const | “把”,“將”的詞性標記 |
| CC | Coordinating conjunction | 并列連詞,“和” |
| CD | Cardinal numbers | 數字,“一百” |
| CS | Subordinating conj | 從屬連詞(例子:若,如果,如…) |
| DEC | 的 for relative-clause etc | “的”詞性標記 |
| DEG | Associative | 聯結詞“的” |
| DER | in V-de construction, and V-de-R | “得” |
| DEV | before VP | 地 |
| DT | Determiner | 限定詞,“這” |
| ETC | Tag for words, in coordination phrase | 等,等等 |
| FW | Foreign words | 例子:ISO |
| IJ | interjetion | 感嘆詞 |
| JJ | Noun-modifier other than nouns | |
| LB | in long bei-construction | 例子:被,給 |
| LC | Localizer | 定位詞,例子:“里” |
| M | Measure word(including classifiers) | 量詞,例子:“個” |
| MSP | Some particles | 例子:“所” |
| NN | Common nouns | 普通名詞 |
| NR | Proper nouns | 專有名詞 |
| NT | Temporal nouns | 時序詞,表示時間的名詞 |
| OD | Ordinal numbers | 序數詞,“第一” |
| ON | Onomatopoeia | 擬聲詞,“哈哈” |
| P | Preposition | (excluding 把 and 被) |
| PN | pronouns | 代詞 |
| PU | Punctuations | 標點 |
| SB | in long bei-construction | 例子:“被,給” |
| SP | Sentence-final particle | 句尾小品詞,“嗎” |
| VA | Predicative adjective | 表語形容詞,“紅” |
| VC | Copula | 系動詞,“是” |
| VE | 有 as the main verb | “有” |
| VV | Other verbs | 其他動詞 |
Syntactic tags:23 tags 句法標記
Tags for phrase: 17 tags 短語句法標記
Tags for verb compounds: 6 tags 動詞復合6個標記
Functional tags: 26 tags 功能標記26個
Empty categories (null elements): 7 tags 空范疇標記
了解路徑 – neuTblue
補充:
- 【Common Noun——NN】:列舉多種情況下一個漢字串是否定為1個word
-
CD+N
“CD”和“N”的含義在 APPENDIX B 中查閱,“CD”為量詞,“N”為名詞
判斷準則:如果在CD+N的結構中,可以插入一個單位在CD和N之間,并且意思不變,則判定為2個詞:CD+N,例如:
如果在CD和N之間插入一個單位后意思改變了,則將CD+N判定為一個NN
-
【Proper Noun——NR,專有名詞】
-
【Temporal Noun——NT,時間名詞】
-
【Localizer——LC,定位詞】如“內”,“左右”
-
【Pronoun——PN,代詞】
-
【Determiner——DT,限定詞】如“這”,“全體”
-
【Cardinal Number——CD,量詞】
-
【Ordinal Number——OD,次序詞】如“第三十一”
-
【Measure word——M,單位詞】如“杯”
-
【Verb:VA,VC,VE,VV,動詞】
-
【Adverb:AD,副詞】如“近”,“極大”
-
【Preposition:P,介詞】如“隨著”
-
【Subordinating conjunctions:CS,從屬連詞】
-
【Conjuctions:CC,連詞】如“和”
-
【Particle:DEC,DEG,DEV,DER,AS,SP,ETC,MSP,小品詞】如“的話”
-
【Interjections:IJ,感嘆詞】如“哈”
-
【onomatopoeia:ON,擬聲詞】如“嘩啦啦”
-
【Other Noun-modifier:JJ】如“發稿/JJ 時間/NN”
-
【Punctuation:PU,標點符號】
-
【Foreign word:FW,外國詞語】如“OK”
-
【Others】包括idioms(習語),telescopic string(沒明白什么意思),short form(縮寫)
總結
以上是生活随笔為你收集整理的【中文树库标记---CTB】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UE4 制作一款动画播放器
- 下一篇: 提供数据接口公司总结