2.词性赋码集 (POS Tageset)
1)词性标注(part-of-speech tagging, POS tagging)
-语料库建设:采集、整理、分词、标注(语音、词性、句法、语义、元信息、质性等)
软件:Tree Tagger (多语种、多系统、免费)
2)词性赋码集:不同标注软件中对同一单词的词性标注是不同的,因为他们的词性赋码集不同
赋码及含义:
3)操作技术:
-软件:Pattern Builder (辅助编写正则表达式)
AntConc (检索正则表达式,支持多系统,多语种)
PowerConc(检索正则表达式,支持win,英汉语)