语料库研究方法:基础与应用

语料库研究方法:基础与应用
466人加入学习
(16人评价)
价格 ¥399.00
学时 6.0
学时 6.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

第三章 语料库方法二:检索复杂结构

1. 正则表达式(大范围/限定性检索):用一些符号来匹配文本中的字符,将单词含义传达给计算机的媒介

2.操作技术:

-软件:EditPad Pro 文本查看及编辑器

3.

1)表达范围的符号:

.=任意字符

\s=空格

\S=非空格

\w=构词字符(所有的字母、数字。。。。)

\W=非构词字符(标点、空格)

\d=数字

\D=非数字

2)对字母进行限定性检索的符号:

\b=给字母(组合)前后加边界

\u=大写(case键检查)

\l=小写

2.词性赋码集(词类、格、时态、体、语态的检索)

[展开全文]

复杂检索的两种类型

1. 正则表达式  大范围限定(某一大范围内的)检索

2. 词性赋码集

如何看正则表达式的效果:edit pro

optiona-configure file types-text documnt-editor-edit-courrier new-colors and ...-customize-高亮取消下划线

 

 

[展开全文]

复杂概念简洁清晰易懂;使用类别手法,在今后的教学中可以借鉴;

 

[展开全文]