语料库研究方法:基础与应用

语料库研究方法:基础与应用
486人加入学习
(16人评价)
价格 ¥399.00
学时 6.0
学时 6.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

 3)元字符:8个标点

.=任意字符

-逻辑符号:

\=转义符(\+字母后拥有了特定含义;\+具有特定意义的符号后就没有任何意义了)

( )=作为一个整体(经常与分隔符连用)

[ ]=取值范围

| =分隔符(或者)

-计量符号:

?=放在字母后,表示可有可无

*=放在字母后,表示该字母可以重复0次以上

+=放在字母后,表示该字母可以重复1次以上

Beispiel:to?=t,to

to*=t,to,too

to+=to,too

 

[展开全文]

元字符(metacharacter):有自己特殊的表达意义,不匹配真是的字符。

.

l

逻辑符号:

\ 转义符: \s \S \+

( )作为一个整体: \b(are|am|is)\b

[ ]取值范围:[abc], [a-z], [1-9]

计量符号:

?有或者无(0或者1):top?(p可有可无)

*重复0次或更多

+重复1次或更多

[展开全文]

 \转义符,()作为整体,【】取值范围,l或者

.  any character,\s空格,\S非空格,\w, letter, digit, underscore(word character), \W punctuation,space; \d, digit; \D, non-digit; \b, boundary; \u, uppercase; \l, lowercase

? 有或者无(0或者1);* 重复0次或更多;+重复1次或;更多

练*

请找出文本中所有be动词+动词ed的被动结构

\b(arelwerelarelislwas)\b (\S+ ) *\w+ed\b

\b(learnlburnldreamlspell*lsmell*)(edlt)\b

[展开全文]

正则表达式逻辑符号

翻为及限定符号     意义

.                         any character

\s                       space

\S                       non-space

\w                      letter, digit, underscore

\W                     punctuation, space

\d                      digit

\D                      non-digit

\b                      boundary

\u                       uppercase

\l                        lowercase

逻辑符号          意义

\                     转义符

( )                    作为一个整体

[ ]                     取值范围

|                        或者

 

计量符号             意义

?                  有或者无(0或者1)

*                    重复0词或更多

+                   重复1次或更多

举例

1 请找出文本中所有be动词+动词-ed的被动结构

1)\b(am|is|are|was|were)\b \w+ed\b (中间不能插入副词)

2)我写的:\b(am|is|are|was|were)\b \w+ \w+ed\b

答案:\b(am|is|are|was|were)\b (\w+ )\w+ed\b(中间可以插入一个副词,但副词后面不能有逗号等标点符号) 

3)\b(am|is|are|was|were)\b (\w+ )*\w+ed\b (中间可以没有或者有多个副词)

4)\b(am|is|are|was|were)\b (\S+ )*\w+ed\b (be动词和过去分词之间有多个副词,副词有逗号隔开)

2  请找出文本中所有被动词+动词-ed和动词-t的被动结构

\b(am|is|are|was|were)\b (\w+ed|t)

[展开全文]