语料库研究方法:基础与应用

语料库研究方法:基础与应用
486人加入学习
(16人评价)
价格 ¥399.00
学时 6.0
学时 6.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

3. 频数、频率

1)频数(frequencies): 一个词在语料库中出现的实际次数,

we:100/2000,100/10000,100是频数

2)频率(frequency): 频数的标准化=频数/库容*1000(根据库容灵活变化)

we:100/2000*1000=50,100/10000*1000=10

操作技术:

-技术:检索词语并查看统计

-软件 :BFSU PowerCo'n'c

-应用:一个单词;批量单词

[展开全文]

频数 

频率:标准化的频数= 频数/库容 *1000(可更改)

bfsu-files-选择打开-右侧设置区域stats,取消punctuation-左上角concordance-文本框输入词汇后检索-stats-显示总频数

之后勾选最上面的distribution-点击table

save 保存-复制到excel 去计算频率

 

 

多词检索前面步骤 一直到concordance

选择batch- load list -  后面步骤一致

 

[展开全文]

频数frequencies/occurrences

频率frequency

标准化频数normalization=频数/库容*1000

[展开全文]

任务9:基本概念

Question

情态动词在小说中更常用,还是新闻中更常用?

有语法称英式英语习惯用I earnt, burnt, 而美式英语更常用丨earned, burned, 是这样吗?

基本概念

•频数(frequencies / occurrences) 

即一个词在一个文本中出现的频率

 

频率(frequency)
即标准化的频数(normalization)=频数/库容*1000

100/2000*1000=50    100/10000*1000=10

 

•技术:检索词语并查看统计
•软件:BFSU PowerConc

 

应用举例

情态动词must在不同语体(例如小说、新闻和学术语体)中,使用频率有否差异?

 

不勾count punctuations 即不算标点符号

对多个词jin'xing

 

[展开全文]