语料库研究方法:基础与应用

语料库研究方法:基础与应用
466人加入学习
(16人评价)
价格 ¥399.00
学时 6.0
学时 6.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

 TTR = TYPE/TOKEN *100%

库容不同的文本如何对比形次比

文本越长,形次比越低

STTR标准形次比 可以用来比较库容不同的文本的形次比--Wordsmith 软件

 

[展开全文]

第二章 语料库方法一:检索词语

1. 引入:教学/学习中的疑问

2. 形符、类符、形次比

1)行符(token):词

2)类符(type):不重复出现的行符

Let's go let's go let'go now!

3)形次比(TTR, Type token ratio):类符/形符,与词汇密度(le*cal density)、词汇丰富度(le*cal richness)紧密相关,较高的形次比能从一定程度上反映学生的词汇量及丰富程度,适用于一篇文章内部

Beispiel: 行:10,类:4,TTR=4/10*100%=40%, 词汇重复率=60%,可以推断出学生的词汇量较为有限

4)标准形次比(STTR, 每千词/百词TTR的平均值):库容(形符数)不同的文本之间(因为文本越长,形次比可能越低,冠词the)

操作技术:WordSmith语料分析软件

3.频数、频率

4. 索引、节点词

[展开全文]

(基本概念

1. 形符 token(词的数量)

2. 类符 type(不重复出现的词)

3. 形次比 = 类符/形符*100% 

形次比与 词汇密度(le*cal density )及词汇丰富度(le*cal richness)相关

4. 标准形次比 STTR 每千词形次比的均值

+++++形次比越高,词汇越丰富

 

使用软件:wordSmith

wordlist-file-new-选择文件-ok-make a wordlist now-下方菜单statistics

[展开全文]

mean word length 平均词长

sentences 句子数,越少说明句子越长

mean in words  句子平均词数

 

看sttr比较两个文本的词汇密度和词汇丰富度

看1-letter words等 看 文本使用词汇难度

 

 

[展开全文]

第二章 语料库方法一:检索词语

目录

1. 形符、类符合、形次比

  1. 基本概念:
  • 形符:token (语言单位,相当于“词”) 
  • 类符:type (不能重复计算的形符)
  • e.g: Let's go    let's go now.(形符:10;类符: 4)
  • 形次比: TTR, type token ration 类符/形符*100%=40% ; 与词汇密度 lexical density 和词汇丰富度lexical richness紧密相关。较高的形次比可以一定程度上体现学生的词汇量和丰富程度。(库容(形符数)不同的文本如何对比形次比,文本越长,形次比可能越低,因为功能词多次重复 )
  • 标准形次比:STTR, standardized TTR) (每千词形次比的均值,1000词是个通用参考数值,对比几百字的学生作文,可以将1000换为100即可)
  • 软件:WordSmith 语料分析软件
  • 例子:大学生的英语作文,会真的比高中生作文词汇量更加丰富吗?如何验证呢?

2. 频数、频率

3. 索引、节点词

  1.  
[展开全文]

形次比(type token ratio)与词汇密度和丰富度相关。

标准形次比:STTR 

wordsmith 

[展开全文]