TTR = TYPE/TOKEN *100%
库容不同的文本如何对比形次比
文本越长,形次比越低
STTR标准形次比 可以用来比较库容不同的文本的形次比--Wordsmith 软件
TTR = TYPE/TOKEN *100%
库容不同的文本如何对比形次比
文本越长,形次比越低
STTR标准形次比 可以用来比较库容不同的文本的形次比--Wordsmith 软件
第二章 语料库方法一:检索词语
1. 引入:教学/学习中的疑问
2. 形符、类符、形次比
1)行符(token):词
2)类符(type):不重复出现的行符
Let's go let's go let'go now!
3)形次比(TTR, Type token ratio):类符/形符,与词汇密度(le*cal density)、词汇丰富度(le*cal richness)紧密相关,较高的形次比能从一定程度上反映学生的词汇量及丰富程度,适用于一篇文章内部
Beispiel: 行:10,类:4,TTR=4/10*100%=40%, 词汇重复率=60%,可以推断出学生的词汇量较为有限
4)标准形次比(STTR, 每千词/百词TTR的平均值):库容(形符数)不同的文本之间(因为文本越长,形次比可能越低,冠词the)
操作技术:WordSmith语料分析软件
3.频数、频率
4. 索引、节点词
(基本概念
1. 形符 token(词的数量)
2. 类符 type(不重复出现的词)
3. 形次比 = 类符/形符*100%
形次比与 词汇密度(le*cal density )及词汇丰富度(le*cal richness)相关
4. 标准形次比 STTR 每千词形次比的均值
+++++形次比越高,词汇越丰富
使用软件:wordSmith
wordlist-file-new-选择文件-ok-make a wordlist now-下方菜单statistics
chapter 2
形符和类符
类fu,是不重复的
两个对比文本对比时注意形刺比
WordSmith 分析软件
mean word length 平均词长
sentences 句子数,越少说明句子越长
mean in words 句子平均词数
看sttr比较两个文本的词汇密度和词汇丰富度
看1-letter words等 看 文本使用词汇难度
第二章 语料库方法一:检索词语
目录
1. 形符、类符合、形次比
2. 频数、频率
3. 索引、节点词
形次比(type token ratio)与词汇密度和丰富度相关。
标准形次比:STTR
wordsmith