range: www.victoria.ac.nz/lals/about/staff/paul-nation
sketch engine
www.sketchengine.co.uk
CLPAT lang
range: www.victoria.ac.nz/lals/about/staff/paul-nation
sketch engine
www.sketchengine.co.uk
CLPAT lang
MLJ对研究的问题指出先要框架,然后问题,后方法
题目和研究问题一起看 ,核心概念和核心焦点
概念别人做过的,焦点是自己要做的
研究问题的来源,是呈上起下的作用
问题分3类来源
加深认识
系统认识
改善实践
改变情景
量化是统计方法,量化研究问题是精确化的数据问题,应用语言学的量化复杂
1找数值多少?-描述性统计
2找数值的关系 词汇量与阅读成绩关系等 相关分析和回归分析
3找差异 数值差异 他检验和方差分析
表述方法:
找多少,词汇量多少,文本覆盖率多少,比较
找关系 每一个区别性特征与口语关系
所有区别性特征与分数特征
relate to 一对一
contribute to 多对一
找差异 differ by 口语任务表现分数等级的差异
what 差异最明显的有那些?
老师搞科研不知道怎么搞,
学生找导师论文不通过,
发表论文审稿不通过
找问题可以通过高水平期刊
针对难的情况可以通过文献学*和在线工具
语言与数据研究:阿檀小倪讲量化
带着问题学方法
不是研究复杂性决定发文的成功度,而是问题核心要素。
链条式讲解能够降低形成问题的难度。
1介绍论文标题核心词,
2核心词如何链接论文理论框架,
3问题与数据手机和统计分析如何链接
两个群体T检验, 三个以上方差分析F检验
样本的平均数 Vs. 一个已知总体的平均数(A班和全校)
独立样本T检验:
两个独立的、没有明显联系的样本的平均数:A班和B班
配对样本t检验:两个紧密联系的平均数之间的差异(A班,期中和期末)
自变量和因变量之间有显著关系
自变量之间的相关不能太高
自变量越多,所需要的样本量越多
标准多项回归
数据要有代表性
工具有效性,反映核心概念
步骤的科学性
可重复
range Sketch egine clpat
COH-METRIX
LE*LE
数据是如何收集的?
证据性-数据即证据
代表性
工具的有效性
步骤的科学*ng
问题是如何形成的?
1.从文献中找问题
2. 从实践中找问题
①情景要聚焦
②概念要核心
③wen'ti'yao'he'li
什么是研究?用数据回答问题。
什么是量化研究?描述、相关、回归、对比、bi'jiao
1. 研究问题的作用
怎样抓住重点?研究问题和题目一起看?
找核心概念(别人做的)、研究焦点(你做的)。
2.研究问题来源:加深认识、改善实践、改变情景
3.量化研究问题的分类:
①找多少-描述
②找关系-相关分析、回归分析
③找差异-T检验、方差分析
4.如何表述问题:
找多少
-what is does more/less than is the same
找关系
relate to contribute to
找差异
differ by what
四大主流期刊
apllied lin MLJ language learning
studies in sla
如何进行描述性数据分析?
数据大通过
步骤跟着做
什么是描述统计:用一种简单的方式,来概括和呈现一堆数据的一些基本特征
数据:频率统计,集中量数,离散趋势
3个重要的引物:对象,工具,步骤
词汇覆盖率:特定等级词表占比
学生 先掌握高频词,然后低频词
问题形成,针对一种情况或现象描述,提出研究问题,找准最重要的一个方面或一个环节,抓住“牛鼻子”
数据收集:样本量很大,要具有
描述性问题 情景/概念/问题
情景:对具体处境进行描述,要聚焦,找到具体的点,
概念:分析该情景,解释该情景
变量:某种事物的某种属性,进行量化后得到的结果
变量一定是用数字来表示的
如:很重,很轻 不可以做变量
变量类型:
称名变量:类别,无法比较
顺序数据:排列,可以比较,不能加减乘除
等距数据:有单位,没有零点,只能加减,不能乘除
数据的收集:
收集的数据要为回答的问题提供证据链。选取对象要有代表性
选取的工具需要有效性
步骤科学性
Range 词汇分析软件
Sketch Engine 语料库收集工具
CLPAT
Coh-metrix
Lexile
研究:用数据回答问题
量化研究:研究问题决定了你的研究是否是量化研究
描述研究:大致情况如何
相关:它两有何关系
回归:它们有何关系
对比:它俩有何差异
比较:
如何进行比较性数据分析:
方差分析(F检验):比较多个群体之间的平均数差异
多次t检验会使得正确的概率越来越低,错误的概率越来越高,所以不可行
方差分析:一次性地比较因变量中方差的多少是由分组的不同所导致的
总体方差A:组内方差B,组间方差C
A=B+C(如果C在A中所占的比例越来越高,表明组别之间的差异越明显,如果C几乎没有,就表明三个组之间其实没有差异)
例子:大一到大四各100名,专业知识水平是否有差异?
计算400名学生总方差A,然后再计算每个年级的方差加起来的方差B,A-B得出C
通过计算C在A中的比例来计算F 值,F值大的话就表明四个年级的学生有显著的差异,相反,如果F 值小的话,就表明他们之间没有差别
两组的时候,方差分析和t检验的结果是一样的
方差分析显著之后,才能分别单独进行两两比较,确定哪两组之间有差异
方差分析有两种:
1)简单方差分析ANOVA, 最基本的方差分析,对不同组别的同一变量的平均数进行比较
2)重复测量的方差分析:同一组被试被重复测量,得到多个数值,这些数值之间的比较
具体操作:
第一列:标识分组
从第二列开始:不同变量
分析---比较均值---单因素方差分析---选择因变量和因子(分组数据)---选项---描述性,方差同质性检验---均值图---两两比较--lsd(主选),tukey,bnonferron(如果前面同质性分析的各组之间方差值是一样的)
如果方差值是不一样的,则选择games-howell
继续---确定
另外一种方法:分析---一般线性模型---单变量---因变量和固定因子---选项---描述统计---方差齐性检验--继续---两两比较--因子---lsd+game---确定
阅读解释表格
均值和标准差
显著性如果大于0.05,就要看lsd的结果,小于则是看games的结果
单因素方差分析: df和F值和显著性
F值足够大,显著性小于0.05,则表明各个组之间的差异很显著;相反则差异不显著
多重比较分析:事后分析,两两比较(方差分析显著的情况下看这个)
不同组别的均值比较图
如何呈现结果:
对应问题,重制表格(提供平均数和标准差,不需要提供样本量和标准误),文字说明(文字和数字)(F值,自由度,显著性水平)
F(自由度1(分组的数量-1),自由度2(剩下的不同组别的组内自由度))=xxx,p=xxx
如果F值显著,要报告具体的事后分析的结果,即哪几个组之间有显著的差异
介绍对应表格---列举关键数值,F值和P值
如何收集数据
对象:一百年间美国小学三年级和六年级的教材
工具:qanalysis 6.0 +内部工具,可以使用lexile来获得篇章可读性计算值,平均句长计算值,词汇频率计算值,文本词数计算值
汉语:汉语文本指南针,词句篇的量化数值可以获得
步骤:文本