语言、数据与研究:阿檀小倪讲量化

语言、数据与研究:阿檀小倪讲量化
305人加入学习
(22人评价)
价格 ¥399.00
学时 11.0
学时 11.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

range: www.victoria.ac.nz/lals/about/staff/paul-nation

 

sketch engine

www.sketchengine.co.uk

 

CLPAT lang

[展开全文]

MLJ对研究的问题指出先要框架,然后问题,后方法

题目和研究问题一起看 ,核心概念和核心焦点

概念别人做过的,焦点是自己要做的

研究问题的来源,是呈上起下的作用

问题分3类来源

加深认识

系统认识

改善实践

改变情景

量化是统计方法,量化研究问题是精确化的数据问题,应用语言学的量化复杂

1找数值多少?-描述性统计

2找数值的关系 词汇量与阅读成绩关系等 相关分析和回归分析

3找差异  数值差异 他检验和方差分析

表述方法:

找多少,词汇量多少,文本覆盖率多少,比较

找关系 每一个区别性特征与口语关系

所有区别性特征与分数特征

relate to  一对一

contribute to  多对一

找差异  differ by 口语任务表现分数等级的差异

what  差异最明显的有那些?

 

 

[展开全文]

老师搞科研不知道怎么搞,

学生找导师论文不通过,

发表论文审稿不通过

找问题可以通过高水平期刊

针对难的情况可以通过文献学*和在线工具

 

 

[展开全文]

语言与数据研究:阿檀小倪讲量化

带着问题学方法

不是研究复杂性决定发文的成功度,而是问题核心要素。

链条式讲解能够降低形成问题的难度。

1介绍论文标题核心词,

2核心词如何链接论文理论框架,

3问题与数据手机和统计分析如何链接

 

 

[展开全文]

样本的平均数 Vs. 一个已知总体的平均数(A班和全校)

独立样本T检验:

两个独立的、没有明显联系的样本的平均数:A班和B班

配对样本t检验:两个紧密联系的平均数之间的差异(A班,期中和期末)

[展开全文]

自变量和因变量之间有显著关系

自变量之间的相关不能太高

自变量越多,所需要的样本量越多

标准多项回归

 

[展开全文]

数据要有代表性

工具有效性,反映核心概念

步骤的科学性

可重复

range Sketch  egine clpat 

COH-METRIX

LE*LE

 

 

[展开全文]

数据是如何收集的?

证据性-数据即证据

代表性

工具的有效性

步骤的科学*ng

[展开全文]

问题是如何形成的?

1.从文献中找问题

2. 从实践中找问题

①情景要聚焦 

②概念要核心

③wen'ti'yao'he'li

[展开全文]

什么是研究?用数据回答问题。

什么是量化研究?描述、相关、回归、对比、bi'jiao

 

[展开全文]

1. 研究问题的作用

怎样抓住重点?研究问题和题目一起看?

找核心概念(别人做的)、研究焦点(你做的)。

2.研究问题来源:加深认识、改善实践、改变情景

3.量化研究问题的分类:

①找多少-描述

②找关系-相关分析、回归分析

③找差异-T检验、方差分析

4.如何表述问题:

找多少

-what is  does more/less than   is the same

找关系

relate to   contribute to

找差异

differ by   what

四大主流期刊

apllied lin MLJ language learning

studies in sla 

[展开全文]

如何进行描述性数据分析?

数据大通过

步骤跟着做

 

 

什么是描述统计:用一种简单的方式,来概括和呈现一堆数据的一些基本特征

数据:频率统计,集中量数,离散趋势

 

[展开全文]

3个重要的引物:对象,工具,步骤

 

词汇覆盖率:特定等级词表占比

学生 先掌握高频词,然后低频词

 

 

问题形成,针对一种情况或现象描述,提出研究问题,找准最重要的一个方面或一个环节,抓住“牛鼻子”

 

数据收集:样本量很大,要具有

[展开全文]

描述性问题   情景/概念/问题

 

情景:对具体处境进行描述,要聚焦,找到具体的点,

 

概念:分析该情景,解释该情景

 

 

 

 

 

[展开全文]

变量:某种事物的某种属性,进行量化后得到的结果

变量一定是用数字来表示的

如:很重,很轻  不可以做变量

 

变量类型:

称名变量:类别,无法比较

顺序数据:排列,可以比较,不能加减乘除

等距数据:有单位,没有零点,只能加减,不能乘除

 

[展开全文]

数据的收集:

收集的数据要为回答的问题提供证据链。选取对象要有代表性

选取的工具需要有效性

步骤科学性

 

Range 词汇分析软件

Sketch Engine 语料库收集工具

CLPAT

Coh-metrix

Lexile 

[展开全文]

研究:用数据回答问题

 

量化研究:研究问题决定了你的研究是否是量化研究

描述研究:大致情况如何

相关:它两有何关系

回归:它们有何关系

对比:它俩有何差异

比较:

[展开全文]

如何进行比较性数据分析:

方差分析(F检验):比较多个群体之间的平均数差异

多次t检验会使得正确的概率越来越低,错误的概率越来越高,所以不可行

方差分析:一次性地比较因变量中方差的多少是由分组的不同所导致的

总体方差A:组内方差B,组间方差C

A=B+C(如果C在A中所占的比例越来越高,表明组别之间的差异越明显,如果C几乎没有,就表明三个组之间其实没有差异)

例子:大一到大四各100名,专业知识水平是否有差异?

计算400名学生总方差A,然后再计算每个年级的方差加起来的方差B,A-B得出C

通过计算C在A中的比例来计算F 值,F值大的话就表明四个年级的学生有显著的差异,相反,如果F 值小的话,就表明他们之间没有差别

两组的时候,方差分析和t检验的结果是一样的

方差分析显著之后,才能分别单独进行两两比较,确定哪两组之间有差异

方差分析有两种:

1)简单方差分析ANOVA, 最基本的方差分析,对不同组别的同一变量的平均数进行比较

2)重复测量的方差分析:同一组被试被重复测量,得到多个数值,这些数值之间的比较

具体操作:

第一列:标识分组

从第二列开始:不同变量

分析---比较均值---单因素方差分析---选择因变量和因子(分组数据)---选项---描述性,方差同质性检验---均值图---两两比较--lsd(主选),tukey,bnonferron(如果前面同质性分析的各组之间方差值是一样的)

如果方差值是不一样的,则选择games-howell

继续---确定

另外一种方法:分析---一般线性模型---单变量---因变量和固定因子---选项---描述统计---方差齐性检验--继续---两两比较--因子---lsd+game---确定

阅读解释表格

均值和标准差

显著性如果大于0.05,就要看lsd的结果,小于则是看games的结果

单因素方差分析: df和F值和显著性

F值足够大,显著性小于0.05,则表明各个组之间的差异很显著;相反则差异不显著

多重比较分析:事后分析,两两比较(方差分析显著的情况下看这个)

不同组别的均值比较图

如何呈现结果:

对应问题,重制表格(提供平均数和标准差,不需要提供样本量和标准误),文字说明(文字和数字)(F值,自由度,显著性水平)

F(自由度1(分组的数量-1),自由度2(剩下的不同组别的组内自由度))=xxx,p=xxx

如果F值显著,要报告具体的事后分析的结果,即哪几个组之间有显著的差异

介绍对应表格---列举关键数值,F值和P值

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[展开全文]

如何收集数据

对象:一百年间美国小学三年级和六年级的教材

工具:qanalysis 6.0  +内部工具,可以使用lexile来获得篇章可读性计算值,平均句长计算值,词汇频率计算值,文本词数计算值

汉语:汉语文本指南针,词句篇的量化数值可以获得

步骤:文本

[展开全文]