十讲走进语言统计学

十讲走进语言统计学
273人加入学习
(0人评价)
价格 ¥499.00

相关分析,回归分析,K方检验是寻找关联的

T检验,

[展开全文]

观测频数比理论频数大的时候,就能说明问题,得到结论:像外交学的学生更倾向选择法语,动漫的学生更倾向于日语。语种的选择和专业之间并不是相互独立的,而是有着某种关联的。通过检验

[展开全文]

R表示行数。行数-1 C就是列数,3个活动是3列,column

 

[展开全文]

根号下用136.8乘以236.8,求算数平方根

[展开全文]

共变关系

A增大的时候B也在增大,或者A增大的时候X再减小

[展开全文]

1:回忆公式。

样本1的平均数减去样本2的平均数。

除以算数平方根,样本容量1-1乘以样本1的方差(也就是标准差的平方),再加上样本2的容量-1再乘以样本2的方差,比一个样本1加样本2再-2

,再乘以N1分之一,样本1的容量倒数和样本2的容量倒数。

查表P187 df=60/120

2.853大于2.000,最后P小于0.05,拒绝0假设。虽然82和84分,但两个班之间的差异是显著的。82这个

 

[展开全文]

参数估计:通过样本的平均数和标准差来估计整体的平均数和标准差。

假设检验:估计出来的总体参数有多大把握是正确的。

[展开全文]

量化研究一开始有清晰的假设,质性研究逐渐行程假设。

描述统计只针对样本进行。必须要有推断统计来推断总体的形势。

 

[展开全文]

标准差:差异性程度,最高分和最低分之间的差异

平均数:哪个分数最典型

[展开全文]

总体 population

样本 sample

大样本 》30  

调查研究用大样本

实验研究用小样本

抽样 sampling

抽签

分层抽样可以依据权威网站

independent variables

dependent variables

nominal variables

ordinal variables

range

average deviation 平均差

variance方差

standard deviation 标准差  

 

 

[展开全文]

课程导学

研究问题,对象,工具,分析方法

量化研究VS质性研究

descriptive statistics

inferential statistics

[展开全文]

第七讲 方差分析(2)

一、单因素组间方差分析(One-way ANOVA)

也称完全随机方差分析(complete randomized ANOVA),指的是把被试随机分为若干组(大于等于3组),每组只接受一种实验处理、因此,这些组之间是相互独立的。

(1)各组样本量相同(常见)

(2)各组样本量不同

二、方差分析事后检验

必要性:当F统计量达到显著水平(P<0.05)水平时,说明至少有一对组平均数的差异是显著的。需要进一步检验将它们找出来、这个过程被称为事后检验(post hoc comparison),也称平均数的逐对比较,或多重比较。

其手段众多,常用的如下:

(1)T检验(LSD)(常用)

(2)q检验(HSD)

三、小结

方差分析种类

依据自变量个数,可分为

单因素和多因素(双因素)

依据自变量水平间关系,可分为

组间、组内、混合

平方和可分解是其基本原理

总平方和、组间平方和、组内平方和

其他类型方差分析在此基础上变形,如:

随机区间方差分析

多因素方差分析

方差分析常需要做事后检验

在F统计量达到显著水平时,要做事后检验

事后检验方法不同,结果会稍有不同

多因素分析结果中如果交互作用达到显著水平,要做简单效应检验(详见第7章第7节)

 

[展开全文]

第六讲 方差分析

一、对T检验的反思

只能两组进行检验

风险:加大了一类错误的概率

新的解决方案:将系统误差(条件误差)和抽样误差(随机误差)分离

总差异=条件误差+随机误差

条件误差比随机误差大,差异存在。

总差异=组间差异+组内差异

组间差异=条件误差

组内差异=随机误差

组间差异比组内差异大,就好了。

二、方差分析原理

三、方差分析统计前提

总体服从正态分布

样本足够大时,可假定数据服从正态分布

样本较小时,可通过卡方拟合度检验来检验数据的正态性

如果数据非正态分布,可采用相应的非参数检验方法。

变异来源相互独立

组间变异、组内变异需要来自不同部分,要明确,彼此相互独立

各组方差一致

方差一致性也称方差齐性(homogeneity of variance),是方差分析的前提条件。

检验方法:

 

[展开全文]

 

小结:使用相关系数进行配对样本T检验时,公式分母中的n-1也可以由n代替。

配对样本T检验还可以通过每个对子的差值(d)进行计算(见教材84-85页)。

[展开全文]

第四讲  假设检验

一、研究问题与假设

研究问题:明确指出核心概念和研究焦点的疑问句。

假设:对研究问题的预判性回答,分为研究假设(research hypothesis)和零假设(null hypothesis)。

零假设:相同,无差别

研究假设:不同,有差异

二、误差

抽样误差(随机误差):用样本信息推断总体信息时产生的误差,它是不可避免的。

系统误差(systematic error),也称规律误差,是由自变量引起的因变量变化。

三、假设检验(hypothesis test)(显著性检验)(test of significance)

统计学上规定了一个抽样误差限度(用希腊字母表示),即 =0.05,被称作显著水平(level of significance)

如果差距没有超过这个限度,则认定是抽样误差引起的。

如果差距超过这个限度,则认定是系统误差引起的。

假设检验对象:零假设

通常来说,在0.05显著水平上如果抽样误差在差异中占比更大,则接受零假设;如果系统误差在差异中占比更大,则拒绝零假设。

假设检验注意事项

(1)两类错误:一类错误:零假设是真实的,却被拒绝了。

二类错误:零假设是虚假的,却被接受了。

(2)单尾和双尾:单尾检验:零假设陈述中有方向性(A高于B)(B高于A)

双尾检验:零假设陈述中无方向性(A和B无显著差异)

[展开全文]

一、参数估计的定义

参数估计:根据样本统计量合理、科学地推断总体参数的过程。

二、参数估计的类型

点估计:用样本计算出来的一个数来估计总体未知参数。

不足:点估计得到的估计值可能高于或低于总体参数真值。

总体参数的点估计还无法计算估计值与参数真值的接近程度和可靠程度。

区间估计:给出总体参数所在的范围,以及总体参数落在这个范围的可能性(频率)。

置信区间(confidence interval)、置信水平(confidence level)

[展开全文]