十讲走进语言统计学

十讲走进语言统计学
475人加入学习
(1人评价)
价格 ¥499.00
学时 20.0
学时 20.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

总体:可以是人,可以是事物

样本:

大样本:>=30

小样本<=30

survey: 大样本

experiment: 最少可以 5个

 

[展开全文]

自变量-independent variables  被研究者操纵的变量

因变量dependent variables 研究者观察的变量

例如交际教学法与语法翻译法对学生英语口语成绩提升那个更有效?

自变量:教学法(两个水平)

因变量:学生的口语成绩。

类别变量:nominal variables比如性别,家庭背景

顺序变量oridnal variables: 比如年级,行政职务,职称

等距变量 interval variables 各种分数

cet 4, TEM8, 李克特量表

连续变量: continuous variables 可以取小数的变量

比如四六级分数

频次变量(frenquency variables):次数等;只能是0或正整数。

描述集中趋势:

平均数(mean)

中位数(median)

众数(mode)

离散趋势

全距(range)

平均差(average deviation)

方差(varance)和标准差(standard deviation) 

连续变量: 平均数和标准差

3. 推断统计的任务

1) 样本统计量(statistics): 平均数;标准差

2) 总体参数(parameters)

两个任务

1) 参数估计(parameter estimation)

2) 假设检验(hypothesis testing)

4. 推断统计的类型

1) 以寻找差异为目的的推断统计

T检验; 方差分析

2) 以寻找关系为目的的推断统计: 相关;回归;卡方检验。

 

[展开全文]

统计基本概念

一、总体、样本与抽样

1. 什么是总体,人或事物都可以

2. 样本,30个以上大样本,30个一下小样本,通常调查需要大样本,实验可以小样本

3. 抽样,要保证样本对于总体具有良好的代表性,
简单随机抽样法(抽签法适用于总体较小的情况如30人以内,随机数表法适用于总体稍大的情况如100人以内),
等距或系统抽样(尤其适用个体已经排序的情况),
分层抽样(先分层再采用上述两种方法抽样),关键在于分层,层内差异小,层间差异大

二、变量

1. 相互关系角度:自变量(操纵变量)、因变量,变量的水平
2.测量精度角度:类别变量、顺序变量、等距变量
3.数学特性角度:连续变量,频次变量

三、数据整理与描述

集中趋势:平均数、中位数、众数
离散趋势:全距、平均差、方差和标准差
连续变量一般要描述集中和离散趋势,频次变量一般描述频次

四、推断统计方法概述

1.任务是什么:参数估计,假设检验
2.分类:找差异用T和方差,找关系用相关、回归、卡方

五、作业

1. 建立SPSS数据文件并进行基本描述:平均数、标准差,制作各组次数直方图

六、重点:平均数、方差和标准差、抽样概念和方法
 

[展开全文]

1. 总体不一定一直指人,也可以是事物,比如高频词汇

2. 抽签法/随机数表法/等距(系统抽样)/分层抽样

3. 变量:类别变量/顺序变量/等距变量

4. 集中趋势统计量:平均数/中位数/众数

5. 离散趋势:全距/平均差/方差/边准差

6. 参数估计/假设检验

[展开全文]

一、总体、抽样

总体:具有某种共同特征的个体综合,不总是指人,事物也可以;

样本:从总体中按照一定的原则和程序抽取的作为观察的一部分个体

抽样:按照一定的原则和程序从总体中抽取个体的过程。

             简单随机抽样(每个个体被抽中的可能性是均等的):抽签法,随机数表法

              等距/系统抽样:

               分层抽样

变量:自变量是被研究者操纵的变量;因变量是研究者观察的变量

类被变量:
顺序变量:个体按照一定特征排序后再分出类别
等距变量:各种分数,专四专八分数等

连续变量:可以取小数的变量

频次变量:

 

描述集中趋势:平均数,中位数,众数

 

[展开全文]

总体:人和事物都能指代

样本: 一部分个体: 

30是样本的线:分为大和小

调查研究需大样本;实验研究小样本,最少5个

抽签法:50人以下

随机数表法:确定起点,随机上下走

自变量:被研究者操纵的变量;

因变量; 研究中观察的变量

测量精度角度

类别变量

顺序变量

等距变量:各种分数,

 

 

[展开全文]

总体 population

样本 sample

大样本(调查研究)、小样本(实验研究)

抽样 sampling

抽样原则:具有良好的代表性

简单随机抽样:抽签法(30以内)、随机数表法(100以内)

等距或系统抽样

分层抽样

如何分层:层内差异小,层间差异大

变量

自变量

因变量

类别变量

顺序变量

等距变量

连续变量(集中趋势-平均数&离散趋势-标准差)

频次变量

平均数

离散趋势

标准差

[展开全文]

参数估计:通过样本的平均数和标准差来估计整体的平均数和标准差。

假设检验:估计出来的总体参数有多大把握是正确的。

[展开全文]

总体 population

样本 sample

大样本 》30  

调查研究用大样本

实验研究用小样本

抽样 sampling

抽签

分层抽样可以依据权威网站

independent variables

dependent variables

nominal variables

ordinal variables

range

average deviation 平均差

variance方差

standard deviation 标准差  

 

 

[展开全文]

一、总体、样本与抽样

总体(popuiation)是我们所研究的具有某种共同特征的个体总和。

中国非英语专业大学生

北京市高职高专学生

中国大学生需掌握的积极词汇量

样本(sample)是从总体中抽取按照一定的原则和程序抽取的作为观察对象的一部分个体。

样本容量大于或等于30个个体的,在统计学上称为“大样本”

样本容量小于30个个体的,在统计学称为“小样本”

通常来说,调查研究需要使用大样本,实验研究可以使用小样本

抽样(sampling)是按照一定的原则和程序从总体中抽取个体的过程。

抽样最重要的原则:是要保证样本对于总体具有良好的代表性。

量化研究中三种常用的抽样方法:

简单随机抽样:指的是总体中每个个体被抽中的可能性是均等的一种抽样过程。

(抽签法:适用总体数较小。随机数表法:适用总体稍大。)

等距/系统抽样:是按照一定等距间隔在总体中抽取个体的过程。

分层抽样:按照总体已有特征,将其分成几个不同的部分(即层),然后再分别在层内进行简单随机抽样或等距/系统抽样的过程。

“层内差异小,层间差异大”

二、变量

从相互关系角度划分

自变量(independent variables):被研究者操纵的变量

因变量(dependent variables):研究者观察的变量

从测量精度角度划分

类别变量(norminal variables):把个体按照某一特征分成不同类别

性别、家庭背景、学校类别

顺序变量(ordinal variables):把个体按照一定特征排序后再分出类别

年级、行政职务、职称

等距变量(Interval variables):各种分数

从数学特性角度划分

连续变量(continuous variables):可以取最小的变量

四六级分数等,比例/比率

频次变量(frequency variables):只能取零或正整数的变量

个数、人数、次数

三、数据整理和描述

描述集中趋势:样本多数个体体现的集中特点

常用的集中趋势统计量:平均数(mean)、中位数(median)、众数(mode)

描述离散趋势

常见的离散趋势统计量有:

全距(range)、平均差(average deviation)、方差(variance)和标准差(standard deviation)

描述数据注意事项:

针对连续变量:既要描述集中 趋势(平均数),又要描述离散趋势(标准差)

针对频次变量:只需描述其中各类别的个数/次数/人数

四、推断统计方法概述

1.推断统计的任务

推断统计:按照一定的原理,利用样本统计量总体参数进行推论。

样本统计量

总体参数

2.推断统计的类型

宏观分为两类:

以寻找差异为目的的推断统计:T检验、方差分析

以寻找关系为目的的推断统计:相关、回归、卡方检验

 

 

[展开全文]

总体:具有某种共同特征的个体的总和

人和食物都可以作为总体

 

样本:从总体中抽出的一部分个体

样本》30 大样本

样本《 30 小样本

 

调查研究常用大样本

实验研究常用小样本 

 

抽样(sampling)

简单随机抽样 (抽签法-适合总体比较法

随机数表法- 适合于大数字, 任意选一个起点,按照一定的规律选择)

 

等距抽样/系统抽样

20 /100 每5个人抽取一个被试

在每5个数字中抽取一个样本

 

分层抽样

比如说按照大学类型或者以地理位置分布分层

原则:层内差异小,层间差异大

 

2. 变量

自变量 (independent variables)是我可以控制的变量 (教学法)

因变量(dependent variables)-我可以观察的变量 (成绩)

 

类别变量(nominal variables)不同的特征:性别家庭背景等

顺序变量 (ordinal variables) 在类别的变量的基础上将类别进行排序 比如说年级:一年级,二年级、 助教讲师副教授

等距变量 (interval variables) 就是各种分数,比如说专四专八考试分数,李克特量表等

 

 

连续型变量 (continuous varoables) -  可以有小数 0.5 的部分有意义 比如说雅思的平均成绩是6.5 

频次变量 (frequency variables)- 只有零和正整数, 比如说今天来了16个人,不能说16.5个

 

数据的整理和描述

1. 集中趋势

平均数 (mean)

中位数 (median)

众数 (mode)

 

离散趋势

全距 (range)

平均差 (average deviation)

方差 (variance )

标准差 (standard deviation)

方差和标准差其实是一回事 方差是经过平方的, 在实际使用的时候不好用

我们在工作中实际使用的是标准差

实际得分减去平均数, 然后平方, 然后求和,然后除以人数 

标准差越小, 学生和学生之间的差异越小

 

针对连续变量:在针对连续型变量的时候一定要同时汇报集中趋势(平均数)和离散趋势(标准差)

针对频次变量:只需要描述个数

比如说这次实验中有男生5个女生4个

 

推断统计方法概述 (inferential statistics)是按照一定的原理,用样本的数字来做推断

样本统计量 (statistics) 

总体参数 (parameters)

他两的平均数和标准差的字母标记方式不一样,但是基本上是一样的东西。比如说在样本统计量里平均数用的是(m), 标准差用的是(STD ), 而再总体参数里平均数用的是μ, 标准差用的是A

 

推断统计一般来说做两件事:

参数统计 (parameter estimation)-比如说有了样本的平均数和标准差, 我们可以推断总体参数的数值

假设检验  (hypothesis testing)- 上边估计出来的总体参数, 你估计它有多少可能是正确的

 

推断统计的类型:

1. 如果是为了找差别, 那就用T检验方差分析

2. 如果是为了找关系,就用

相关检验

回归检验

卡方检验

[展开全文]