十讲走进语言统计学

十讲走进语言统计学
475人加入学习
(1人评价)
价格 ¥499.00
学时 20.0
学时 20.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

1.平均数

2. 标准差(std.)

标准差的大小

标准差的大小是相对的,只有比较时才有意义(只有标准差相差不大时才有可比性,这时就需要做方差分析了)

3. 参数估计

4. 假设检验

5. 误差

抽样误差(无法避免)、系统误差(可操纵)

6. 加权(权重)平均分

预测性问题(回归)

差异性问题

自变量:控制

因变量:观测

随机抽样:保证被试被抽中的几率是一样的

规律性、趋势性、大范围(n>=30)的问题,用统计。

研究设计与统计的关系:问卷、实验、语料库

问卷:收集有关态度的问题

实验:收集与认知、心理活动有关的问题

语料库:

观测、语言现象

统计方法选择问题

T-test、ANOVA、Correlation、Regression、卡方

SPSS 13.0以上均可适用

 

[展开全文]

T 检验只适用于两组之间的差异检验

方差可以用于三组及以上之间的差异检验

[展开全文]

1. 总体不一定一直指人,也可以是事物,比如高频词汇

2. 抽签法/随机数表法/等距(系统抽样)/分层抽样

3. 变量:类别变量/顺序变量/等距变量

4. 集中趋势统计量:平均数/中位数/众数

5. 离散趋势:全距/平均差/方差/边准差

6. 参数估计/假设检验

[展开全文]

一、总体、抽样

总体:具有某种共同特征的个体综合,不总是指人,事物也可以;

样本:从总体中按照一定的原则和程序抽取的作为观察的一部分个体

抽样:按照一定的原则和程序从总体中抽取个体的过程。

             简单随机抽样(每个个体被抽中的可能性是均等的):抽签法,随机数表法

              等距/系统抽样:

               分层抽样

变量:自变量是被研究者操纵的变量;因变量是研究者观察的变量

类被变量:
顺序变量:个体按照一定特征排序后再分出类别
等距变量:各种分数,专四专八分数等

连续变量:可以取小数的变量

频次变量:

 

描述集中趋势:平均数,中位数,众数

 

[展开全文]

统计分类:
描述统计

推断统计

[展开全文]

量化研究与质性研究

数字or文字描述,哲学基础:实证主义——自然主义,实验环境——自然环境,演绎性——归纳性

 

量化研究:实验、准实验、调查、语料库、元分析

质性研究:观察、访谈、日志、叙事、民族志

 

量化研究:统计分析、数字呈现

质性研究:内容分析、文字呈现

 

统计:

中世纪拉丁语 , ”国家“

19世纪:用数字的方法说明国家的特征

后被用到自然科学、社会科学、语言教学等领域

 

统计的分类:

1   描述统计

2  推断统计

 

 

[展开全文]

提问→设计→统计

统计适用于解决规律性、趋势性、大样本的问题。

参数估计,假设检验。

 

1.找差异:T检验,方差分析

 标准差(相对概念)

 误差:抽样误差、系统误差

 

2.关联性问题:相关(共变),回归(预测)

 回归:因变量(观测)、自变量(控制)

 

3.卡方检验

适用文科的统计软件:SPSS 13.0及以上版本

 

随机抽样、便利抽样

教育部  规划司  “教育统计数据

 

设计:收集数据的手段

1.问卷:态度类

2.实验:认知、心理

3.语料库:观测、语言现象

 

《外语教学科研中的统计方法》

 

[展开全文]

标准差:最高分和最低分与平均分之间的差值。

参数估计:用一部分数据推测全体

抽样误差:正好遇上了拖后腿的

 

预测

回归:三次模拟考试回归到因变量
自变量:人为控制的变化

因变量:观察得到的数据

抽样:在实际中常采用便利抽样

教育部——规划司——教育统计数据

 

统计的作用:1找差异,2预测

样本大于等于30就可以用统计

 

统计设计

问卷:适合收集态度类信息

实验:与认知、心理活动有关的研究,用实验

语料库:观测语言现象音、形、义

 

找差异

2组之间差异:T检验(独立样本T检验、

3组及以上之间差异:方差分析(ANOUA)

 

找关联

共变关系:

预测关系:回归(1个因变量;2+因变量)

[展开全文]

两个变量的属性

皮尔逊相关:等距变量

肯德尔相关:顺序变量

斯皮儿曼: 等距和顺序变量 【看两位老师打分是否一致】

克莱默相关:称名变量

 

观察散点图

计算相关系数

计算自由度

查得临界值

比大小,做决断

如果大于临界值,拒绝零假设 

 

公式

一个变量的标准分*另一个变量的标准分 的和

除以对个数

自由度 n-2

相关系数绝对值

大于0.70 高相关

0.40-0.70之间 中度相关

小于0.40 低度相关

[展开全文]

组间平方和

(组平方-总平方)再平方再乘以个数

 

查表时

分子:组间自由度

分母:组内自由度

 

统计值小于临界值说明 P>0.05

[展开全文]
yuxiajun · 2020-04-27 · 作业反馈 0

当计算出来的T值大于临界值 P就小于0.05  就是有显著性差异

[展开全文]
yuxiajun · 2020-04-27 · 作业反馈 0

单样本T检验

Z检验:正态分布,方差已知

T检验:正态分布,方差未知

 

独立样本检验小结

不知道方差,用T检验更多

总体方差相等/(方差齐性)的独立样本T检验应用更广

 

[展开全文]

参数估计定义

类型

点估计:用样本的一个点值推测总体

区间估计:概率

标准误:样本标准差/样本量的平方根

临界值   1.96  95%

总体参数区间估计:

-1.96(样本平均数-总体平均数)/标准误 +1.96

表示总体的方差 1.96  95%

                                  2.58   99%

 

[展开全文]

总体:人和事物都能指代

样本: 一部分个体: 

30是样本的线:分为大和小

调查研究需大样本;实验研究小样本,最少5个

抽签法:50人以下

随机数表法:确定起点,随机上下走

自变量:被研究者操纵的变量;

因变量; 研究中观察的变量

测量精度角度

类别变量

顺序变量

等距变量:各种分数,

 

 

[展开全文]

质性与量化研究

文字---数字

自然---实证

自然环境---实验环境

归纳法---演绎法

描述统计: 关注如何整理数据,汇报全貌

推断统计:关注如何利用数据做决断,并确定可靠性。

 

参考书:

张绍山,2008 《语言研究中的统计学》(2版),西安:西安交通大学出版社

Mann, P.Ps. 2004. Introductory Statistics (5th ed.). John Wiley & Sons, Inc.

[展开全文]
yuxiajun · 2020-04-25 · 课程导学 0

回归分析需要变量相关

一元线性回归 :自变量

测定系数、确定系数

回归引起的变异

多元指多个自变量

多重共线性

 

[展开全文]

线性相关:正相关&负相关

皮尔逊:两个变量等距

(2)2个变量是等级数距

(3)即数值又顺序

(4)2个名称变量

[展开全文]

系统误差(条件误差)

抽样误差(随机误差)

总离差=组内离差+组间离差

总的离差平方和

FMax检验方法

[展开全文]

单样本(检验分为Z检验&T检验)T检验:平均数的显著性检验  频率更高

T检验:自由度(df)

 

独立样本T检验

 

配对(相关)样本T检验

[展开全文]

研究问题(核心概念,研究焦点)

研究假设:有差异假设

零假设:无差异假设

 

误差:抽样误差(随机误差,不可避免)&

系统误差(规律误差)

抽样误差和系统误差总是混合在一起的

 

显著性检验(假设检验)

显著水平

假设检验是针对零假设的

假设检验中的2类错误

一类错误(拒真错误)

二类错误(取伪错误)

 

双尾检验(更多)

单尾检验

[展开全文]