十讲走进语言统计学

十讲走进语言统计学
350人加入学习
(0人评价)
价格 ¥349.30 ¥ 499.00 7折
学时 20.0
活动 还剩下7个名额
学时 20.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

一、总体、抽样

总体:具有某种共同特征的个体综合,不总是指人,事物也可以;

样本:从总体中按照一定的原则和程序抽取的作为观察的一部分个体

抽样:按照一定的原则和程序从总体中抽取个体的过程。

             简单随机抽样(每个个体被抽中的可能性是均等的):抽签法,随机数表法

              等距/系统抽样:

               分层抽样

变量:自变量是被研究者操纵的变量;因变量是研究者观察的变量

类被变量:
顺序变量:个体按照一定特征排序后再分出类别
等距变量:各种分数,专四专八分数等

连续变量:可以取小数的变量

频次变量:

 

描述集中趋势:平均数,中位数,众数

 

[展开全文]

统计分类:
描述统计

推断统计

[展开全文]

量化研究与质性研究

数字or文字描述,哲学基础:实证主义——自然主义,实验环境——自然环境,演绎性——归纳性

 

量化研究:实验、准实验、调查、语料库、元分析

质性研究:观察、访谈、日志、叙事、民族志

 

量化研究:统计分析、数字呈现

质性研究:内容分析、文字呈现

 

统计:

中世纪拉丁语 , ”国家“

19世纪:用数字的方法说明国家的特征

后被用到自然科学、社会科学、语言教学等领域

 

统计的分类:

1   描述统计

2  推断统计

 

 

[展开全文]

提问→设计→统计

统计适用于解决规律性、趋势性、大样本的问题。

参数估计,假设检验。

 

1.找差异:T检验,方差分析

 标准差(相对概念)

 误差:抽样误差、系统误差

 

2.关联性问题:相关(共变),回归(预测)

 回归:因变量(观测)、自变量(控制)

 

3.卡方检验

适用文科的统计软件:SPSS 13.0及以上版本

 

随机抽样、便利抽样

教育部  规划司  “教育统计数据

 

设计:收集数据的手段

1.问卷:态度类

2.实验:认知、心理

3.语料库:观测、语言现象

 

《外语教学科研中的统计方法》

 

[展开全文]

标准差:最高分和最低分与平均分之间的差值。

参数估计:用一部分数据推测全体

抽样误差:正好遇上了拖后腿的

 

预测

回归:三次模拟考试回归到因变量
自变量:人为控制的变化

因变量:观察得到的数据

抽样:在实际中常采用便利抽样

教育部——规划司——教育统计数据

 

统计的作用:1找差异,2预测

样本大于等于30就可以用统计

 

统计设计

问卷:适合收集态度类信息

实验:与认知、心理活动有关的研究,用实验

语料库:观测语言现象音、形、义

 

找差异

2组之间差异:T检验(独立样本T检验、

3组及以上之间差异:方差分析(ANOUA)

 

找关联

共变关系:

预测关系:回归(1个因变量;2+因变量)

[展开全文]

两个变量的属性

皮尔逊相关:等距变量

肯德尔相关:顺序变量

斯皮儿曼: 等距和顺序变量 【看两位老师打分是否一致】

克莱默相关:称名变量

 

观察散点图

计算相关系数

计算自由度

查得临界值

比大小,做决断

如果大于临界值,拒绝零假设 

 

公式

一个变量的标准分*另一个变量的标准分 的和

除以对个数

自由度 n-2

相关系数绝对值

大于0.70 高相关

0.40-0.70之间 中度相关

小于0.40 低度相关

[展开全文]

组间平方和

(组平方-总平方)再平方再乘以个数

 

查表时

分子:组间自由度

分母:组内自由度

 

统计值小于临界值说明 P>0.05

[展开全文]
yuxiajun · 2020-04-27 · 作业反馈 0

当计算出来的T值大于临界值 P就小于0.05  就是有显著性差异

[展开全文]
yuxiajun · 2020-04-27 · 作业反馈 0

单样本T检验

Z检验:正态分布,方差已知

T检验:正态分布,方差未知

 

独立样本检验小结

不知道方差,用T检验更多

总体方差相等/(方差齐性)的独立样本T检验应用更广

 

[展开全文]

参数估计定义

类型

点估计:用样本的一个点值推测总体

区间估计:概率

标准误:样本标准差/样本量的平方根

临界值   1.96  95%

总体参数区间估计:

-1.96(样本平均数-总体平均数)/标准误 +1.96

表示总体的方差 1.96  95%

                                  2.58   99%

 

[展开全文]

总体:人和事物都能指代

样本: 一部分个体: 

30是样本的线:分为大和小

调查研究需大样本;实验研究小样本,最少5个

抽签法:50人以下

随机数表法:确定起点,随机上下走

自变量:被研究者操纵的变量;

因变量; 研究中观察的变量

测量精度角度

类别变量

顺序变量

等距变量:各种分数,

 

 

[展开全文]

质性与量化研究

文字---数字

自然---实证

自然环境---实验环境

归纳法---演绎法

描述统计: 关注如何整理数据,汇报全貌

推断统计:关注如何利用数据做决断,并确定可靠性。

 

参考书:

张绍山,2008 《语言研究中的统计学》(2版),西安:西安交通大学出版社

Mann, P.Ps. 2004. Introductory Statistics (5th ed.). John Wiley & Sons, Inc.

[展开全文]
yuxiajun · 2020-04-25 · 课程导学 0

回归分析需要变量相关

一元线性回归 :自变量

测定系数、确定系数

回归引起的变异

多元指多个自变量

多重共线性

 

[展开全文]

线性相关:正相关&负相关

皮尔逊:两个变量等距

(2)2个变量是等级数距

(3)即数值又顺序

(4)2个名称变量

[展开全文]

系统误差(条件误差)

抽样误差(随机误差)

总离差=组内离差+组间离差

总的离差平方和

FMax检验方法

[展开全文]

单样本(检验分为Z检验&T检验)T检验:平均数的显著性检验  频率更高

T检验:自由度(df)

 

独立样本T检验

 

配对(相关)样本T检验

[展开全文]

研究问题(核心概念,研究焦点)

研究假设:有差异假设

零假设:无差异假设

 

误差:抽样误差(随机误差,不可避免)&

系统误差(规律误差)

抽样误差和系统误差总是混合在一起的

 

显著性检验(假设检验)

显著水平

假设检验是针对零假设的

假设检验中的2类错误

一类错误(拒真错误)

二类错误(取伪错误)

 

双尾检验(更多)

单尾检验

[展开全文]

总体参数的点估计(会有偏差)

总体参数的区间估计(概率)

置信区间

置信水平(95%及以上,才是有效的)

区间估计步骤一:标准误

步骤二:置信临界值

步骤三:估计总体参数所在区间

置信临界值 95%  置信临界值 正负1.96

99%  正负2.58

 

[展开全文]

正态分布(曲线)

正态曲线下面积(与平均数和标准差有关)

标准分z

[展开全文]

总体 population

样本 sample

大样本(调查研究)、小样本(实验研究)

抽样 sampling

抽样原则:具有良好的代表性

简单随机抽样:抽签法(30以内)、随机数表法(100以内)

等距或系统抽样

分层抽样

如何分层:层内差异小,层间差异大

变量

自变量

因变量

类别变量

顺序变量

等距变量

连续变量(集中趋势-平均数&离散趋势-标准差)

频次变量

平均数

离散趋势

标准差

[展开全文]

授课教师

北京语言大学

学员动态

刘英伟 开始学习 作业反馈
刘英伟 开始学习 作业反馈
刘英伟 开始学习 课后作业