笔记1:
标准差Std:Standard Deviation:每个个体与平均数之间的差距。可得知最高分与最低分与平均分的差距。
平均分作用:一组数据哪个数据最典型。
参数(estimator)估计:通过一个样本来推算整体水平。
统计就是猜测。
假设检验:检验某次某样本参数估计的对错。
统计的两大任务是“参数估计”和“假设检验”。
误差(error):
抽样误差:案例一(我真的教得不如别人好吗?)中两个班本身学生自身的好坏差异。——无法避免
系统误差:案例一(我真的教得不如别人好吗?)中教师教学方法不同导致的平均分差异。——有来由的差异,可操纵
加权(weight):根据三次模拟考试难度,使第一考分占60%、第二次占30%、第三次占10%,按以上比例算出三门总分后再除以3。
预测性问题用回归(regression):用三次考试考分来预测因变量的变化。
因变量:观测,可视变化,分数有没有变化。
自变量:控制,可控制的,如三次考分。
随机抽样:每个个体被抽中的机会是均等的。
便利抽样:不能代表整体。
规律性的、趋势性的、大范围的情况适合使用统计。(大于等于30的样本)
数据收集方法:
问卷:收集态度类信息
实验:与认知能力、心理活动相关
语料库:观测语言现象,适合研究语言本体
怎么使用统计学?先提出问题,然后进行设计。
统计方法选择:
找差异:T检验(2组)和方差分析(3组及3组以上)
找关联:共变关系co-vary(相关correlation)和预测关系estimate(回归regression)