语言、数据与研究:阿檀小倪讲量化

语言、数据与研究:阿檀小倪讲量化
301人加入学习
(22人评价)
价格 ¥399.00
学时 11.0
学时 11.0
学习有效期 180 天(随到随学)
会员免费学 购买课程

事物和事物之间的差异和不同---对比性研究

聚焦文本特征:因果连贯性,连接词与逻辑词,词语指代关系,主要词性密度,一词多义与同形异义,句法复杂度,构词与词频

[展开全文]

数据收集:

对象,工具和步骤

co-metrix:计算文本的语言和语篇特征

测量和分析不同阅读文本的特征

账号注册---文本分析---结果保存

数据量比较大,可以使用新版文本分析工作(new text analysis service)

 

 

 

[展开全文]

如何进行对比性数据分析,从而回答问题

t检验:比较平均数之间的差异,样本量小于30

当总体呈现正态分布,而标准差未知,样本容量很小,一切可能的平均数之差会组成一个t 分布。---小概率反证法

单总t检验:样本的平均数和一个已知的总体平均数(A班和全校)

独立样本t 检验:两个独立、没有明显联系的样本的平均数(A班和B班)

配对样本t 检验:两个紧密练习的平均数之间的差异(A班,期中和期末)

t 检验仅适用连续性数据,比如身高,体重,得分等;不适用与排名类的顺序性数据。

具体操作:

设一列专门的变量:分组,1和2

分析---比较均值---选择合适的方法---选择框--分组变量---1和2---继续---检验变量---确定

顺序数据:分析---非参数检验--旧对话框---2个独立样本---选择框---分组变量---1和2---继续---检验变量---manm--whitney U --确定

读表:

第一个表格:描述性统计,

第二个表格:F,sig如果大于0.05,就要报告上面一行(假设方差相等)的结果;如果小于0.05,就要报告下面一行(假设方差不相等)的结果。

非参数分析:类似

如何在报告中呈现:

对应问题,重制表格(只需要提供平均数和标准差即可,不需要提供样本量和标准误)

重点报告:t 值,自由度,以及显著性水平

t(自由度(数字)=xxx

p=xxx

非参数报告的是u 值,z 值和p 值

 

 

 

 

[展开全文]

自变量和因变量之间有显著关系

自变量之间的相关不能太高

自变量越多,所需要的样本量越多

标准多项回归

 

[展开全文]

比较性问题是如何形成:

对比性研究讨论的是一对一的差异对比

探究三个或三个以上:比较性研究

教材难度:文本难度(容易测量,较为客观),背景知识,认知难度

文本难度:词汇难度(词频的分布和等级状况)

                 平均句长 (总词数和句子数)

                 篇章可读性(是否容易被读懂)

研究目标说明研究问题:过去100年分为10个年代,比较三年级和六年级的

 

[展开全文]

如何收集数据

对象:一百年间美国小学三年级和六年级的教材

工具:qanalysis 6.0  +内部工具,可以使用lexile来获得篇章可读性计算值,平均句长计算值,词汇频率计算值,文本词数计算值

汉语:汉语文本指南针,词句篇的量化数值可以获得

步骤:文本

[展开全文]

如何进行比较性数据分析:

方差分析(F检验):比较多个群体之间的平均数差异

多次t检验会使得正确的概率越来越低,错误的概率越来越高,所以不可行

方差分析:一次性地比较因变量中方差的多少是由分组的不同所导致的

总体方差A:组内方差B,组间方差C

A=B+C(如果C在A中所占的比例越来越高,表明组别之间的差异越明显,如果C几乎没有,就表明三个组之间其实没有差异)

例子:大一到大四各100名,专业知识水平是否有差异?

计算400名学生总方差A,然后再计算每个年级的方差加起来的方差B,A-B得出C

通过计算C在A中的比例来计算F 值,F值大的话就表明四个年级的学生有显著的差异,相反,如果F 值小的话,就表明他们之间没有差别

两组的时候,方差分析和t检验的结果是一样的

方差分析显著之后,才能分别单独进行两两比较,确定哪两组之间有差异

方差分析有两种:

1)简单方差分析ANOVA, 最基本的方差分析,对不同组别的同一变量的平均数进行比较

2)重复测量的方差分析:同一组被试被重复测量,得到多个数值,这些数值之间的比较

具体操作:

第一列:标识分组

从第二列开始:不同变量

分析---比较均值---单因素方差分析---选择因变量和因子(分组数据)---选项---描述性,方差同质性检验---均值图---两两比较--lsd(主选),tukey,bnonferron(如果前面同质性分析的各组之间方差值是一样的)

如果方差值是不一样的,则选择games-howell

继续---确定

另外一种方法:分析---一般线性模型---单变量---因变量和固定因子---选项---描述统计---方差齐性检验--继续---两两比较--因子---lsd+game---确定

阅读解释表格

均值和标准差

显著性如果大于0.05,就要看lsd的结果,小于则是看games的结果

单因素方差分析: df和F值和显著性

F值足够大,显著性小于0.05,则表明各个组之间的差异很显著;相反则差异不显著

多重比较分析:事后分析,两两比较(方差分析显著的情况下看这个)

不同组别的均值比较图

如何呈现结果:

对应问题,重制表格(提供平均数和标准差,不需要提供样本量和标准误),文字说明(文字和数字)(F值,自由度,显著性水平)

F(自由度1(分组的数量-1),自由度2(剩下的不同组别的组内自由度))=xxx,p=xxx

如果F值显著,要报告具体的事后分析的结果,即哪几个组之间有显著的差异

介绍对应表格---列举关键数值,F值和P值

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[展开全文]

频率统计:计算个数

集中量数:描述数据聚拢的程度-平均数

离散趋势:描述数据分散的程度-全距(最大值减去最小值)

 

[展开全文]

研究:用数据回答问题

 

量化研究:研究问题决定了你的研究是否是量化研究

描述研究:大致情况如何

相关:它两有何关系

回归:它们有何关系

对比:它俩有何差异

比较:

[展开全文]

数据的收集:

收集的数据要为回答的问题提供证据链。选取对象要有代表性

选取的工具需要有效性

步骤科学性

 

Range 词汇分析软件

Sketch Engine 语料库收集工具

CLPAT

Coh-metrix

Lexile 

[展开全文]

变量:某种事物的某种属性,进行量化后得到的结果

变量一定是用数字来表示的

如:很重,很轻  不可以做变量

 

变量类型:

称名变量:类别,无法比较

顺序数据:排列,可以比较,不能加减乘除

等距数据:有单位,没有零点,只能加减,不能乘除

 

[展开全文]

描述性问题   情景/概念/问题

 

情景:对具体处境进行描述,要聚焦,找到具体的点,

 

概念:分析该情景,解释该情景

 

 

 

 

 

[展开全文]

3个重要的引物:对象,工具,步骤

 

词汇覆盖率:特定等级词表占比

学生 先掌握高频词,然后低频词

 

 

问题形成,针对一种情况或现象描述,提出研究问题,找准最重要的一个方面或一个环节,抓住“牛鼻子”

 

数据收集:样本量很大,要具有

[展开全文]

如何进行描述性数据分析?

数据大通过

步骤跟着做

 

 

什么是描述统计:用一种简单的方式,来概括和呈现一堆数据的一些基本特征

数据:频率统计,集中量数,离散趋势

 

[展开全文]

样本的平均数 Vs. 一个已知总体的平均数(A班和全校)

独立样本T检验:

两个独立的、没有明显联系的样本的平均数:A班和B班

配对样本t检验:两个紧密联系的平均数之间的差异(A班,期中和期末)

[展开全文]

基础是:理论框架 

研究问题或者假说

研究设计和资料收集

[展开全文]

语言与数据研究:阿檀小倪讲量化

带着问题学方法

不是研究复杂性决定发文的成功度,而是问题核心要素。

链条式讲解能够降低形成问题的难度。

1介绍论文标题核心词,

2核心词如何链接论文理论框架,

3问题与数据手机和统计分析如何链接

 

 

[展开全文]

老师搞科研不知道怎么搞,

学生找导师论文不通过,

发表论文审稿不通过

找问题可以通过高水平期刊

针对难的情况可以通过文献学*和在线工具

 

 

[展开全文]