1.2×2列联表的意义
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如下表所示的抽样数据:
|
Ⅱ
|
|
类1
|
类2
|
合计
|
Ⅰ
|
类A
|
a
|
b
|
a+b
|
类B
|
c
|
d
|
c+d
|
合计
|
a+c
|
b+d
|
a+b+c+d
|
形如上表的表格称为2×2列联表,2×2列联表经常用来判断Ⅰ和Ⅱ之间是否有关系.
2.独立性检验
(1)独立性检验
2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,结果并不唯一.因此,由某个样本得到的推断有可能正确,也有可能错误.为了使不同样本量的数据有统一的评判标准,统计学中引入下面的量(称为卡方统计量):
χ2=(*),
其中n=a+b+c+d为样本容量.
用统计量研究这类问题的方法称为独立性检验(test of independence).
(2)独立性检验的基本步骤
要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
①提出假设H0:Ⅰ与Ⅱ没有关系;
②根据2×2列联表与公式(*)计算χ2的值;