1.2独立性检验的基本思想及其初步应用
[导入新知]
1.分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2.2×2列联表
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称2×2列联表)为:
|
y1
|
y2
|
总计
|
x1
|
a
|
b
|
a+b
|
x2
|
c
|
d
|
c+d
|
总计
|
a+c
|
b+d
|
a+b+c+d
|
3.等高条形图
将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.
4.K2统计量
为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
5.独立性检验
利用随机变量K2来确定是否能以给定把握认为“两个分类变量有关系”的方法,称为两个分