第3章 统计案例
3.2 独立性检验的基本思想及其初步应用
学 习 目 标
|
核 心 素 养
|
1.理解独立性检验的基本思想及其实施步骤.(重点)
2.能利用条形图、列联表探讨两个分类变量的关系.(易混点)
3.了解K2的含义及其应用.(重点)
4.通过对数据的处理,来提高解决实际问题的能力.(难点)
|
1.通过学习独立性检验的基本思想提升逻辑推理的素养.
2.借助k2公式培养数学运算的素养.
3.借助条形图培养直观想象的素养.
|
1.分类变量及2×2列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的频数表,称为列联表.
②2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
|
y1
|
y2
|
总计
|
x1
|
a
|
b
|
a+b
|
x2
|
c
|
d
|
c+d
|
总计
|
a+c
|
b+d
|
a+b+c+d
|
2.等高条形图
(1)等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.
(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)K2=,其中n=a+b+c+d.
(3)独立性检验的具体做法
①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.
②利用公式计算随机变量K2的观测值k.
③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
思考:有人说:“我们有99%的把握认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的.”你认为这种观点正确吗?为什么?
[提示]观点不正确.99%的把握说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.
1.下列变量中不属于分类变量的是( )
A.性别 B.吸烟
C.宗教信仰 D.国籍
B [“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.]
2.下面是一个2×2列联表:
|
y1
|
y2
|
总计
|
x1
|
a
|
21
|
73
|
x2
|
8
|
25
|
33
|
总计
|
b
|
46
|
|
则表中a,b处的值分别为________.
52,60 [∵a+21=73,∴a=52.
b=a+8=52+8=60.]