人教高中数学选修1 3-高中数学奥赛自学
高中数学选修1-2知识点总结
第一章 统计案例
1.线性回归方程
①变量之间的两类关系:函数关系与相关
关系;
②制作散点图,判断线性相关关系
③线性回归方程:
y?bx?a
(最小二乘法)
n
?x
i
y
i
?nxy
?
?
i?1
??
b?
n
2
其中,
?
2
x?nx
?
i
?
i?1
?
?
?
a
?y?bx
?
注意:线性回归直线经过定点
(x,y)
.
2.相关系数(判定两个变量线性相关性):
r?
?
(x
i?1
n<
br>i
?x)(y
i
?y)
n
?
(x
i?1
n
i
?x)
2
?
(y
i
?y)2
i?1
注:⑴
r
>0时,变量
x,y
正相关;
r
<0时,变量
x,y
负相关;
⑵①
|r|
越接近于1,两个变量的线性相关性越强;②
|r|
接近于0时,
两个变量之间几乎不存在线性相关关系。
1.(2011·
山东)某产品的广告费用
x
与销售额
y
的统计数据如下表:
广告费用
x
万元
销售额
y
万元
4
49
2
26
3
39
5
54
根据上表
可得回归方程
^
y
=
^
bx
+
^
a
中的
^
b
为,据此模型预报广告费用为6万元
时销售额为
( ).
A.万元 B.万元
C.万元 D.万元
解析 ∵
-
x
=
4+2+3+57
-
49+26+39+54
=,y
==42,
424
7
又
^
y
=<
br>^
bx
+
^
a
必过(
-
x
,
-
y
),∴42=×+
^
a
,∴
^
a
=
.
2
∴线性回归方程为
^
y
=+.
∴当
x
=6时,
^
y
=×6+=(万元).
答案 B
2.(2011·江西)为了解儿子身高与其父亲身高的关系,随机抽取5
对父子的
身高数据如下:
父亲身高
x
cm
174
176
176
176
178
儿子身高
y
cm
175
175
176
177
177
则
y
对
x
的线性回归方程
( ).
=
x
-1
=
x
+1
=88+
1
2
x
=176
解析 因为
-
x
=
174+176+176+1
76+178
5
=176,
-
y
=
175+17
5+176+177+177
5
=176,
又
y
对
x
的线性回归方程表示的直线恒过点(
-
x
,
-
y
),
所以将(176,176)代入A、B、C、D中检验知选C.
答案 C
3.(2011·陕西)设(
x
1
,
y
1
),(
x
2
,
y
2
),…,(
x
n
,
y
n
)是
变量
x
和
y的
n
个样本点,直线
l
是由这些样本点通
过最小二乘法得到的线
性回归直线(如图),以下结论
中正确的是( ).
A.
x
和
y
的相关系数为直线
l
的斜率
B.
x
和
y
的相关系数在0到1之间
为
C.当
n
为偶数时,分布在
l两侧的样本点的个数一定相同
D.直线
l
过点(
-
x
,
-
y
)
解析
因为相关系数是表示两个变量是否具有线性相关关系的一个值,它
的
绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误.C中
n
为偶数时,分布在
l
两侧的样本点的个数可以不相同,所以C错误.根据
回
归直线方程一定经过样本中心点可知D正确,所以选D.
答案 D
4.(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关
系,下表记录了小
李某月1号到5号每天打篮球时间
x
(单位:小时)与当
天投篮命中率
y之间的关系:
时间
x
命中率
y
1
2
3
4
5
小李这5天的平均投篮命中率为__
______;用线性回归分析的方法,预测
小李该月6号打6小时篮球的投篮命中率为_______
_.
解析 小李这5天的平均投篮命中率
-
y
=
错误!
=,
可求得小李这5天的平均打篮
球时间
-
x
=3.根据表中数据可求得
^
b
=,
^
a
=
,故回归直线方程为
^
y
=+,将
x
=6代入得6号打6小时篮球的
投篮命中率约为.
答案
5.(2011·辽宁)调查了某地若干户家庭的年收入
x
(单位:万元)
和年饮食支
出
y
(单位:万元),调查显示年收入
x
与年饮食支出<
br>y
具有线性相关关系,
并由调查数据得到
y
对
x
的回归直线方程:
^
y
=+.由回归直线方程可知,
家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析
由题意知[(
x
+1)+]-+=.
答案
6.(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
需求量(万吨)
2002
236
2004
246
2006
257
2008
276
2010
286
(1)利用所给数据求年需求量与年份之间的回归直线方程
^
y
=
^
bx
+
^
a
;
(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.
解 (1
)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求
回归直线方程.为此对数据预处理如
下:
年份-2006
需求量-257
-4
-21
-2
-11
0
0
2
19
4
29
对预处理后的数据,容易算得
-
x
=0,
-
y
=.
?-4?×?-21?+?-2?×?-11?+2×19+4×2
9-5×0×
^
b
=
?-4?
2
+?-2?2
+2
2
+4
2
-5×0
2
=
260
=,
^
a
=
-
y
-
b
-
x
=3.
40
由上述计算结果,知所求回归直线方程为
^
y
-257=
^
b
(
x
-2
006)+
^
a
=(
x
-2 006)+,
即
^
y
=(
x
-2 006)+.
①
(2)利用直线方程①,可预测2012年的粮食需求量为
6.5×(2012-2006)+=×6+=(万吨).
7.(2010·新课标
全国)为调查某地区老年人是否需要志愿者提供帮助,用简
单随机抽样方法从该地区调查了500位老年
人,结果如下:
性 别
男
需要
不需要
40
160
女
30
270
是否需要志愿者
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别
有关
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,
需要志愿者提供
帮助的老年人的比例
说明理由.
附:
P
(
K
2
≥
k
)
k
2
n
?
a
d
-
bc
?
2
K
=
?
a
+
b
??
c
+
d
??
a
+
c<
br>??
b
+
d
?
解 (1)调查的500位老年人中有70位需
要志愿者提供帮助,因此该地区
老年人中,需要帮助的老年人的比例的估计值为
500×?40
×270-30×160?
2
(2)
K
=≈.
70×300×200×430
2
70
=14%.
500
由于>,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.
(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本
数据
能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因
此
在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女
两
层并采用分层抽样方法比采用简单随机抽样方法更好.
8.(2010·辽宁)为了比较注射
A
,
B
两种药物后产生的皮肤
疱疹的面积,选
200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中
一组注射药物
A
,另一组注射药物
B
.下表1和表2分别是注射药物
A
和药
物
B
后的试验结果.(疱疹面积单位:mm
2
)
表1:注射药物
A
后皮肤疱疹面积的频数分布表
疱疹面积
频数
[60,65)
30
[65,70)
40
[70,75)
20
[75,80)
10
表2:注射药物
B
后皮肤疱疹面积的频数分布表
疱疹面积
频数
[60,65)
10
[65,70)
25
[70,75)
20
[75,80)
30
[80,85)
15
(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大
小;
(2)完成下面2×2列联表,并回答能否有%的把握认为“注射药物
A
后
的疱
疹面积与注射药物
B
后的疱疹面积有差异”.
表3:
疱疹面积小
2
于70
mm
疱疹面积不
2
小于70 mm
总计
注射药物
A
注射药物
B
总计
2
a
=
c
=
b
=
d
=
n
=
n
?
ad
-
bc
?
2
附:
K
=
?
a
+
b??
c
+
d
??
a
+
c
??
b
+
d
?
P
(
K
2
≥
k
)
k
解 (1)
从频率分布直方图中可以看出注射药物
A
后皮肤疱疹面积的中位数在65至
70之间,而注射药物
B
后皮肤疱疹面积的中位数在
70至75之间,所以注
射药物
A
后疱疹面积的中位数小于注射药物
B
后疱疹面积的中位数.
(2)表3:
疱疹面积
小于70 mm
2
疱疹面积不
小于70 mm
2
总计
100
100
注射药物
A
注射药物
B
总计
a
=70
c
=35
105
2
b
=30
d
=65
95
n
=200
200×?70×65-35×30?
K
2
=≈.
100
×100×105×95
由于
K
2
>,所以有%的把握认为“注射药物
A
后的疱疹面积与注射药物
B
后
的疱疹面积有差异”.