课时作业59 变量间的相关关系、统计案例
一、选择题
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是(
)
A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1D.r2<r4<0<r1<r2
解析:由相关系数的定义及散点图所表达的含义,可知r2<r4<0<r3<r1,故选A.
答案:A
2.下列说法正确的是()
A.线性相关系数r越大,两个变量的线性相关程度越强;反之,线性相关程度越弱
B.残差平方和越大的模型,拟合的效果越好
C.用相关指数R2来刻画回归的效果,R2越小,说明模型的拟合效果越好
D.用最小二乘法求回归直线方程,是寻求使? (yi-bxi-a)2取
i=1n
最小值时a,b的值
解析:线性相关系数r满足|r|≤1,并且|r|越接近1,线性相关程度越强,|r|越接近0,线性相关程度越弱,故A错误;残差平方和越小的模型,拟合的效果越好,B错误;相关指数是衡量模型拟合效果的一种指标,相关指数越大,模型的拟合效果越好,C错误;选D.
答案:D
3.已知变量x,y之间具有线性相关关系,其回归方程为y=-3+bx,若?xi=17,?yi=4,则b的值为( )
i=1i=1^1010^^
A.2
C.-2 B.1 D.-1
174解析:依题意知,x=101.7,y=10=0.4,
而直线y=-3+bx一定经过点(x,y),
所以-3+b×1.7=0.4,解得b=2.
答案:A
4.登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
^^^^由表中数据,得到线性回归方程y=-2x+a (a∈R),由此请估计
出山高为72(km)处气温的度数为( )
A.-10
C.-4 B.-8 D.-6
解析:由题意可得x=10,y=40,
所以a=y+2x=40+2×10=60.
所以y=-2x+60,当y=72时,-2x+60=72,解得x=-6,故选D.
答案:D
5.在2014年1月1日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
^
^
^
^ (参考公式:^,其线性回归直线方程是:y=-3.2x+a回归方程y=bx+a^=y-bx),则a=( ) a
A.-24 C.40.5
B.35.6 D.40
^
^
^
^
9+9.5+10+10.5+11
解析:价格的平均数是x==10,销售量的5
^^11+10+8+6+5
^知b=-3.2,所以平均数是y==8,由y=-3.2x+a5
^=y-bx=8+3.2×10=40,故选D. a
答案:D
6.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
^
已知在全部105人中随机抽取1个,成绩优秀的概率为7则下列
说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”
解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,
2105×?10×30-20×45?得到K2=6.109>3.841,因此有95%的把握55×50×30×75
认为“成绩与班级有关系”.
答案:C
二、填空题
7.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y=1.197x-3.660,由此估计,当股骨长度为50 cm时,肱骨长度的估计值为________
cm.
解析:根据回归方程y=1.197x-3.660,将x=50代入,得y=56.19,则肱骨长度的估计值为56.19 cm.
答案:56.19
8.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计^^
算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关)
解析:由观测值k=27.63与临界值比较,我们有99%的把握说打鼾与患心脏病有关.
答案:有关
9.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为__________cm.
解析:儿子和父亲的身高可列表如下:
设回归直线方程为y =a +b x,由表中数据可求得x=173,y=
^
2
176,xiyi=913 62,xi=898 05,∴b
i=1i=1
?
3
?
3
=1,a =y-b x=3,故
^
^^
回归直线方程为y =x+3.当x=182时,y =182+3=185.故预测他的孙子的身高为185 cm.
答案:185 三、解答题
10.(2014·辽宁卷)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
^
(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
解:(1)将2×2列联表中的数据代入公式计算,得K2=100×?60×10-20×10?210021≈4.762. 70×30×80×20
由于4.762>3.841,
所以有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.
(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.
其中ai表示喜欢甜品的学生,i=1,2,bj表示不喜欢甜品的学生,j=1,2,3.Ω由10个基本事件组成,且这些基本事件的出现是等可能的.
用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3)}.
7事件A是由7个基本事件组成,因而P(A)=1011.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得?xi=80,?yi=
i=1i=11010
20,?xiyi=184,?xi2=720.
i=1i=1
^1010^x+a^; (1)求家庭的月储蓄y对月收入x的线性回归方程y=b
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
1n801n20解:(1)由题意知n=10,x=n?xi=10=8,y=n?yi=10=2,
i=1i=1
又xi2-ni=1?nx=720-10×8=80,?xiyi-nx y=184-10×8×2=i=122n
?xiyi-nx y
i=1n
24,由此得b=
2?x2i-nxi=1
^n2480=0.3,a=y-bx=2-0.3×8=-0.4,故所求回归方程为y=0.3x-0.4.
(2)由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).
1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,?,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系 ^
B.回归直线过样本点的中心(x,y)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 解析:根据线性回归方程中各系数的意义求解.由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本中心点(x,y),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.
答案:D
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,所以选C.
答案:C
3.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
别有关(请用百分数表示).
2
n?ad-bc?
附:K2=?a+b??c+d??a+c??b+d?
解析:K2=
?a+b??c+d??a+c??b+d?
50×?20×15-5×10?2
≈8.333>7.879,所以在犯错误的概率不超
25×25×30×20过0.005的前提下认为喜爱打篮球与性别有关.
答案:0.5%
4.为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,得到如下表格:
“m,n均不小于25”的概率;
(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y关于x的线性回归方程y=bx+a;
^
^
^
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
?xiyi-nx y
(参考公式:b=^i=1
nna=y-b x) ^^2?x2i-nxi=1
解:(1)所有的基本事件为(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共10个.
设“m,n均不小于25”为事件A,则事件A包含的基本事件为(25,30),(25,26),(30,26),共3个.
3所以P(A)=10.
(2)由数据得,另3天的平均数x=12,y=27,3x y=972,3x2=432,?xiyi=977,?xi2=434,
i=1
^i=133977-9725^5所以b=a=27-2×12=-3, 434-4322
5所以y关于x的线性回归方程为y=2-3. ^
(3)依题意得,当x=10时,y=22,|22-23|<2;当x=8时,y=17,|17-16|<2,
所以(2)中所得到的线性回归方程是可靠的.
^^
www.99jianzhu.com/包含内容:建筑图纸、PDF/word/ppt 流程,表格,案例,最新,免费下载,施工方案、工程书籍、建筑论文、合同表格、标准规范、CAD图纸等内容。