统计学置信区间例题例题银行需要多少个窗口

点击联系发帖人 时间：2017-07-30 06:35

统计学置信区间例题

当前位置： >>
统计学第五版课后题答案
统计学第五版贾俊平版课后题答案（部分）第三章数据的图表展示3．1 为评价家电行业售后服务的质量，随机抽取了由 100 个家庭构成的一个样本。服务质量的等级分别表示为：A．好；B．较好；C 一般；D．较差；E.差。调查结果如下： B D A B C D B B A C E A D A B A E A D B C C B C C C C C
B C C B C D E B C E C E A C C E D C A E C D D D A A B D D A A B C E E B C E C B E C B C D D C C B D D C A E C D B E A D C B E E B C C B E C B C要求： (1)指出上面的数据属于什么类型。顺序数据 (2)用 Excel 制作一张频数分布表。用数据分析――直方图制作：接收 E D C B A 频率 16 17 32 21 14(3)绘制一张条形图，反映评价等级的分布。用数据分析――直方图制作：直方图 40频率20 0 E D C 接收 B A频率1(4)绘制评价等级的帕累托图。逆序排序后，制作累计频数分布表：接收频数频率(%) 累计频率(%) C B D E A 32 21 17 16 14 32 21 17 16 14 32 53 70 86 10035 30 25 20 15 10 5 0 C D B A E120 100 80 60 40 20 0 频数累计频率(%)3．2 某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下： 152 105 117 97 124 119 108 88 129 114 105 123 116 115 110 115 100 87 107 119 103 103 137 138 92 118 120 112 95 142 136 146 127 135 117 113 104 125 108 126要求： (1)根据上面的数据进行适当的分组，编制频数分布表，并计算出累积频数和累积频率。 1、确定组数：K ?1 ?l g? 4 ? 0 l gn ( ) 1.60206 ，取 ?1 ? ? 1 ? ? 6.3 2 k=6 lg(2) lg 2 0.301032、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（152-87）÷6=10.83，取 10 3、分组频数表销售收入80.00 - 89.00 90.00 - 99.00 100.00 - 109.00 110.00 - 119.00频数2 3 9 12频率%5.0 7.5 22.5 30.0累计频数2 5 14 26累计频率%5.0 12.5 35.0 65.02120.00 - 129.00 130.00 - 139.00 140.00 - 149.00 150.00+ 总和7 4 2 1 4017.5 10.0 5.0 2.5 100.033 37 39 4082.5 92.5 97.5 100.0(2)按规定，销售收入在 125 万元以上为先进企业， 115～125 万元为良好企业， 105～115 万元为一般企业，105 万元以下为落后企业，按先进企业、良好企业、一般企业、落后企业进行分组。频数先进企业良好企业一般企业落后企业总和 10 12 9 9 40 频率% 25.0 30.0 22.5 22.5 100.0 累计频数 10 22 31 40 累计频率% 25.0 55.0 77.5 100.03．3 某百货公司连续 40 天的商品销售额如下：单位：万元 41 46 35 42 25 36 28 36 29 45 46 37 47 37 34 37 38 37 30 49 34 36 37 39 30 45 44 42 38 43 26 32 43 33 38 36 40 44 44 35要求：根据上面的数据进行适当的分组，编制频数分布表，并绘制直方图。 1、确定组数：K ?1 ?l g? 4 ? 0 l gn ( ) 1.60206 ，取 ?1 ? ? 1 ? ? 6.3 2 k=6 lg(2) lg 2 0.301032、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（49-25）÷6=4，取 5 3、分组频数表销售收入（万元） &= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+ 总和频数 1 5 6 14 10 4 40 频率% 2.5 12.5 15.0 35.0 25.0 10.0 100.0 累计频数 1 6 12 26 36 40 累计频率% 2.5 15.0 30.0 65.0 90.0 100.03频数 16 14 12 10 8 6 4 2 0&= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+频数频数销售收入3．4 利用下面的数据构建茎叶图和箱线图。 57 23 35 18 21 21 29 47 51 26 46 43 29 23 39 50 41 19 36 28 18 29 52 42 31 28 46 33 28 204605040302010 datadata Stem-and-Leaf Plot Frequency 3.00 5.00 7.00 2.00 3.00 3.00 3.00 3.00 1.00 Stem width: Each leaf: Stem & 1 . 2 . 2 . 3 . 3 . 4 . 4 . 5 . 5 . Leaf 889 9 13 569 123 667 012 7 10 1 case(s)3 ．6 一种袋装食品用生产线自动装填，每袋重量大约为 50g ，但由于某些原因，每袋重量不会恰好是 50g 。下面是随机抽取的 100 袋食品，测得的重量数据如下：单位：g 57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47553 51 48 53 50 52 40 45 57 53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51 59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48 要求： (1) 构建这些数据的频数分布表。 (2) 绘制频数分布的直方图。 (3) 说明数据分布的特征。解：(1)根据上面的数据进行适当的分组，编制频数分布表，并计算出累积频数和累积频率。 1、确定组数：K ?1 ?l g? 1 0?0 l gn ( ) 2 ，取 ?1 ? ? 1 ? ? 6.6 4 k=6 或 7 lg(2) lg 2 0.301032、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（61-40）÷6=3.5，取 3 或者 4、5 组距＝( 最大值 - 最小值)÷ 组数=（61-40）÷7=3， 3、分组频数表组距 3，上限为小于频数有效 40.00 - 42.00 43.00 - 45.00 46.00 - 48.00 49.00 - 51.00 52.00 - 54.00 55.00 - 57.00 58.00+ 合计 3 9 24 19 24 14 7 100 百分比 3.0 9.0 24.0 19.0 24.0 14.0 7.0 100.0 累计频数 3 12 36 55 79 93 100 累积百分比 3.0 12.0 36.0 55.0 79.0 93.0 100.0直方图：6组距3，小于3020Frequency10Mean =5.22 Std. Dev. =1.508 N =100 0 0 2 4 6 8 10组距3，小于组距 4，上限为小于等于频数有效 &= 40.00 41.00 - 44.00 45.00 - 48.00 49.00 - 52.00 53.00 - 56.00 57.00 - 60.00 61.00+ 合计 1 7 28 28 22 13 1 100 百分比 1.0 7.0 28.0 28.0 22.0 13.0 1.0 100.0 累计频数 1 8 36 64 86 99 100 累积百分比 1.0 8.0 36.0 64.0 86.0 99.0 100.0直方图：7组距4，小于等于4030Frequency2010Mean =4.06 Std. Dev. =1.221 N =100 0 0 2 4 6 8组距4，小于等于组距 5，上限为小于等于频数有效 &= 45.00 46.00 - 50.00 51.00 - 55.00 56.00 - 60.00 61.00+ 合计 12 37 34 16 1 100 百分比 12.0 37.0 34.0 16.0 1.0 100.0 累计频数 12.0 49.0 83.0 99.0 100.0 累积百分比 12.0 49.0 83.0 99.0 100.0直方图：8组距5，小于等于5040Frequency302010 Mean =2.57 Std. Dev. =0.935 N =100 0 0 1 2 3 4 5 6组距5，小于等于分布特征：左偏钟型。3.8 下面是北方某城市 1 ― ― 2 月份各天气温的记录数据： -3 14 6 -8 -14 2 -18 -8 -6 -22 -4 -15 -12 -15 -13 -7 -9 -16 -11 -9 -11 -6 -19 -12 -6 -1 -1 -15 -19 0 -1 7 0 -22 -25 -1 7 8 5 -25 -24 5 5 9 -4 -24 -18 -4 -6 -6 -9 -19 -17 -9 -5-3 2 -4 -4 -16 要求： (1) 指出上面的数据属于什么类型。数值型数据 (2) 对上面的数据进行适当的分组。 1、确定组数：K ?1 ?l g? 6 ? 0 l gn ( ) 1.778151 ，取 ?1 ? ? 1 ? ? 6.909 8 9 k=7 lg(2) lg 2 0.301032、确定组距：组距＝( 最大值 - 最小值)÷ 组数=（14-（-25)）÷7=5.57，取 5 3、分组频数表9温度 -25 - -21 -20 - -16 -15 - -11 -10 - -6 -5 - -1 0-4 5-9 10+ 合计频数 6 8 9 12 12 4 8 1 60频率% 10.0 13.3 15.0 20.0 20.0 6.7 13.3 1.7 100.0累计频数 6 14 23 35 47 51 59 60累计频率% 10.0 23.3 38.3 58.3 78.3 85.0 98.3 100.0(3) 绘制直方图，说明该城市气温分布的特点。频数 14 12 10 8 6 4 2 0-25 - -21 -20 - -16 -15 - -11 -10 - -6 -5 - -1 0 - 4 5 - 9 10+12 9128 68 频数 4 13.11 对于下面的数据绘制散点图。 x y 解： 2 25 3 25 4 20 1 30 8 16 7 181035 30 25 20 15 10 5 0 0 2 4 x 6 8 103． 12y甲乙两个班各有40名学生，期末统计学考试成绩的分布如下：考试成绩优良中及格不及格人数甲班 3 6 18 9 4 乙班 6 15 9 8 2要求： (1) 根据上面的数据，画出两个班考试成绩的对比条形图和环形图。20 18 16 14 12 10 8 6 4 2 018 15 人数甲班人数乙班 4 29 6 3 698优良中及格不及格112 8 9 4 36 6 优良中及格不及格91815(2) 比较两个班考试成绩分布的特点。甲班成绩中的人数较多，高分和低分人数比乙班多，乙班学习成绩较甲班好，高分较多，而低分较少。 (3) 画出雷达图，比较两个班考试成绩的分布是否相似。不及格优 20 15 10 5 0良人数甲班人数乙班及格中分布不相似。3.14 已知 1995 ― 2004 年我国的国内生产总值数据如下 ( 按当年价格计算 ) ：单位：亿元国内生产总值年份第一产业第二产业第三产业1297 00 03 200484．6 745．2 868．1 9172.3
.2 152．4 128．2 117．3 168．07
要求： (1) 用 Excel 绘制国内生产总值的线图。国内生产总值 000 000
0国内生产总值199519961997199819992000200120022003(2) 绘制第一、二、三产业国内生产总值的线图。
02004第一产业第二产业第三产业(3) 根据 2004 年的国内生产总值及其构成数据绘制饼图。19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 0413国内生产总值% 43721, 32% 第一产业第二产业第三产业 72387, 53%第四章4.1（1）众数： M 0 ? 10 。数据的概括性度量1410 ? 10 ? 10 。中位数：中位数位置 ? n ? 1 ? 10 ? 1 ? 5.5 ， M e ? 2 2 2平均数： x ??xi ?1nin?2 ? 4 ? ? ? 14 ? 15 96 ? ? 9 .6 。 10 104?7 n 10 ? 5.5 。 ? ? 2.5 ， QL ? 2 4 4 12 ? 12 3n 3 ? 10 ? 12 。 QU 位置 ? ? ? 7.5 ， QU ? 2 4 4 （3）（2） QL 位置 ?s? ?? (xi ?1ni? x)2 ?n ?1 156.4 ? 4.2 9(2 ? 9.6) 2 ? (4 ? 9.6) 2 ? ? ? (14 ? 9.6) 2 ? (15 ? 9.6) 2 10 ? 1（4）由于平均数小于中位数和众数，所以汽车销售量为左偏分布。4.2 （1）从表中数据可以看出，年龄出现频数最多的是 19 和 23，所以有两个众数，即和M 0 ? 19M 0 ? 23。将原始数据排序后，计算的中位数的位置为：中位数位置 ? n ? 1 ? 25 ? 1 ? 13 ，第 13 个位置 2 2 上的数值为 23，所以中位数 M e ? 23 。（2） QL 位置 ?n 25 ? ? 6.25 ， QL ? 19 ? 0.25? (19 ? 19) ? 19 。 4 4QU 位置 ?3 ? 25 ? 18 .75 ， QU ? 25 ? 0.75 ? （27 - 25） ? 26.5 。 4（3）平均数 x ?n?xi ?1nin?19 ? 15 ? ? ? 17 ? 23 600 ? ? 24 。 25 25s? ?? (xi ?1i? x)2n ?1 1062 ? 6.65 25 ? 1(19 ? 24) 2 ? (15 ? 24) 2 ? ? ? (17 ? 24) 2 ? (23 ? 24) 2 ? 25 ? 1（4）偏态系数： SK ?25? ?xi ? 24?3(25 ? 1)(25 ? 2) ? 6.653? 1.08 。15峰态系数： K ?25(25 ? 1)? ( xi ? 24) 4 ? 3 ? ( xi ? 24) 2 (25 ? 1)2??(25 ? 1)(25 ? 2)(25 ? 3) ? 6.654? 0.77 。（5）分析：从众数、中位数和平均数来看，网民年龄在 23～24 岁的人数占多数。由于标准差较大，说明网民年龄之间有较大差异。从偏态系数来看，年龄分布为右偏，由于偏态系数大于 1，所以偏斜程度很大。由于峰态系数为正值，所以为尖峰分布。 4.3（1）茎叶图如下：茎叶 5 5 678 6 13488 7 （2） x ?数据个数 1 3 55.5 ? 6.6 ? ? ? 7.8 ? 7.8 63 ? ?7。 9 9s?(5.5 ? 7) 2 ? (6.6 ? 7) 2 ? ? ? (7.8 ? 7) 2 ? (7.8 ? 7) 2 4.08 ? ? 0.714。 9 ?1 81.97 0.714 ? 0.274 ； v 2 ? ? 0.102 。由于 v1 ? v2 ，表明第一种排 7 .2 7（3）由于两种排队方式的平均数不同，所以用离散系数进行比较。第一种排队方式： v1 ?队方式的离散程度大于第二种排队方式。（4）选方法二，因为第二种排队方式的平均等待时间较短，且离散程度小于第一种排队方式。4.4（1） x ??xi ?1nin?8223 ? 274.1 。 30中位数位置 ?（2） Q L 位置 ?258 ? 261 30 ? 259 .5 。 ? 7 .5 ， Q L ? 2 4 284 ? 291 3 ? 30 ? 287 .5 。 QU 位置 ? ? 22.5 ， QU ? 2 4272 ? 273 30 ? 1 ? 272 .5 。 ? 15.5 ， M e ? 2 2（3） s ?? (xi ?1ni? x)2 ?n ?113002 .7 ? 21.17 。 30 ? 1总成本 ?
? ? ? 19.41 。总产量 00 340 ? ? 15 20 304.5（1）甲企业的平均成本?16乙企业的平均成本?总成本 3255 ? 1500 ?
? ? ? 18.29 . 总产量 00 342 ? ? 15 20 30原因：尽管两个企业的单位成本相同，但单位成本较低的产品在乙企业的产量中所占比重较大，因此拉低了总平均成本。 4.6（1）平均数计算过程见下表：组中值按利润额分组 200～300 300～400 400～500 500～600 600 以上合计企业数Mi250 350 450 550 650 ―fi19 30 42 18 11 120M i fi
x??Mi ?1kifin?51200 ? 426.67 。 120标准差计算过程见下表：按利润额分组 200～300 300～400 400～500 500～600 600 以上合计组中值 M i 250 350 450 550 650 ― 企业数 f i 19 30 42 18 11 120(M i ? x ) 28.3 544.3 76.3 (M i ? x ) 2 f i
s?? (Mi ?1ki? x)2 fin ?1? ? 116.48 。 120 ? 1（2）偏态系数和峰态系数的计算过程见下表：按利润额分组 200～300 300～400 400～500 500～600 600 以上合计组中值 M i 250 350 450 550 650 ― 企业数 f i 19 30 42 18 11 120(M i ? x ) 3 f i- -
(M i ? x ) 4 f i.2 .8
.6 .8 .417偏态系数： SK ?? (Mi ?1 kki? x)3 fi3ns? ? 0.203。 120? 116.483峰态系数： K ?? (Mi ?1i? x)4 fi4ns?3? 8.4 ? 3 ? ?0.688 。 120? 116.4844.7（1）两位调查人员所得到的平均身高应该差不多相同，因为均值的大小基本上不受样本大小的影响。（2）两位调查人员所得到的身高的标准差应该差不多相同，因为标准差的大小基本上不受样本大小的影响。（3）具有较大样本的调查人员有更大的机会取到最高或最低者，因为样本越大，变化的范围就可能越大。 4.8 （ 1 ）要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为5 5 ? 0.1 ，男生体重的离散系数为 v男 ? ? 0.08 ，所以女生的体重差异大。 50 60 （2）男生： x ? 60 ? 2.2 ? 132 （磅）， s ? 5 ? 2.2 ? 11 （磅）；女生： x ? 50 ? 2.2 ? 110 （磅）， s ? 5 ? 2.2 ? 11 （磅）； v女 ?（3）假定体重为对称分布，根据经验法则，在平均数加减 1 个标准差范围内的数据个数大约为 68%。因此，男生中大约有 68%的人体重在 55kg 到 65kg 之间。（4）假定体重为对称分布，根据经验法则，在平均数加减 2 个标准差范围内的数据个数大约为 95%。因此，女生中大约有 95%的人体重在 40kg 到 60kg 之间。 4.9 通过计算标准分数来判断：zA ?x A ? x A 115? 100 x ? x B 425? 400 ? ? 1； z B ? B ? ? 0.5 。 sA 15 sB 50该测试者在 A 项测试中比平均分数高出 1 个标准差，而在 B 项测试中只高出平均分数 0.5 个标准差，由于 A 项测试的标准分数高于 B 项测试，所以 A 项测试比较理想。 4.10 通过标准分数来判断，各天的标准分数如下表：日期标准分数 Z 周一 3 周二 -0.6 周三 -0.2 周四 0.4 周五 -1.8 周六 -2.2 周日 0周一和周六两天失去了控制。 4.11（1）应该采用离散系数，因为它消除了不同组数据水平高低的影响。（2）成年组身高的离散系数： v s ?4 .2 ? 0.024 ； 172 .1 2 .5 ? 0.035 ；幼儿组身高的离散系数： v s ? 71 .3由于幼儿组身高的离散系数大于成年组身高的离散系数，说明幼儿组身高的离散程度相18对较大。 4,11（1）应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时，应该采用离散系数。（2）下表给出了用 Excel 计算一些主要描述统计量。方法 A 平均中位数众数标准差极差最小值最大值 165.6 165 164 2.13 8 162 170 平均中位数众数标准差极差最小值最大值方法 B 128.73 129 128 1.75 7 125 132 平均中位数众数标准差极差最小值最大值方法 C 125.53 126 126 2.77 12 116 128从三种方法的集中趋势来看，方法 A 的平均产量最高，中位数和众数也都高于其他两种方法。从离散程度来看，三种方法的离散系数分别为： v A ?2.13 ? 0.013 ， 165 .6vB ?1.75 2.77 ? 0.014 ， vC ? ? 0.022 。方法 A 的离散程度最小。因此应选择 128 .73 125 .53方法 A。 4.12（1）用方差或标准差来评价投资的风险。（2）从直方图可以看出，商业类股票收益率的离散程度较小，说明投资风险也就较小。（3）从投资风险角度看，应该选择风险较小的商业类股票。当然，选择哪类股票还与投资者的主观判断有很大关系。第五章概率与概率分布5.1 略 5.2 P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35% 5.3 因为P ? AB? ? P ? AB? ? P(AB)=1/3 ; P ? B? ? P(A(B+B))=P(AB) ? P ? AB? =1/3 P ? A? ? P(A(B+B))=P(AB) ? P ? AB? =1/3-1/9=2/9 P ? AB? ? P ? AB? ? P(AB) ? P(AB)=1 ;5.4P ? A|B? ? P ? AB? / P( B) ? 1/ 6 ; ?P ? AB? ? 1/ 6*1/ 3 ? 1/18P ? A? ? P(A(B+B))=P(AB) ? P ? AB? ; P ? AB? ? 1/ 3 ? 1/18 ? 5 /18同理 P ? B? ? P(B(A+A))=P(AB) ? P AB ； P AB =5/18????191 ? 1 / 18 ? 5 / 18 ? 5 / 18 ? 7 / 12 1?1/ 3 5.5 （1） P(A)P ? B? ? 0.8*0.7 ? 0.56 ； P ? A|B? ? P ? AB? / P( B ) ?（2） P ? A+B? ? P(A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94 （3） P ? A+B? ? P(A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38 5.6 P( B) ? P(A）P ? B|A? ? 96%*75%=0.72 5.7 P ? A|B? ? P ? AB? / P( B) ? 5.8 贝叶斯公式：1/ 2 ?2/3 3/4P ? Ak |B? ? P ? Ak |B? ?P ? Ak )P(B|Ak ? 10%*20% ? ? 3.63% ? P ? A? P ? B|A? 10%*20% ? 50%*50% ? 40%*70%P ? Ak )P(B|Ak ? 50%*50% ? ? 45.45% ? P ? A? P ? B|A? 10%*20% ? 50%*50% ? 40%*70%P ? Ak |B? ?P ? Ak )P(B|Ak ? 40%*70% ? ? 50.9% P A P B|A 10%*20% ? 50%*50% ? 40%*70% ? ? ? ? ?5.9 贝叶斯公式：P ? Ak |B? ? P ? Ak |B? ?P ? Ak )P(B|Ak ? 30%*0.1 ? ? 0.249 ? P ? A? P ? B|A? 30%*0.1 ? 27%*0.05 ? 25%*0.2 ?18%*0.15P ? Ak )P(B|Ak ? 27%*0.05 ? ? 0.112 ? P ? A? P ? B|A? 30%*0.1 ? 27%*0.05 ? 25%*0.2 ?18%*0.155.10 P(x=0)=0.25; P(x=1)=0.5; P(x=2)=0.25 5.11 (1) P(x=1)=0.20; P(x=10)=0.01; P(x=100)=0.001 (2)Ex=1*0.2+10*0.01+100*0.001=0.4 5.12 (1) 5.13??3x 21?dx ? 37 ,?? ? 2 8(2) Ex ??212 3x 4 3x 3 dx ? 0.15 dx ? 1.5 ; Dx ? ? 1 8 8xB(5, 0.25) ,学生凭猜测至少答对 4 道的概率为：4 5 P( x ? 4) ? P( x ? 5) = C5 0. ? C5 0. =1 645.14 P(x=k)=λ ^k×e^(-λ )/k!① P(x=k+1)=λ ^(k+1)×e^(-λ )/(k+1)!② ②/①得 P(x=k+1)/P(x=k)=λ /(k+1) 令 P(x=k+1)/P(x=k)&1, 则 λ &k+1, k&λ -1 令 P(x=k+1)/P(x=k)&1, 则 λ &k+1, k&λ -1 若 λ &2, 则 P(x=k)随着 k 增大而减小, ∴k=1 时最大若 λ &2, 则 P(x=1)&??&P(x=[λ -1])&P(x=[λ -1]+1)&P(x=[λ -1]+2)&??, ∴k=[λ -1]+1=[λ ]是最大综上, λ &2 时,k=1;λ &2 时,k=[λ ](写成分段的形式,[]是取整符号) 5.16 (1)0..5 5.17 173.913 5.18 (1)0..38320第六章统计量及其抽样分布6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为 ? 盎司，通过观察这台装瓶机对每个瓶子的灌装量服从标准差 ? ? 1.0 盎司的正态分布。随机抽取由这台机器灌装的 9 个瓶子形成一个样本，并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过 0.3 盎司的概率。解：总体方差知道的情况下，均值的抽样分布服从 N 标准化得到标准正态分布：z= 为：? ?,? n ? 的正态分布，由正态分布，2x ?? ～ N ? 0,1? ，因此，样本均值不超过总体均值的概率 P ? n? x ?? ? ?0.3 x ? ? 0.3 ? 0.3 ? P ? x ? ? ? 0.3? = P ? ? ? ? ?= P? ? ?? n ? n ? ?1 9 ? n 1 9 ? = P ? ?0.9 ? z ? 0.9? =2 ? ? 0.9? -1，查标准正态分布表得 ? ? 0.9 ? =0.8159因此， P x ? ? ? 0.3 =0. P Y ? ? ? 0.3 = P ?????? Y ?? ? ?0.3 x ? ? 0.3 ? 0.3 ? ? = P? ? ? ? ? ?? n ? n? ?1 n ? n 1 n ? ? ?= P | z |? 0.3 n = 2? 0.3 n ? 1 =0.95 查表得： 0.3 n ? 1.96 因此 n=43 6.3 Z1 ， Z 2 ，??， Z6 表示从标准正态总体中随机抽取的容量，n=6 的一个样本，试确定? 6 ? 常数 b，使得 P ? ? Z i2 ? b ? ? 0.95 ? i ?1 ? 解：由于卡方分布是由标准正态分布的平方和构成的：设 Z1，Z2，……，Zn 是来自总体 N(0,1)的样本，则统计量2 ? 2 ? Z12 ? Z2 ? 2 ? Zn????服从自由度为 n 的 χ2 分布，记为 χ2～ χ2（n）因此，令 ? 2 ? ? Z i2 ，则 ? 2 ? ? Z i2i ?1 i ?1 6 6? 6 ? ? 2 ? 6 ? ，那么由概率 P ? ? Z i2 ? b ? ? 0.95 ，可知： ? i ?1 ?b= ?2 1?0.95? 6? ，查概率表得：b=12.596.4 在习题 6.1 中，假定装瓶机对瓶子的灌装量服从方差 ? 2 ? 1 的标准正态分布。假定我们计划随机抽取 10 个瓶子组成样本，观测每个瓶子的灌装量，得到 10 个观测值，用这 10 个 1 n 观测值我们可以求出样本方差 S 2 ( S 2 ? 确定一个合适的范围使得有较大的 ? (Yi ? Y )2 ) ， n ? 1 i ?1 概率保证 S2 落入其中是有用的，试求 b1，b2，使得 p(b1 ? S 2 ? b2 ) ? 0.90 解：更加样本方差的抽样分布知识可知，样本统计量：(n ? 1 s )2?(n ? 1) s 22~ ? 2 (n ? 1 )此处，n=10， ? 2 ? 1 ，所以统计量?2?(10 ? 1) s 2 ? 9s 2 ~ ? 2 (n ? 1) 121根据卡方分布的可知：P ?b1 ? S 2 ? b2 ? ? P ?9b1 ? 9S 2 ? 9b2 ? ? 0.90又因为：因此：2 P ? ?12?? 2 ? n ? 1? ? 9S 2 ? ?? 2 ? n ? 1? ? ? 1 ? ? 2 P ?9b1 ? 9S 2 ? 9b2 ? ? P ? ?12?? 2 ? n ? 1? ? 9S 2 ? ?? 2 ? n ? 1? ? ? 1 ? ? ? 0.902 ? P ?9b1 ? 9S 2 ? 9b2 ? ? P ? ?12?? 2 ? n ? 1? ? 9S 2 ? ?? 2 ? n ? 1? ? 2 2 ? P ? ?0.95 ?9? ? 9S 2 ? ?0.05 ?9?? ? 0.90则：2 2 ? 9b1 ? ?0.95 ?9? ,9b2 ? ?0.05 ?9? ? b1 ?2 ? 0.95 ?9?查概率表： ?2 0.95? 9? =3.325， ?b2 ? 92 0.059 ? 9? =19.919，则, b2 ?2 ? 0.05 ?9?9b1 ??2 0.959?9? =0.369，2 ?0.05 ? 9?=1.88第7章参数估计z ? 1.96 7.1（1）已知： ? ? 5 ， n ? 40 ， x ? 25 ， ? ? 0.05 ， 0.05 2 。?x ?样本均值的抽样标准差?n?5 405? 0.79。（2）估计误差E ? z??2n? 1.96 ?40? 1.55。z ? 1.96 7.2（1）已知： ? ? 15 ， n ? 49 ， x ? 120 ， ? ? 0.05 ， 0.05 2 。?x ?样本均值的抽样标准差?n?15 49? 2.14。（2）估计误差E ? z??2n? 1.96 ?15 49? 4.20。（3）由于总体标准差已知，所以总体均值 ? 的 95%的置信区间为：x ? z? 2?n? 120 ? 1.96 ?15 49? 120 ? 4.20，即（115.8，124.2）。z ? 1.96 7.3 已知： n ? 100 ， ? ? 85414 ， x ? 104560 ， ? ? 0.05 ， 0.05 2 。22由于总体标准差已知，所以总体均值 ? 的 95%的置信区间为：x ? z? 2?n? .96 ?? 741 .144，即（
，）。z ? 1.645 7.4（1）已知： n ? 100 ， x ? 81 ， s ? 12 ， ? ? 0.1 ， 0.1 2 。由于 n ? 100 为大样本，所以总体均值 ? 的 90%的置信区间为：x ? z? 2s n? 81? 1.645?12 100? 81? 1.974，即（79.026，82.974）。z ? 1.96 （2）已知： ? ? 0.05 ， 0.05 2 。由于 n ? 100 为大样本，所以总体均值 ? 的 95%的置信区间为：x ? z? 2s n? 81 ? 1.96 ?12 100? 81 ? 2.352，即（78.648，83.352）。z ? 2.58 （3）已知： ? ? 0.01 ， 0.01 2 。由于 n ? 100 为大样本，所以总体均值 ? 的 99%的置信区间为：x ? z? 2s n? 81 ? 2.58 ?12 100? 81 ? 3.096，即（77.940，84.096）。z ? 1.96 7.5（1）已知： x ? 25 ， ? ? 3.5 ， n ? 60 ， ? ? 0.05 ， 0.05 2 。由于总体标准差已知，所以总体均值 ? 的 95%的置信区间为：x ? z? 2?n? 25 ? 1.96 ?3.5 60? 25 ? 0.89，即（24.11，25.89）。z ? 2.33 （2）已知： x ? 119 .6 ， s ? 23.89 ， n ? 75 ， ? ? 0.02 ， 0.02 2 。由于 n ? 75 为大样本，所以总体均值 ? 的 98%的置信区间为：x ? z? 2s n? 119.6 ? 2.33?23.89 75? 119.6 ? 6.43，即（113.17，126.03）。z ? 1.645 （3）已知： x ? 3.419 ， s ? 0.974 ， n ? 32 ， ? ? 0.1 ， 0.1 2 。23由于 n ? 32 为大样本，所以总体均值 ? 的 90%的置信区间为：x ? z? 2s n? 3.419 ? 1.645?0.974 32? 3.419 ? 0.283，即（3.136，3.702）。? ? 500 ，n ? 15 ，x ? 8900 ， ? ? 0.05 ，z 0.05 2 ? 1.96 。 7.6 （1）已知：总体服从正态分布，由于总体服从正态分布，所以总体均值 ? 的 95%的置信区间为：x ? z? 2?n?
?500 15? ，即（53.03）。n ? 35 ，x ? 8900 ， ? ? 0.05 ，z 0.05 2 ? 1.96 。（2）已知：总体不服从正态分布， ? ? 500 ，虽然总体不服从正态分布，但由于 n ? 35 为大样本，所以总体均值 ? 的 95%的置信区间为：x ? z? 2?n?
?500 35? ，即（65.65）。（ 3）已知：总体不服从正态分布， ? 未知， n ? 35 ， x ? 8900 ， s ? 500 ， ? ? 0.1 ，z 0.1 2 ? 1.645。虽然总体不服从正态分布，但由于 n ? 35 为大样本，所以总体均值 ? 的 90%的置信区间为：x ? z? 2s n? ?500 35? ，即（39.03）。（4）已知：总体不服从正态分布， ? 未知， n ? 35 ， x ? 8900 ， s ? 500 ， ? ? 0.01 ，z 0.01 2 ? 2.58。虽然总体不服从正态分布，但由于 n ? 35 为大样本，所以总体均值 ? 的 99%的置信区间为：x ? z? 2s n?
?500 35? ，即（18.05）。z ? 1.645 z 0.05 2 ? 1.96 7.7 已知： n ? 36 ，当 ? 为 0.1、0.05、 0.01 时，相应的 0.1 2 、、 z 0.01 2 ? 2.58。根据样本数据计算得： x ? 3.32 ， s ? 1.61 。24由于 n ? 36 为大样本，所以平均上网时间的 90%的置信区间为：x ? z? 2s n? 3.32 ? 1.645?1.61 36? 3.32 ? 0.44，即（2.88，3.76）。平均上网时间的 95%的置信区间为：x ? z? 2s n? 3.32 ? 1.96 ?1.61 36? 3.32 ? 0.53，即（2.79，3.85）。平均上网时间的 99%的置信区间为：x ? z? 2s n? 3.32 ? 2.58 ?1.61 36? 3.32 ? 0.69，即（2.63，4.01）。? ? 0.05 ，t 0.05 2 (8 ? 1) ? 2.365。 7.8 已知：总体服从正态分布，但 ? 未知，n ? 8 为小样本，根据样本数据计算得： x ? 10 ， s ? 3.46 。总体均值 ? 的 95%的置信区间为：x ? t? 2s n? 10 ? 2.365?3.46 8? 10 ? 2.89，即（7.11，12.89）。t 0.05 2 (16 ? 1) ? 2.131 n ? 16 为小样本， ? ? 0.05 ， 7.9 已知：总体服从正态分布，但 ? 未知，。根据样本数据计算得： x ? 9.375 ， s ? 4.113 。从家里到单位平均距离的 95%的置信区间为：x ? t? 2s n? 9.375 ? 2.131?4.113 16? 9.375 ? 2.191，即（7.18，11.57）。z ? 1.96 7.10（1）已知： n ? 36 ， x ? 149 .5 ， ? ? 0.05 ， 0.05 2 。由于 n ? 36 为大样本，所以零件平均长度的 95%的置信区间为：x ? z? 2s n? 149.5 ? 1.96 ?1.93 36? 149.5 ? 0.63，即（148.87，150.13）。（2）在上面的估计中，使用了统计中的中心极限定理。该定理表明：从均值为 ? 、方差为? 2 的总体中，抽取容量为 n 的随机样本，当 n 充分大时（通常要求 n ? 30 ），样本均值 x 的25抽样分布近似服从均值为 ? 、方差为 ?2n 的正态分布。z ? 1.96 7.11 （1）已知：总体服从正态分布，但 ? 未知，n ? 50 为大样本，? ? 0.05 ， 0.05 2 。根据样本数据计算得： x ? 101 .32 ， s ? 1.63 。该种食品平均重量的 95%的置信区间为：x ? z? 2s n? 101.32 ? 1.96 ?1.63 50? 101.32 ? 0.45，即（100.87，101.77）。p?（2）根据样本数据可知，样本合格率为为：45 ? 0.9 50 。该种食品合格率的 95%的置信区间p ? z? 2p(1 ? p) 0.9(1 ? 0.9) ? 0.9 ? 1.96 ? 0.9 ? 0.08 n 50 ，即（0.82，0.98）。7.12 已知：总体服从正态分布，但? 未知， n ? 25 为小样本， ? ? 0.01 ，t 0.01 2 (25 ? 1) ? 2.797。根据样本数据计算得： x ? 16 .128 ， s ? 0.871 。总体均值 ? 的 99%的置信区间为：x ? t? 2s n? 16.128? 2.797?0.871 25? 16.128? 0.487，即（15.64，16.62）。t 0.1 2 (18 ? 1) ? 1.740 n ? 18 为小样本， ? ? 0 .1 ， 7.13 已知：总体服从正态分布，但 ? 未知，。根据样本数据计算得： x ? 13.56 ， s ? 7.80 。网络公司员工平均每周加班时间的 90%的置信区间为：x ? t? 2s n? 13.56 ? 1.740?7.80 18? 13.56 ? 3.20，即（10.36，16.76）。z ? 2.58 7.14（1）已知： n ? 44 ， p ? 0.51， ? ? 0.01 ， 0.01 2 。总体总比例 ? 的 99%的置信区间为：26p ? z? 2p(1 ? p) 0.51(1 ? 0.51) ? 0.51? 2.58 ? 0.51? 0.19 n 44 ，即（0.32，0.70）；z ? 1.96 （2）已知： n ? 300 ， p ? 0.82 ， ? ? 0.05 ， 0.05 2 。总体总比例 ? 的 95%的置信区间为：p ? z? 2p(1 ? p) 0.82(1 ? 0.82) ? 0.82 ? 1.96 ? 0.82 ? 0.04 n 300 ，即（0.78，0.86）；z ? 1.645 （3）已知： n ? 1150 ， p ? 0.48 ， ? ? 0.1 ， 0.1 2 。总体总比例 ? 的 90%的置信区间为：p ? z? 2p(1 ? p) 0.48(1 ? 0.48) ? 0.48 ? 1.645 ? 0.48 ? 0.02 n 1150 ，即（0.46，0.50）。z ? 1.645 z 0.05 2 ? 1.96 7.15 已知：n ? 200 ， p ? 0.23 ，? 为 0.1 和 0.05 时，相应的 0.1 2 ，。总体总比例 ? 的 90%的置信区间为：p ? z? 2p(1 ? p) 0.23(1 ? 0.23) ? 0.23 ? 1.645 ? 0.23 ? 0.05 n 200 ，即（0.18，0.28）。 p(1 ? p) 0.23(1 ? 0.23) ? 0.23 ? 1.96 ? 0.23 ? 0.06 n 200 ，即（0.17，0.29）。总体总比例 ? 的 95%的置信区间为：p ? z? 2z ? 2.58 7.16 已知： ? ? 1000 ，估计误差 E ? 200 ， ? ? 0.01 ， 0.01 2 。n?应抽取的样本量为：( z? 2 ) 2 ? 2 E2?2.582 ? 10002 ? 167 2002 。z ? 2.05 7.17（1）已知： E ? 0.02 ， ? ? 0.40 ， ? ? 0.04 ， 0.04 2 。n?应抽取的样本量为：( z? 2 ) 2 ? ? (1 ? ? ) E2?2.052 ? 0.40(1 ? 0.40) ?
。z ? 1.96 （2）已知： E ? 0.04 ， ? 未知， ? ? 0.05 ， 0.05 2 。由于 ? 未知，可用使用 0.5。n?应抽取的样本量为：( z? 2 ) 2 ? ? (1 ? ? ) E2?1.962 ? 0.50(1 ? 0.50) ? 601 0.042 。27z ? 1.645 （3）已知： E ? 0.05 ， ? ? 0.55 ， ? ? 0.1 ， 0.1 2 。n?应抽取的样本量为：( z? 2 ) 2 ? ? (1 ? ? ) E2?1.6452 ? 0.55(1 ? 0.55) ? 268 0.052 。7.18（1）已知： n ? 50 ，p?32 ? 0.64 z ? 1.96 50 ， ? ? 0.05 ， 0.05 2 。总体中赞成该项改革的户数比例的 95%的置信区间为：p ? z? 2p(1 ? p) 0.64(1 ? 0.64) ? 0.64 ? 1.96 ? 0.64 ? 0.13 n 50 ，即（0.51，0.77）。z ? 1.96 （2）已知： ? ? 0.80 ， ? ? 0.05 ， 0.05 2 。n?应抽取的样本量为：( z? 2 ) 2 ? ? (1 ? ? ) E2?1.962 ? 0.80(1 ? 0.80) ? 62 0.12 。7． 20 顾客到银行办理业务时往往需要等待一段时间，而等待时间的长短与许多因素有关，比如，银行业务员办理业务的速度，顾客等待排队的方式等。为此，某银行准备采取两种排队方式进行试验，第一种排队方式是：所有顾客都进入一个等待队列；第二种排队方式是：顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短，银行各随机抽取 10 名顾客，他们在办理业务时所等待的时间(单位：分钟)如下： 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7 方式 1 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10 方式 2 要求： (1)构建第一种排队方式等待时间标准差的 95％的置信区间。n ? 1? S 2 ? ~ ? 2 ? n ? 1? 解：估计统计量： 2? 2 经计算得样本标准差 s 2 =3.318， 1 ? ? =0.95，n=10，2 2 2 2 ?? 2 ? n ? 1? = ?0.025 ? 9 ? =19.02， ?1?? 2 ? n ? 1? = ?0.975 ? 9 ? =2.7? n ? 1? S 2 ? ? 2 ? ? n ? 1? S 2 ? 9 ? 0.2272 9 ? 0.2272 ? 置信区间： 2 = , ? =（0.4） ?? 2 ? n ? 1? ?12?? 2 ? n ? 1? ? 2.7 ? 19.02 ?因此，标准差的置信区间为（0.3） (2)构建第二种排队方式等待时间标准差的 95％的置信区间。n ? 1? S 2 ? ~ ? 2 ? n ? 1? 解：估计统计量： 2? 2 经计算得样本标准差 s1 =0.2272， 1 ? ? =0.95，n=10，2 2 2 2 ?? 2 ? n ? 1? = ?0.025 ? 9 ? =19.02， ?1?? 2 ? n ? 1? = ?0.975 ? 9 ? =2.7? n ? 1? S 2 ? ? 2 ? ? n ? 1? S 2 ? 9 ? 3.318 9 ? 3.318 ? , 置信区间： 2 = ? =（1.57，11.06） ?? 2 ? n ? 1? ?12?? 2 ? n ? 1? ? 2.7 ? ? 19.02因此，标准差的置信区间为（1.25，3.33）28(3)根据(1)和(2)的结果，你认为哪种排队方式更好? 第一种方式好，标准差小。 7.21 正态总体，独立小样本，方差未知但相等：( x1 ? x2 ) ? t?2s2 p n1?s2 p n2（其中 s 2 p ?（2） t? 2 ? n1 ? n2 ? 1? = t0.025 ?14 ? 7 ? 2? =2.0930，代入略（3） t? 2 ? n1 ? n2 ? 1? = t0.05 ?14 ? 7 ? 2? =2.8609，代入略 7.22 （1）正态或非正态总体，独立大样本，方差未知（1） t? 2 ? n1 ? n2 ? 1? = t0.05 ?14 ? 7 ? 2? =1.7291，代入略2 (n1 ? 1)s12 ? (n2 ? 1)s2 ， df n1 ? n2 ? 2(n1 ? n2 ? 2) ）( x1 ? x2 ) ? Z ?22 s12 s2 ? n1 n2（2）正态总体，独立小样本，方差未知但 ? 1 ? ? 2 ：( x1 ? x2 ) ? t?2s2 p n1?s2 p n2（其中 s 2 p ?2 (n1 ? 1)s12 ? (n2 ? 1)s2 ， df n1 ? n2 ? 2(n1 ? n2 ? 2) ）（3）正态总体，独立小样本，方差未知 ? 1 ? ? 2 但 n1 ? n2 ， df ? n1 ? n2 ? 2( x1 ? x2 ) ? t?22 s12 s2 ? n1 n2（4）正态总体，独立小样本，方差未知但 ? 1 ? ? 2 ， n1 ? n2 ：( x1 ? x2 ) ? t?2s2 p2 (n1 ? 1)s12 ? (n2 ? 1)s2 ， df ? （其中 s ? n1 n2 n1 ? n2 ? 2s2 p2 p(n1 ? n2 ? 2) ）（5）正态总体，独立小样本，方差未知但 ? 1 ? ? 2 ， n1 ? n2( x1 ? x2 ) ? t?2s s ? n1 n22 12 22 s12 s2 ? )2 n1 n2 （其中 df ? ） 2 2 ( s1 n1 )2 ( s2 n2 )2 ? n1 ? 1 n2 ? 1(7．23 下表是由 4 对观察值组成的随机样本。配对号来自总体 A 的样本来自总体 B 的样本 1 2 0 2 5 7 3 10 6 4 8 5 (1)计算 A 与 B 各对观察值之差，再利用得出的差值计算 d 和 s d 。d =1.75， s d =2.62996(2)设 ?1和?2 分别为总体 A 和总体 B 的均值，构造 ?d ? ?1 ? ?2 的 95％的置信区间。解：小样本，配对样本，总体方差未知，用 t 统计量td ?均值=1.75，样本标准差 s=2.62996， 1 ? ? =0.95，n=4， t? 2 ? n ?1? = t0.025 ?3? =3.182d ? ?d sd nt ? n ?1?29sd ? ? n n? ? 2.96 ? ? = ?1.75 ? 3.182 ? ,1.75 ? 3.182 ? ? =（-2.43，5.93） 4 4 ? ?置信区间： ? d ? t?2?? n ? 1? ?sd, d ? t? 2 ? n ? 1? ?7.24 小样本，配对样本，总体方差未知： t? 2 ? n ?1? = t0.025 ?10 ? 1? =2.2622d ? t? 2 ? n ? 1? ?sd 6.532 = 11 ? 2.2622 ? =（6.8） n 107． 25 从两个总体中各抽取一个 n1 ? n2 ＝250 的独立随机样本，来自总体 1 的样本比例为 p1 ＝40％，来自总体 2 的样本比例为 p2 ＝30％。要求： (1)构造 ?1 ? ? 2 的 90％的置信区间。 (2)构造 ?1 ? ? 2 的 95％的置信区间。解：总体比率差的估计大样本，总体方差未知，用 z 统计量： z ?p1 ? p2 ? ?? 1 ? ? 2 ? p1 ?1 ? p1 ? p2 ?1 ? p2 ? ? n1 n2N ? 0,1?样本比率 p1=0.4，p2=0.3，置信区间：? p ?1 ? p1 ? p2 ?1 ? p2 ? p ?1 ? p1 ? p2 ?1 ? p2 ? ? ? p1 ? p2 ? z? 2 ? 1 ? ? , p1 ? p2 ? z? 2 ? 1 ? ? ? n n n n 1 2 1 2 ? ? 1 ? ? =0.90， z? 2 = z0.025 =1.645 ? p ?1 ? p1 ? p2 ?1 ? p2 ? p ?1 ? p1 ? p2 ?1 ? p2 ? ? ? p1 ? p2 ? z? 2 ? 1 ? ? , p1 ? p2 ? z? 2 ? 1 ? ? ? n n n n 1 2 1 2 ? ? ? 0.4 ?1 ? 0.4 ? 0.3 ?1 ? 0.3? 0.4 ?1 ? 0.4 ? 0.3 ?1 ? 0.3? ? ? = ? 0.1 ? 1.645 ? ? , 0.1 ? 1.645 ? ? ? ? 250 250 250 250 ? ?=（3.02%，16.98%） 1 ? ? =0.95， z? 2 = z0.025 =1.96? p ?1 ? p1 ? p2 ?1 ? p2 ? p ?1 ? p1 ? p2 ?1 ? p2 ? ? ? p1 ? p2 ? z? 2 ? 1 ? ? , p1 ? p2 ? z? 2 ? 1 ? ? ? n n n n 1 2 1 2 ? ? ? 0.4 ?1 ? 0.4 ? 0.3 ?1 ? 0.3? 0.4 ?1 ? 0.4 ? 0.3 ?1 ? 0.3 ? ? ? = ? 0.1 ? 1.96 ? ? , 0.1 ? 1.96 ? ? ? ? 250 250 250 250 ? ?=（1.68%，18.32%） 7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时，需要对序进行改进以减小方差。下面是两部机器生产的袋茶重量(单位：g)的数据：机器 1 机器 2 3.45 3.22 3.9 3.22 3.28 3.35 3.2 2.98 3.7 3.38 3.19 3.3 3.22 3.75 3.28 3.3 3.2 3.05303.5 2.95 3.16 3.23.38 3.45 3.48 3.183.35 3.2 3.12 3.253.3 3.34 3.28 3.33.29 3.35 3.16 3.343.33 3.27 3.28 3.252 要求：构造两个总体方差比 ?12 / ? 2 的 95％的置信区间。s12解：统计量：2 s2? 122 ?2F ? n1 ?1, n2 ?1?? ? s12 s12 2 2 ? ? s2 s2 , 置信区间： ? ? ? F? 2 ? n1 ? 1, n2 ? 1? F1?? 2 ? n1 ? 1, n2 ? 1? ? ? ? ? ? 2 2 s1 =0.058， s 2 =0.006，n1=n2=21，1 ? ? =0.95， F? 2 ? n1 ?1, n2 ?1? = F0.025 ? 20,20? =2.4645，F1?? 2 ? n1 ?1, n2 ?1? =1 F? 2 ? n2 ? 1, n1 ? 1?1 =0. ? 20, 20 ?F1?? 2 ? n1 ?1, n2 ?1? = F0.975 ? 20,20? =? ? s12 s12 2 2 ? ? s2 s2 , ? ? =（4.05，24.6） ? F? 2 ? n1 ? 1, n2 ? 1? F1?? 2 ? n1 ? 1, n2 ? 1? ? ? ? ? ?7．27 根据以往的生产数据，某种产品的废品率为 2％。如果要求 95％的置信区间，若要求估计误差（边际误差）不超过 4％，应抽取多大的样本? 解： z? ， 1 ? ? =0.95， z? 2 = z0.025 =1.96 ?2 p ?1 ? p ? p n 2 z? 2 ? p ? ?1 ? p ? 1.962 ? 0.02 ? 0.98 = =47.06，取 n=48 或者 50。 n? 0.042 ?2 p2??p，n ?2 z? 2 ? p ? ?1 ? p ?7．28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验，标准差大约为 120 元，现要求以 95％的置信水平估计每个顾客平均购物金额的置信区间，并要求边际误差不超过 20 元，应抽取多少个顾客作为样本? 解： n ?2 2 z? 2 ???2 x2 2 z? 2 ??， 1 ? ? =0.95， z? 2 = z0.025 =1.96，n??2 x?1.962 ?，取 n=139 或者 140，或者 150。 20231第八章假设检验1．已知某炼铁厂的含碳量服从正态分布 N（4.55，0.108?），现在测定了 9 炉铁水，其平均含碳量为 4.484。如果估计方差没有变化，可否认为现在生产的铁水平均含碳量为 4.55（α=0.05）？解：已知μ 0=4.55，σ ?=0.108?，N=9， =4.484，这里采用双侧检验，小样本，σ 已知，使用 Z 统计。假定现在生产的铁水平均含碳量与以前无显著差异。则， H0 ：μ =4.55 ； H1 ：μ ≠4.55 α =0.05，α /2 =0.025 ，查表得临界值为计算检验统计量： 1.96Z?x?μ ?/ n0= (4.484-4.55)/(0.108/√9) = -1.833决策： ∵Z 值落入接受域， ∴在?=0.05 的显著性水平上接受 H0。结论：有证据表明现在生产的铁水平均含碳量与以前没有显著差异，可以认为现在生产的铁水平均含碳量为 4.55。2．一种元件，要求其使用寿命不得低于 700 小时。现从一批这种元件中随机抽取 36 件，测得其平均寿命为 680 小时。已知该元件寿命服从正态分布，σ =60 小时，试在显著性水平 0.05 下确定这批元件是否合格。解：已知 N=36，σ =60， =680，μ320=700这里是大样本，σ 已知，左侧检验，采用 Z 统计量计算。提出假设：假定使用寿命平均不低于 700 小时 H0：μ ≥700 H1: μ & 700 ? = 0.05，左检验临界值为负，查得临界值: -Z0.05=-1.645 计算检验统计量：x?μ Z? ?/ n0= (680-700)/(60/√36) = -2决策： ∵Z 值落入拒绝域， ∴在?=0.05 的显著性水平上拒绝 H0，接受 H1 结论：有证据表明这批灯泡的使用寿命低于 700 小时，为不合格产品。 3．某地区小麦的一般生产水平为亩产 250 公斤，其标准差是 30 公斤。现用一种化肥进行试验，从 25 个小区抽样，平均产量为 270 公斤。这种化肥是否使小麦明显增产（α=0.05）？解：已知μ 0 =250，σ = 30，N=25， =270 这里是小样本分布，σ 已知，用 Z 统计量。右侧检验，α =0.05，则 Zα=1.645 提出假设：假定这种化肥没使小麦明显增产。即 H0：μ ≤250 H1: μ ＞ 250 计算统计量：33Z = （ -μ 0）/（σ/√N）= （270-250）/（30/√25）= 3.33 结论：Z 统计量落入拒绝域，在 α =0.05 的显著性水平上，拒绝 H0，接受 H1。决策：有证据表明，这种化肥可以使小麦明显增产。4．糖厂用自动打包机打包，每包标准重量是 100 千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得 9 包重量（单位：千克）如下：（略）已知包重服从正态分布，试检验该日打包机工作是否正常。（α =0.05）解：已知 N=9，这里是小样本正态分布，σ 未知，双侧检验，采用 t 统计量，自由度为 N-1=8。α =0.05，则 Tα/2=2.37 = 99.98≈1.22 提出假设，假设打包机工作正常：即 H0：μ = 100 H1: μ ≠ 100 计算统计量： μ ? x ? t s n0= （99.98-100） / （ 1.22/√9） ≈-0.049结论：∵t 值落入接受域，∴在?=0.05 的显著性水平上接受 H034决策：有证据表明这天的打包机工作正常。5．某种大量生产的袋装食品，按规定不得少于 250 克。今从一批该食品中任意抽取 50 袋，发现有 6 袋低于 250 克。若规定不符合标准的比例超过 5%就不得出厂，问该批食品能否出厂（?=0.05）？解：已知 N=50，P=6/50=0.12，为大样本，右侧检验，用 Z 统计量计算。?=0.05，即 Z?=1.645 H0：丌≤5% H1：丌＞5%z?p ? P0 ~ N (0,1) P0 (1 ? P0 ) = (0.12－0.05)/√(0.05×0.95÷50)≈2.26 n（因为没有找到丌表示的公式，这里用 P0 表示丌 0）结论：因为 Z 值落入拒绝域，所以在?=0.05 的显著性水平上，拒绝 H0，而接受 H1。决策：有证据表明该批食品合格率不符合标准，不能出厂。6．某厂家在广告中声称，该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平 25000 公里。对一个由 15 个轮胎组成的随机样本做了试验，得到样本均值和标准差分别为 27000 公里和 5000 公里。假定轮胎寿命服从正态分布，问该厂家的广告是否真实（?=0.05）？解：N=15， =27000，s=5000，小样本正态分布，σ 未知，用 t 统计量计算。这里是右侧检验，?=0.05，自由度 N-1=14，即 t?=1.7735H0：μ 0 ≤25000 H1：μ ＞25000t ?x? sμ0n= （）/（5000÷√15）≈1.55结论：因为 t 值落入接受域，所以接受 H0 ，拒绝 H1。决策：有证据表明，该厂家生产的轮胎在正常行驶条件下使用寿命与目前平均水平 25000 公里无显著性差异，该厂家广告不真实。7．某种电子元件的寿命 x（单位：小时）服从正态分布。现测得 16 只元件的寿命如下：（略）。问是否有理由认为元件的平均寿命显著地大于 225 小时（?=0.05）？解： = 241.5，= 98.726 由于 N=16，小样本正态分布，σ 未知，用 t 统计量计算。这里是右侧分布，?=0.05，自由度 N-1=15，即 t?=1.753 H0：μ 0 ≤225 H1：μ ＞225t ?x? sμ0n= （241.5-225）/（98.726÷√16）≈0.67结论：因为 t 值落入接受域，所以接受 H0 ，拒绝 H1。决策：有证据表明，元件平均寿命与 225 小时无显著性差异，36不能认为元件的平均寿命显著地大于 225 小时。8．10 装配一个部件时可以采用不同的方法，所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取 12 件产品，记录各自的装配时间(单位：分钟)如下：甲方法：31 34 29 32 35 38 34 30 29 32 31 26 乙方法：26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体，且方差相同。问两种方法的装配时间有无显著不同 (a＝0．05)? 解：建立假设 H0：μ1－μ2=0 H1：μ1－μ2≠0 总体正态，小样本抽样，方差未知，方差相等，检验统计量t?? x1 ? x2 ?sp 1 1 ? n1 n2根据样本数据计算，得 n1 ＝ 12 ， n 2 =12 ， x1 ＝ 31.75 ， s1 ＝ 3.19446 ， x 2 ＝ 28.6667 ，s 2 =2.46183。s2 p ?? n1 ?1? s12 ? ? n1 ?1? s22n1 ? n2 ? 2＝?12 ? 1? ? 0.922162 ? ?12 ? 1? ? 0.710672 ＝8.132612 ? 12 ? 2＝2.648t?? x1 ? x2 ?sp 1 1 ? n1 n2α＝0.05 时，临界点为 t? 2 ? n1 ? n2 ? 2? ＝ t0.025 ? 22? ＝2.074，此题中 t ＞ t? 2 ，故拒绝原假设，认为两种方法的装配时间有显著差异。 8．11 调查了 339 名 50 岁以上的人，其中 205 名吸烟者中有 43 个患慢性气管炎，在 134 名不吸烟者中有 13 人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎” 这种观点(a＝0．05)? 解：建立假设 H0：π1≤π2；H1：π1＞π2 p1＝43/205=0. p2＝13/134=0.097 n2=134 检验统计量z?? p1 ? p2 ? ? d p1 ?1 ? p1 ? p2 ?1 ? p2 ? ?n1 n237＝? 0.2098 ? 0.097 ? ? 0 0.2098 ?1 ? 0. ?1 ? 0.097 ? ?205 134＝3 当 α＝0.05，查表得 z? ＝1.645。因为 z ＞ z? ，拒绝原假设，说明吸烟者容易患慢性气管炎。 8． 12 为了控制贷款规模，某商业银行有个内部要求，平均每项贷款数额不能超过 60 万元。随着经济的发展，贷款规模有增大的趋势。银行经理想了解在同样项目条件下，贷款的平均规模是否明显地超过 60 万元，故一个 n=144 的随机样本被抽出，测得 x =68． 1 万元，s=45。用 a＝0．01 的显著性水平，采用 p 值进行检验。解：H0：μ≤60；H1：μ＞60 已知： x ＝68.1 s=45 由于 n=144＞30，大样本，因此检验统计量：z?x ? ?0 s n＝68.1 ? 60 ＝2.16 45 144由于 x ＞μ，因此 P 值=P（z≥2.16）=1- ? ? 2.16? ，查表的 ? ? 2.16? =0.9846，P 值=0.0154 由于 P＞α＝0.01，故不能拒绝原假设，说明贷款的平均规模没有明显地超过 60 万元。 8．13 有一种理论认为服用阿司匹林有助于减少心脏病的发生，为了进行验证，研究人员把自愿参与实验的 22 000 人随机平均分成两组，一组人员每星期服用三次阿司匹林(样本 1)，另一组人员在相同的时间服用安慰剂(样本 2)持续 3 年之后进行检测，样本 1 中有 104 人患心脏病，样本 2 中有 189 人患心脏病。以 a＝0．05 的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。解：建立假设 H0：π1≥π2；H1：π1＜π2 p1＝104/45 n1=19/18 n2=11000 检验统计量z?? p1 ? p2 ? ? d p1 ?1 ? p1 ? p2 ?1 ? p2 ? ?n1 n2＝? 0.00945 ? 0.01718? ? 0 0.00945 ?1 ? 0.018 ?1 ? 0.01718? ?＝-5 当 α＝0.05，查表得 z? ＝1.645。因为 z ＜- z? ，拒绝原假设，说明用阿司匹林可以降低心脏病发生率。388．15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了 25 名男生和 16 名女生，对他们进行了同样题目的测试。测试结果表明，男生的平均成绩为 82 分，方差为 56 分，女生的平均成绩为 78 分，方差为 49 分。假设显著性水平 α=0．02，从上述数据中能得到什么结论? 解：首先进行方差是否相等的检验：建立假设2 2 H0： ? 12 ＝ ? 2 ；H1： ? 12 ≠ ? 2 2 n1=25， s12 =56，n2=16， s 2 =49F?56 s12 ＝＝1.143 2 49 s2当 α＝0.02 时， F? 2 ? 24,15? ＝3.294， F 1?? 2 ? 24,15? ＝0.346。由于 F 1?? 2 ? 24,15? ＜F ＜ F? 2 ? 24,15? ，检验统计量的值落在接受域中，所以接受原假设，说明总体方差无显著差异。检验均值差：建立假设 H0：μ1－μ2≤0 H1：μ1－μ2＞0 总体正态，小样本抽样，方差未知，方差相等，检验统计量t?? x1 ? x2 ?sp 1 1 ? n1 n22 2根据样本数据计算，得 n1 ＝25， n 2 =16， x1 ＝82， s1 =56， x 2 ＝78， s 2 =49s2 p2 n1 ? 1? s12 ? ? n1 ? 1? s2 ? ＝53.308 ?n1 ? n2 ? 2t?? x1 ? x2 ?sp 1 1 ? n1 n2＝1.711α＝0.02 时，临界点为 t? ? n1 ? n2 ? 2? ＝ t0.02 ? 39? ＝2.125，t＜ t? ，故不能拒绝原假设，不能认为大学中男生的学习成绩比女生的学习成绩好。第十一章一元线性回归11.5 一家物流公司的管理人员想研究货物的运输距离和运输时间的关系，为此，他抽出了公司最近 10 个卡车运货记录的随机样本，得到运送距离(单位：km)和运送时间(单位：天)39的数据如下：运送距离 x 运送时间 y 825 3.5 215 1.0 1 070 4.0 550 2.0 480 1.0 920 3.0 1 350 4.5 325 1.5 670 3.0 1 215 5.0要求： (1)绘制运送距离和运送时间的散点图，判断二者之间的关系形态： (2)计算线性相关系数，说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程，并解释回归系数的实际意义。解：（1）运送时间天可能存在线性关系。（2）相关性x 运送距离（km） x 运送距离（km） Pearson 相关性显著性（双侧） N y 运送时间（天） Pearson 相关性显著性（双侧） N 10 .949(**) 0.000 10 10 1 y 运送时间（天） .949(**) 0.000 10 1**. 在 .01 水平（双侧）上显著相关。y5（）4 3 2 1 250 500 750 x运送距离（km）__40有很强的线性关系。（3）系数(a)非标准化系数模型 1 （常量） x 运送距离（km）a. 因变量: y 运送时间（天）标准化系数 Beta t 0.333 0.949 8.509 显著性 0.748 0.000B 0.118 0.004标准误 0.355 0.000回归系数的含义：每公里增加 0.004 天。11.6 下面是 7 个地区 2000 年的人均国内生产总值（GDP）和人均消费水平的统计数据：地区北京辽宁上海江西河南贵州陕西人均 GDP(元) 22 460 11 226 34 547 4 851 5 444 2 662 4 549 人均消费水平(元) 7 326 4 490 11 546 2 396 2 208 1 608 2 035要求： (1)人均 GDP 作自变量，人均消费水平作因变量，绘制散点图，并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数，说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程，并解释回归系数的实际意义。 (4)计算判定系数，并解释其意义。 (5)检验回归方程线性关系的显著性(a=0.05)。 (6)如果某地区的人均 GDP 为 5 000 元，预测其人均消费水平。 (7)求人均 GDP 为 5 000 元时，人均消费水平 95％的置信区间和预测区间。解：（1）41人均消费水平元1200010000可能存在线性关系。（2）相关系数：相关性人均 GDP（元）人均 GDP（元） Pearson 相关性显著性（双侧） N 人均消费水平（元） Pearson 相关性显著性（双侧） N**. 在 .01 水平（双侧）上显著相关。有很强的线性关系。（3）回归方程：系数(a)非标准化系数模型 1 （常量）人均 GDP（元）a. 因变量: 人均消费水平（元）（）80006000400020000 0
人均GDP（元）__人均消费水平（元） .998(**) 0.00017 .998(**) 0.000 77 17标准化系数 Beta t 5.265 0.998 36.492 显著性 0.003 0.000B 734.693 0.309标准误 139.540 0.00842回归系数的含义：人均 GDP 没增加 1 元，人均消费增加 0.309 元。（4）模型摘要模型 1a. 预测变量:(常量), 人均 GDP（元）。R .998(a)R 方 0.996调整的 R 方 0.996估计的标准差 247.303人均 GDP 对人均消费的影响达到 99.6%。（5）F 检验：ANOVA(b)模型 1 回归平方和 81,444,968.68 0 残差合计 305,795.034 81,750,763.71 4a. 预测变量:(常量), 人均 GDP（元）。 b. 因变量: 人均消费水平（元）df 1均方 81,444,968.68 0 61,159.007F 1,331.692显著性 .000(a)56回归系数的检验：t 检验系数(a)非标准化系数模型 1 （常量）人均 GDP（元）a. 因变量: 人均消费水平（元）标准化系数 Beta t 5.265 0.998 36.492 显著性 0.003 0.000B 734.693 0.309标准误 139.540 0.008（6）某地区的人均 GDP 为 5 000 元，预测其人均消费水平为
元。（7）人均 GDP 为 5 000 元时，人均消费水平 95％的置信区间为[，]，预测区间为[，]。11.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响，收集了过去 12 年的有关数据。通过计算得到下面的有关结果：方差分析表变差来源回归残差总计 df 1 10 11 SS
2866.67 MS
― F 399.1000065 ― ― SignificanceF 2.17E―09 ― ―43参数估计表 Coefficients Intercept XVariable1 363.211 标准误差 62.091 tStat 5..97749 P―value 0..17E―09要求： (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显著性(a＝0.05)。解：（2）R2=0.9756，汽车销售量的变差中有 97.56%是由于广告费用的变动引起的。（3）r=0.9877。（4）回归系数的意义：广告费用每增加一个单位，汽车销量就增加 1.42 个单位。（5）回归系数的检验：p=2.17E―09＜α，回归系数不等于 0，显著。回归直线的检验：p=2.17E―09＜α，回归直线显著。 11.11 从 20 的样本中得到的有关回归结果是：SSR=60，SSE=40。要检验 x 与 y 之间的线性关系是否显著，即检验假设： H 0 : ?1 ? 0 。 (1)线性关系检验的统计量 F 值是多少? (2)给定显著性水平 a＝0.05，Fa 是多少? (3)是拒绝原假设还是不拒绝原假设? (4)假定 x 与 y 之间是负相关，计算相关系数 r。 (5)检验 x 与 y 之间的线性关系是否显著? 解：（1）SSR 的自由度为 k=1；SSE 的自由度为 n-k-1=18；SSR 60 k 因此：F= = 1 =27 SSE 40 n ? k ? 1 18（2） F? ?1,18? = F0.05 ?1,18? =4.41 （3）拒绝原假设，线性关系显著。（4）r=SSR = 0.6 =0.7746，由于是负相关，因此 r=-0.7746 SSR ? SSE（5）从 F 检验看线性关系显著。 11.15 随机抽取 7 家超市，得到其广告费支出和销售额数据如下：超市广告费支出(万元) 销售额(万元)44A B C D E F Gl 2 4 6 10 14 2019 32 44 40 52 53 54要求： (1)用广告费支出作自变量 x，销售额作因变量 y，求出估计的回归方程。 (2)检验广告费支出与销售额之间的线性关系是否显著(a＝0.05)。 (3)绘制关于 x 的残差图，你觉得关于误差项 ? 的假定被满足了吗? (4)你是选用这个模型，还是另寻找一个更好的模型? 解：（1）系数(a)非标准化系数模型 1 （常量）广告费支出（万元）a. 因变量: 销售额（万元）标准化系数 Beta t 6.116 0.831 3.339 显著性 0.002 0.021B 29.399 1.547标准误 4.807 0.463（2）回归直线的 F 检验：ANOVA(b)模型 1 回归残差合计a. 预测变量:(常量), 广告费支出（万元）。 b. 因变量: 销售额（万元）平方和 691.723 310.277 1,002.000df 1 5 6均方 691.723 62.055F 11.147显著性 .021(a)显著。回归系数的 t 检验：系数(a)非标准化系数模型 1 （常量）广告费支出（万元）a. 因变量: 销售额（万元）标准化系数 Beta t 6.116 0.831 3.339 显著性 0.002 0.021B 29.399 1.547标准误 4.807 0.463显著。（3）未标准化残差图：4510.000005.00000Unstandardized Residual0.00000-5.00000-10.00000-15. 10 15 20广告费支出（万元）__标准化残差图：1.00000Standardized Residual0.00000-1.00000-2. 10 15 20广告费支出（万元）46学生氏标准化残差图：2.000001.00000Studentized Residual0.00000-1.00000-2. 10 15 20广告费支出（万元）看到残差不全相等。（4）应考虑其他模型。可考虑对数曲线模型： y=b0+b1ln(x)=22.471+11.576ln(x)。第十二章2多元线性回归12.2 根据下面 Excel 输出的回归结果，说明模型中涉及多少个自变量、少个观察值？写出2 回归方程，并根据 F，se，R 及调整的 Ra 的值对模型进行讨论。SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差观测值方差分析 df SS MS F Significance F 0....47回归残差总计3 11 148 2 453670 Coefficients 657.311 -0..4714816 11974.84 标准误差 167....4429358.9617590.002724Intercept X Variable 1 X Variable 2 X Variable 3t Stat 3....405847P-value 0....034870解：自变量 3 个，观察值 15 个。? =657.311X1-0.-3. 回归方程： y2 拟合优度：判定系数 R =0.70965，调整的 Ra =0.630463，说明三个自变量对因变量的影响的2比例占到 63%。估计的标准误差 S yx =109.429596，说明随即变动程度为 109.429596 回归方程的检验：F 检验的 P=0.002724，在显著性为 5%的情况下，整个回归方程线性关系显著。回归系数的检验： ?1 的 t 检验的 P=0.008655，在显著性为 5%的情况下，y 与 X1 线性关系显著。?2 的 t 检验的 P=0.222174，在显著性为 5%的情况下，y 与 X2 线性关系不显著。?3 的 t 检验的 P=0.034870，在显著性为 5%的情况下，y 与 X3 线性关系显著。因此，可以考虑采用逐步回归去除 X2，从新构建线性回归模型。? ? ?18.4 ? 2.01x1 ? 4.74 x2 ，并且已知 n＝10， 12.3 根据两个自变量得到的多元回归方程为 ySST＝6 724.125，SSR＝6 216.375， s?? ? 0.0813 ， s?? ＝0.056 7。要求：12(1)在 a=0.05 的显著性水平下， x1 , x2 与 y 的线性关系是否显著? (2)在 a＝0.05 的显著性水平下， ? 1 是否显著? (3)在 a＝0.05 的显著性水平下， ? 2 是否显著? 解（1）回归方程的显著性检验：假设：H0： ?1 = ? 2 =0 H1： ?1 ， ? 2 不全等于 0SSE=SST-SSR=6 724.125-6 216.375=507.7548F=SSR p
= =42.85 SSE n ? p ? 1 507.75 10 ? 2 ? 1F? ? 2,7 ? =4.74，F& F? ? 2,7 ? ，认为线性关系显著。（2）回归系数的显著性检验：假设：H0： ?1 =0 t= H1： ?1 ≠02.01 ?1 = =24.72 S ? 0.08131t? 2 ? n ? p ?1? =2.36， t & t? 2 ? 7 ? ，认为 y 与 x1 线性关系显著。（3）回归系数的显著性检验：假设：H0： ? 2 =0 t= H1： ? 2 ≠04.74 ?2 = =83.6 S ? 0.05672t? 2 ? n ? p ?1? =2.36， t & t? 2 ? 7 ? ，认为 y 与 x2 线性关系显著。12.4 一家电器销售公司的管理人员认为，每月的销售额是广告费用的函数，并想通过广告费用对月销售额作出估计。下面是近 8 个月的销售额与广告费用数据：月销售收入 y(万元) 96 90 95 92 95 94 94 94 电视广告费用工：x1 (万元) 5． 0 2． 0 4． 0 2． 5 3． 0 3． 5 2． 5 3． 0 报纸广告费用 x2(万元) 1.5 2． 0 1． 5 2.5 3． 3 2． 3 4． 2 2． 5要求： (1)用电视广告费用作自变量，月销售额作因变量，建立估计的回归方程。 (2)用电视广告费用和报纸广告费用作自变量，月销售额作因变量，建立估计的回归方程。 (3)上述(1)和(2)所建立的估计方程，电视广告费用的系数是否相同?对其回归系数分别进行解释。 (4)根据问题(2)所建立的估计方程，在销售收入的总变差中，被估计的回归方程所解释的比例是多少? (5)根据问题(2)所建立的估计方程，检验回归系数是否显著(a=0.05)。49? ? 88.64+1.6x 解：（1）回归方程为： y? ? 83.23 ? 2.29x1 ? 1.3x2 （2）回归方程为： y（3）不相同，（1）中表明电视广告费用增加 1 万元，月销售额增加 1.6 万元；（2）中表明，在报纸广告费用不变的情况下，电视广告费用增加 1 万元，月销售额增加 2.29 万元。2 （4）判定系数 R = 0.919，调整的 Ra = 0.8866，比例为 88.66%。2（5）回归系数的显著性检验： Coeffici 标准误 P-valu Lower ents 差 t Stat e 95% Intercept Upper 95% 下限 95.0% 上限 95.0%1. 4.57E- 79.8 83. 08 3 5 79.85电视广告费用工： x1 0.8 0.56 3.07180 (万元) 2. 99 53 1 6 1..071806 报纸广告费用 x2( 万 0.6 0.59 2.12537 元) 1. 97 61 9 9 0..125379 假设：H0： ?1 =0 t= H1： ?1 ≠0?1 2.29 = =7.53 S ? 0.3041t0.025 ?5? =2.57， t & t0.025 ?5? ，认为 y 与 x1 线性关系显著。（3）回归系数的显著性检验：假设：H0： ? 2 =0 t= H1： ? 2 ≠0? 2 1.3 = =4.05 S ? 0.322t0.025 ?5? =2.57， t & t0.025 ?5? ，认为 y 与 x2 线性关系显著。12.5 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下：收获量 y(kg／hm ) 2 250 3 450 4 500 6 750 7 200 7 500 8 2502降雨量 x1(mm) 25 33 45 105 110 115 12050温度 x2(℃) 6 8 10 13 14 16 17要求： (1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。 (2)解释回归系数的实际意义。 (3)根据你的判断，模型中是否存在多重共线性?? ? -0.591 ? 22.386x1 ? 327.672x2 解：（1）回归方程为： y（2）在温度不变的情况下，降雨量每增加 1mm，收获量增加 22.386kg／hm ，在降雨量 2 不变的情况下，降雨量每增加 1 度，收获量增加 327.672kg／hm 。（3） x1 与 x 2 的相关系数 rx1x2 =0.965，存在多重共线性。 12.9 下面是随机抽取的 15 家大型商场销售的同类产品的有关数据(单位：元)。企业编号 l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 l l 1 1 1 1 1 1 l l 1 1 1 1 销售价格 y l 238 266 200 193 106 303 313 144 286 084 120 156 083 263 246 购进价格 x1 966 894 440 664 791 852 804 905 77l 511 505 85l 659 490 696 销售费用 x2 223 257 387 310 339 283 302 214 304 326 339 235 276 390 3162要求： (1)计算 y 与 x1、y 与 x2 之间的相关系数，是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性关系? (2)根据上述结果，你认为用购进价格和销售费用来预测销售价格是否有用? (3)用 Excel 进行回归，并检验模型的线性关系是否显著(a＝0.05)。 2 (4)解释判定系数 R ，所得结论与问题(2)中是否一致? (5)计算 x1 与 x2 之间的相关系数，所得结果意味着什么? (6)模型中是否存在多重共线性?你对模型有何建议? 解：（1）y 与 x1 的相关系数=0.309，y 与 x2 之间的相关系数=0.0012。对相关性进行检验：相关性销售价格购进价格销售费用51销售价格Pearson 相关性显著性（双侧） N10.309 0.2630.001 0.997 15 -.853(**) 0.00015 0.309 0.263 15 0.001 0.997 1515 1购进价格Pearson 相关性显著性（双侧） N15 -.853(**) 0.000 1515 1销售费用Pearson 相关性显著性（双侧） N15**. 在 .01 水平（双侧）上显著相关。可以看到，两个相关系数的 P 值都比较的，总体上线性关系也不现状，因此没有明显的线性相关关系。（2）意义不大。（3）回归统计 Multiple R R Square Adjusted Square 标准误差观测值方差分析 df 回归分析残差总计 2 12 14 SS
MS 5.232 F 3.265842 Significanc e F 0...35246 R 0..Coefficie nts 标准误差 t Stat P-value Lower 95%Upper 95%下限 95.0%上限 95.0%339.14 Intercept 375..3.91 3.91
购进价格 0..5. 1 0.317 0...996365 销售费用 0..68 x2 1. 6 1 0....912001 从检验结果看，整个方程在 5%下，不显著；而回归系数在 5%下，均显著，说明回归方程没有多大意义，并且自变量间存在线性相关关系。 2 2 （4）从 R 看，调整后的 R =24.4%，说明自变量对因变量影响不大，反映情况基本一致。52（5）方程不显著，而回归系数显著，说明可能存在多重共线性。（6）存在多重共线性，模型不适宜采用线性模型。第十三章时间序列分析和预测13.1 下表是 1981 年 ― 1999 年国家财政用于农业的支出额数据年份 83 86 89 1990 支出额（亿元） 110.21 120.49 132.87 141.29 153.62 184.2 195.72 214.07 265.94 307.84 年份 93 96 99 支出额（亿元） 347.57 376.02 440.45 532.98 574.93 700.43 766.39 5.76（ 1）绘制时间序列图描述其形态。（ 2）计算年平均增长率。（ 3 ）根据年平均增长率预测 2000 年的支出额。详细答案：（ 1）时间序列图如下：53从时间序列图可以看出，国家财政用于农业的支出额大体上呈指数上升趋势。（ 2）年平均增长率为：。（ 3）。13.2 下表是 1981 年 ― 2000 年我国油彩油菜籽单位面积产量数据（单位：kg / hm2 ）年份 83 86
单位面积产量 68 00
年份 93 96
单位面积产量 09 67 54（ 1）绘制时间序列图描述其形态。（ 2 ）用 5 期移动平均法预测 2001 年的单位面积产量。（ 3 ）采用指数平滑法，分别用平滑系数 a=0.3 和 a=0.5 预测 2001 年的单位面积产量，分析预测误差，说明用哪一个平滑系数预测更合适？详细答案：（ 1）时间序列图如下：（ 2 ） 2001 年的预测值为：| （ 3 ）由 Excel 输出的指数平滑预测值如下表：指数平滑预测年份单位面积产量 a=0.3 83 51 32
9.5 1.0 08.6 1.0 9.8 1.0 5.1 252.0 误差平方 a=0.5 指数平滑预测误差平方5588 91 94 97 00 合计20 15 96 79 19 ―5.4 0.7 1.4 3.2 3.1 6.4 2.1 1380.2 ―.5 1.5 .1 7.6 87.7 97.7 01.5 455.26.5 1.6 6.7 0.9 5.5 8.9 5.5 1407.2 ―4.3 0.8 .5 5.8 442.8 .4 89.8 91.7 2001 年 a=0.3 时的预测值为：a=0.5 时的预测值为：比较误差平方可知， a=0.5 更合适。13.3 下面是一家旅馆过去 18 个月的营业额数据56月份 1 2 3 4 5 6 7 8 9营业额（万元） 295 283 322 355 286 379 381 431 424月份 10 11 12 13 14 15 16 17 18营业额（万元） 473 470 481 449 544 601 587 644 660（ 1 ）用 3 期移动平均法预测第 19 个月的营业额。（ 2 ）采用指数平滑法，分别用平滑系数 a=0.3 、 a=0.4 和 a=0.5 预测各月的营业额，分析预测误差，说明用哪一个平滑系数预测更合适？（ 3）建立一个趋势方程预测各月的营业额，计算出估计标准误差。详细答案：（ 1 ）第 19 个月的 3 期移动平均预测值为：（ 2）预测营业额月份 a=0.3 误差平方预测误差平方 a=0.4预测误差平方 a=0.512952283295.0144.0295.0144.0295.0144.0573322291.4936.4290.21011.2289.01089.04355300.62961.5302.92712.3305.52450.35286316.9955.2323.81425.2330.31958.16379307.65093.1308.74949.0308.15023.37381329.02699.4336.81954.5343.61401.68431344.67459.6354.55856.2362.34722.39424370.52857.8385.11514.4396.6748.510473386.67468.6400.75234.4410.33928.711470412.53305.6429.61632.9441.7803.112481429.82626.2445.81242.3455.8633.513449445.115.0459.9117.8468.4376.914544446.39547.4455.57830.2458.77274.815601475.615724.5490.912120.5501.49929.416587513.25443.2534.92709.8551.21283.317644535.411803.7555.87785.2569.15611.718660567.98473.4591.14752.7606.52857.5合计――87514.7―62992.5―50236由 Excel 输出的指数平滑预测值如下表： a=0.3 时的预测值：，误差均方＝ 87514.7 。 a=0.4 时的预测值：58，误差均方＝ 62992.5. 。 a=0.5 时的预测值：，误差均方＝ 50236 。比较各误差平方可知， a=0.5 更合适。（ 3 ）根据最小二乘法，利用 Excel 输出的回归结果如下：回归统计Multiple R0.9673R Square0.9356Adjusted R Square0.9316标准误差31.6628观测值18方差分析dfSSMSFSignificance F回归分析1232.39445.99E-1159残差1616040.491002.53总计17Coefficients 标准误差t StatP-valueLower 95%Upper 95%Intercept239.7320315.5705515.39655.16E-11206.7239272.7401X Variable 121.9287931.43847415.244495.99E-1118.8793624.97822。估计标准误差。13.4 下表是 1981 年 ― 2000 年我国财政用于文教、科技、卫生事业费指出额数据年份 83 86 89 支出（万元） 171.36 196.96 223.54 263.17 316.70 379.93 402.75 486.10 553.33 年份 93 96 99 支出（万元） 708.00 792.96 957.77 7.06 3.59 8.06601990617.2920002736.88（ 1）绘制时间序列图描述其趋势。（ 2 ）选择一条适合的趋势线拟合数据，并根据趋势线预测 2001 年的支出额。详细答案：（ 1）趋势图如下：（ 2）从趋势图可以看出，我国财政用于文教、科技、卫生事业费指出额呈现指数增长趋势，因此，选择指数曲线。经线性变换后，利用 Excel 输出的回归结果如下：回归统计Multiple R0.998423R Square0.996849Adjusted R Square0.996674标准误差0.02212561观测值20方差分析dfSSMSFSignificance F回归分析12.7876162.7876165.68E-24残差180.0088110.000489总计192.796427Coefficients 标准误差t StatP-valueLower 95%Upper 95%Intercept2.1636990.010278210.52695.55E-322.1421062.185291X Variable 10.0647450.00085875.464465.68E-240.0629420.066547，指数曲线方程为： 2001 年的预测值为：；。，。所以，。13.5 我国 1964 年～ 1999 年的纱产量数据如下（单位：万吨）：年份 66 1967 纱产量 97.0 130.0 156.5 135.2 年份 78 1979 纱产量 196.0 223.0 238.2 263.5 年份 90 1991 纱产量 465.7 476.7 462.6 460.86270 73 137.7 180.5 205.2 190.0 188.6 196.7 180.3 210.882 85 292.6 317.0 335.4 327.0 321.9 353.5 397.8 436.894 97 501.8 501.5 489.5 542.3 512.2 559.8 542.0 567.0（ 1）绘制时间序列图描述其趋势。（ 2 ）选择一条适合的趋势线拟合数据，并根据趋势线预测 2000 年的产量。详细答案：（ 1）趋势图如下：（ 2 ）从图中可以看出，纱产量具有明显的线性趋势。用 Excel 求得的线性趋势方程为：2000 年预测值为： =585.65 （万吨）。6313.6 对下面的数据分别拟合线性趋势线、二阶曲线。并对结果进行比较。和阶次曲线详细答案：在求二阶曲线时间 t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 观测值 Y 372 370 374 375 377 377 374 372 373 372 369 367 367 365 363 359 358 359 时间 t 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 观测值 Y和三阶曲线时，360 357 356 352 348 353 356 356 356 359 360 357 357 355 356 363 365首先将其线性化，然后用最小二乘法按线性回归进行求解。用 Excel 求得的趋势直线、二阶曲线和三阶曲线的系数如下：64直线 Intercept X Variable 1 374.7二阶曲线 Intercept X Variable 1 X Variable 2 381.2 0.0337三阶曲线 Intercept X Variable 1 X Variable 2 X Variable 3 372.0 -0.6各趋势方程为：线性趋势：二阶曲线：三阶曲线：根据趋势方程求得的预测值和预测误差如下表：直线观测值 Y 时间 t 预测 372 370 374 375 377 377 374 372 373 372 373.5 372.9 372.3 371.7 371.1 370.5 369.9 369.3 368.6 368.0 误差平方 2.4 8.6 2.8 10.8 34.9 42.5 17.1 7.6 19.0 15.8 预测 379.9 378.1 376.5 374.9 373.4 371.9 370.5 369.2 367.9 366.7 误差平方 61.6 66.0 6.1 0.0 13.3 26.1 12.2 7.9 25.7 27.6 预测 373.4 374.0 374.2 374.2 374.0 373.6 373.0 372.2 371.2 370.2 误差平方 2.0 15.6 0.1 0.6 8.9 11.6 1.1 0.0 3.1 3.3 二阶曲线三阶曲线。1 2 3 4 5 6 7 8 9 106511 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33369 367 367 365 363 359 358 359 360 357 356 352 348 353 356 356 356 359 360 357 357 355 356367.4 366.8 366.2 365.6 365.0 364.3 363.7 363.1 362.5 361.9 361.3 360.7 360.0 359.4 358.8 358.2 357.6 357.0 356.4 355.7 355.1 354.5 353.92.5 0.0 0.7 0.3 3.8 28.5 32.8 16.9 6.3 23.9 27.8 75.0 145.1 41.4 7.9 4.9 2.5 4.1 13.2 1.6 3.5 0.2 4.4365.6 364.6 363.6 362.7 361.8 361.0 360.3 359.7 359.1 358.6 358.1 357.8 357.5 357.2 357.0 356.9 356.9 356.9 357.0 357.2 357.4 357.7 358.111.4 5.9 11.6 5.4 1.4 4.2 5.4 0.5 0.8 2.5 4.6 33.2 89.3 17.7 1.1 0.9 0.8 4.4 9.0 0.0 0.2 7.2 4.2369.0 367.7 366.4 365.1 363.7 362.3 361.0 359.7 358.4 357.3 356.3 355.4 354.6 354.0 353.7 353.5 353.6 353.9 354.5 355.5 356.7 358.3 360.30.0 0.6 0.3 0.0 0.5 11.1 8.9 0.5 2.4 0.1 0.1 11.3 43.7 1.1 5.5 6.3 5.9 25.8 29.8 2.3 0.1 11.0 18.46634 35 合计363 365 ―353.3 352.7 ―94.2 151.8 854.9358.5 359.0 ―20.4 36.2 524.7362.7 365.4 ―0.1 0.2 232.1不同趋势线预测的标准误差如下：直线：二阶曲线：三阶曲线：比较各预测误差可知，直线的误差最大，三阶曲线的误差最小。从不同趋势方程的预测图也可以看出，三阶曲线与原序列的拟合最好。13.7 下表是 1981 ― 2000 年我国的原煤产量数据67年份 83 86 89 1990原煤产量（亿吨） 6.22 6.66 7.15 7.89 8.72 8.94 9.28 9.80 10.54 10.80年份 93 96 99 2000原煤产量（亿吨） 10.87 11.16 11.50 12.40 13.61 13.97 13.73 12.50 10.45 9.98（ 1）绘制时间序列图描述其趋势。（ 2 ）选择一条适合的趋势线拟合数据，并根据趋势线预测 2001 年的产量。详细答案：（ 1）原煤产量趋势图如下：从趋势图可以看出，拟合二阶曲线比较合适。（ 2 ）用 Excel 求得的二阶曲线趋势方程为：682001 年的预测值为：。13.8 一家贸易公司主要经营产品的外销业务，为了合理地组织货源，需要了解外销订单的变化状况。下表是 1997 ― 2001 年各月份的外销定单金额（单位：万元）。年/月 1 2 3 4 5 6 7 8 9 10 11 12
46.6 62.6 58.2 57.4 56.6 56.1 52.9 54.6 51.3 54.8 52.1
50.4 59.3 58.5 60.0 55.6 58.0 55.8 55.8 59.8 59.4 55.5
52.0 61.7 61.4 62.4 63.6 63.2 63.9 63.2 63.4 64.4 63.8
54.5 68.0 71.9 69.4 67.7 68.0 66.3 67.8 71.5 70.5 69.4
69.4 76.5 71.6 74.6 69.9 71.4 72.7 69.9 74.2 72.7 72.5（ 1）根据各年的月份数据绘制趋势图，说明该时间序列的特点。（ 2）要寻找各月份的预测值，你认为应该采取什么方法？（ 3 ）选择你认为合适的方法预测 2002 年 1 月份的外销订单金额。69详细答案：（ 1）趋势图如下：从趋势图可以看出，每一年的各月份数据没有趋势存在，但从 1997 ― 2001 年的变化看，订单金额存在一定的线性趋势。（ 2）由于是预测各月份的订单金额，因此采用移动平均法或指数平滑法比较合适。（ 3 ）用 Excel 采用 12 项移动平均法预测的结果为：用 Excel 采用指数平滑法（ a=0.4 ）预测的预测结果为：。。13.9 1993 ― 2000 年我国社会消费品零售总额数据如下（单位：亿元）月/年 1 2 3 4 5 6 7
892.5 942.3 941.3 962.2 .8
7.5 3.7 1.5
3.3 5.4 3.6
0.1 8.3 8.7
0.9 8.2 2.5
9.7 5.2 6.1
3.1 4.0 0.3
7.0 7.0 7.0708 9 10 11 12959.8 1.1 5.56.2 3.8 1932.26.0 5.2 2389.53.5 0.1 2848.69.6 4.9 2881.73.1 2.2 3131.44.3 1.5 3405.74.0 8.0 3680.0（ 1）绘制时间序列线图，说明该序列的特点。（ 2 ）利用分解预测法预测 2001 年各月份的社会消费品零售总额。详细答案：（ 1）趋势图如下：从趋势图可以看出，我国社会消费品零售总额的变具有明显的季节变动和趋势。（ 2）利用分解法预测的结果如下：时间编号 2001 年/月 1 2 3 97 98 99季节指数回归预测值最终预测值1.9 0.95937.50 3098.718.87 2972.48714 5 6 7 8 9 10 11 12100 101 102 103 104 105 106 107 1080.9 0.7 0.4 1.2 1.26941.13 3.54 5.96 8.37 3289.584.88 6.43 6.05 2.77 4175.9513.10 1995 年～ 2000 年北京市月平均气温数据如下（单位：）：月/年 1 2 3 4 5 6 7 8 9 10 11 2.1 7.7 14.7 19.8 24.3 25.9 25.4 19.0 14.5 7.7 -0.4 6.2 14.3 21.6 25.4 25.5 23.9 20.7 12.8 4.2 1.3 8.7 14.5 20.0 24.6 28.2 26.6 18.6 14.0 5.4 2.4 7.6 15.0 19.9 23.6 26.5 25.1 22.2 14.8 4.0 2.2 4.8 14.4 19.5 25.4 28.1 25.6 20.9 13.0 5.9 -1.5 8.1 14.6 20.4 26.7 29.6 25.7 21.8 12.6 3.07212-0.40.9-1.50.1-0.6-0.6（ 1）绘制年度折叠时间序列图，判断时间序列的类型。（ 2 ）用季节性多元回归模型预测 2001 年各月份的平均气温。详细答案：（ 1）年度折叠时间序列图如下：从年度折叠时间序列图可以看出，北京市月平均气温具有明显的季节变动。由于折线图中有交叉，表明该序列不存在趋势。（ 2）季节性多元回归模型为：设月份为。则季节性多元回归模型为：虚拟变量为：，由 Excel 输出的回归结果如下：，??，。系数b0-0.223373b1M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11-0.2 1.2 14.9 25.9 25.3 13.3季节性多元回归方程为：2001 年各月份平均气温的预测值如下：虚拟变量时间年/月 M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 预测17310000000000-3.2274010000000000.9375001000000007.14760001000000014.5745770000100000020.16780000010000024.97790000001000027.28800000000100025.39810000000010020.410820000000001013.51183000000000014.9128400000000000-0.513.11 下表中的数据是一家大型百货公司最近几年各季度的销售额数据（单位：万元）。对这一时间序列的构成要素进行分解，计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。年/季 93 96 99 1 993.1 2.4 4.2 3.6 9.9 2 971.2 2.6 5.9 1.0 7.9 3 7.8 1.1 6.1 0.1
9.6 3.1 0.6 3.1 7865.67520006059.35819.77758.88128.2详细答案：各季节指数如下：1 季度季节指数 0.7517 2 季度 0.8513 3 季度 1.2343 4 季度 1.1627季节变动图如下：根据分离季节因素后的数据计算的趋势方程为：。13.12 下表中的数据是一家水产品加工公司最近几年的加工量数据（单位：t）。对该序列进行分解，计算季节指数、剔除季节变动、计算剔除季节变动后趋势方程。年/月 1 2 3 4 5
78.1 84.0 94.3 97.6
92.1 80.9 94.5 101.4
100.1 114.1 108.2 125.7
73.3 85.3 94.6 74.1
80.0 108.4 118.3 126.8766 7 8 9 10 11 12102.8 92.7 41.6 109.8 127.3 210.3 242.8111.7 92.9 43.6 117.5 153.1 229.4 286.7118.3 89.1 46.1 132.1 173.9 273.3 352.1100.8 106.7 44.0 132.1 162.5 249.0 330.8123.3 117.2 42.0 150.6 176.6 249.2 320.6详细答案：各月季节指数如下：1月 0.6744 7月 0.75522月 0.6699 8月 0.34493月 0.7432 9月 0.96194月 0.7903 10 月 1.19925月 0.8061 11 月 1.86626月 0.8510 12 月 2.3377季节变动图如下：根据分离季节因素后的数据计算的趋势方程为：。7778}

我就爱股票网