您的当前位置:首页正文

分层随机抽样(答案)

2020-06-04 来源:九壹网
分层随机抽样

一、单选题

1、分层抽样设计效应满足(B)

A、deff1 B、deff1 C、deff1 D、deff1 2、分层抽样的特点是(A)

A、层内差异小,层间差异大 B、层间差异小,层内差异大 C、层间差异小 D、层内差异大

3、下面的表达式中错误的是(D) A、

fh1 B、nhn C、Wh1 D、Nh1

4、在给定费用下估计量的方差V(yst)达到最小,或者对于给定的估计量方差V使得总费用达到最小的样本量分配称为(C)

A、常数分配 B、比例分配 C、最优分配 D、奈曼分配

5、最优分配(Vopt)、比例分配(Vprop)的分层随机抽样与相同样本量的简单随机抽样(Vsrs)的精度之间的关系式为(A)

A、VoptVpropVsrs B、VpropVoptVsrs C、VpropVoptVsrs D、VsrsVpropVopt 6、下面哪种样本量分配方式属于比例分配?( A)

A、

nhnn B、hNhNnNhShchchNh1L

hShC、

nhNSnWSLhh D、hLhh nnNShhWhShh1h17、下面哪种样本量分配属于一般最优分配?( B)

nnnA、h B、hNhNnNhShchchNh1L

hShC、

nhNSnWSLhh D、hLhh nnNhShWhShh1h1二、多选题

1.分层抽样又被称为( BC )

A. 整群抽样 B. 类型抽样 C. 分类抽样 D. 系统抽样 E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD ) A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( ABCD )

A. 常数分配 B. 比例分配 C. 最优分配 D. 奈曼分配 E. 等比分配 4.分层抽样的优点有( ABCDE )

A. 在调查中可以对各个子总体进行参数估计 B. 易于分工组织及逐级汇总 C. 可以提高估计量的精度 D. 实施方便 E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( CE )

A. 层数多一些比较好 B. 层数少一些比较好 C. 层数一般以不超过6为宜 D. 层数一般以4 层为最好 E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( CD ) A.

NS/chnNSnhnn B. hLhh C. kLhh

nNhNnNhShNhSh/chh1h1D.

WS/chnhWSnLhh E. hLhh nnWhShWhSh/chh1h17.事后分层的适用场合有(ABCD )

A. 各层的抽样框无法得到

B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难 C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道 D. 总体规模太大,事先分层太费事 E. 一般场合都可以适用 三、名次解释

1. 分层随机抽样 2. 自加权 3. 最优分配 四、简答题

1. 简述分层随机抽样相对于简单随机抽样的优点。

2. 请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。 3. 怎样分层能提高精度?

4. 总样本量在各层间分配的方法有哪些? 5. 分层的原则及其意义。 五、计算题

1. 抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住户分为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有

财产的9倍,高房租层有4000个住户,低房租层有2000Sh与第h层的均值的平方根成正比。个住户。请问:

(1)包含1000个住户的样本应该如何在这两层中分配?

(2) 若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费用相等)?

2. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。 农场规模(英亩) 0—40 41—80 81—120 121—160 161—200 201—240 农场数Nh 394 461 391 334 169 113 148 2010 平均每一农场的玉米面积Yh 5.4 16.3 24.3 34.5 42.1 50.1 63.8 26.3 标准差Sh 8.3 13.3 15.1 19.8 24.5 26.0 35.2 -- 241 总和或均值

现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问:

(1)按比例分配时,各层的样本量为多少?

(2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等) (3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。

3. 设费用函数具有形式Cc0thnh,其中c0及th均为已知数,请证明当总费用

Wh2Sh22/3固定时,为了使V(yst)达到最小值,nh必与()成比例。并求出下述条件中,一个

th含量为1000的样本所对应的nh。

层 1 2 3 Wh 0.4 0.3 0.3 Sh 4 5 6 th 1 2 4

4. 在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所占的比例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使用的,5%到10%是由管理人员使用的。请问:

(1)你如何把样本单位分配在这三组人之间?

(2)若真正使用者占的比例分别是48%,21%和4%,则估计比例pst的标准误是多少?

(3)n=400的简单随机样本算得的p的标准误是多少?

5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。

高血压患病率调查数据 年龄组 14—25岁 26—40岁 41—60岁 61岁以上

6. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得

2到Sh的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商店,因此,

层权Wh 0.281 0.322 0.213 0.814 层样本量nh 400 650 600 350 ph 0.083 0.174 0.310 0.464 qh 0.917 0.826 0.690 0.536 S3的值只好加以猜测。若S3的实际值是10,当被猜作(a)5, (b) 20时,请分别计算一

下由奈曼分配所得的估计量的V(yst)。并请证明在这两种情况下,与真正的最优值相比,方差中按比例的增量稍大于2%。

层 1 2 3

7. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取10个村作为样本单元,经过调查获得下列数据: 层 村总数 1 1 2 3 4

请估计该地区养牛总头数Y及其估计量的相对标准差s(Y)/Y。

1411 4705 2558 14997 43 50 2 84 147 3 98 62 4 0 87 样本村养牛头数 5 10 84 6 44 7 0 8 124 9 13 56 63 15 10 0 160 220 31 Wh 0.3 0.6 0.1 Sh真值 30 20 10 30 20 5 估计的Sh (1) (2) 30 20 20 158 170 104 0 7 228 262 110 232 139 178 334 17 34 25 34 36 0 25 8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料:

工人 技术人员 行政管理人员 N1=132 N2=92 2=25 S2N3=27 S12=36 S32=9 若总样本量n=30,试用奈曼分配确定各层的样本量。 9. 上题中若实际调查了18个工人、10个技术人员、2个行政人员,其损失的工时数如下: 工人 技术人员 行政管理人员 1,8 8,24,0,0,16,32,4,5,0,24,8,6,0,16,7,4,4,12,3,2,1,8 9,5,8,18,2,0 试估计总的工时损失数并给出它的置信度为95%的置信区间。 10. 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分为平原和山区两层采用分层抽样。同时当年产量和去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产出为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料列在下表中。试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。

平原

样本 1 2 3 4 5 6 去年产量(百斤) 204 143 82 256 275 198 山区 样本 1 2 3 4 5 6 7 8 9 去年产量(百斤) 137 189 119 63 103 107 159 63 87 当年产量(百斤) 150 200 125 60 110 100 180 75 90 当年产量(百斤) 210 160 75 280 300 190 11. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料: 工人 N1=132 S12=36 技术人员 N2=92 S22=25 行政管理人员 N3=27 S32=9 若样本量n=30,试用你乃曼分配确定各层的样本量。 12. 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下: 工人 8,24,0,0,16,32, 6,0,16,7,4,4,9,5,8,18,2,0 技术人员 行政管理人员 4,5,0,24,8,12,3,2,1,8 1,8 试估计总的工时损失数并给出它的置信度为95%的置信区间。 13. 在估计比例问题时:

(1) 假设P=0.5,W1=W2=0.5,则P1和P2为何值时可以使按比例分配的分层抽样精度可以得益20%(即V(pprop)V(psrs)=0.8)

(2) 若P=4%,其中W1=0.05,P1=45%;W2=0.2,P2=5%; W3=0.75, P3=1%.则采用按比例分配的分层抽样比简单随机抽样精度得益有多大?

14. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据 层 1 2 3 4 村总数 1411 4705 2558 14997 样本村养牛头数 1 2 3 4 5 6 7 8 9 10 43 84 98 0 10 44 0 124 13 0 50 147 62 87 84 158 170 104 56 160 228 262 110 232 139 178 334 0 63 220 17 34 25 34 36 0 25 7 15 31 要求:

ˆ)Yˆ (1) 估计该地区养牛总头数Y及其估计量的相对标准误差s(Y(2) 讨论分层抽样与不分层抽样比较效率有否提高。

(3) 若样本量不变采用乃曼分配可以减少方差多少? 15. 用下面的工厂分组资料 按工人人数分组 1—49 50—99 100—249 250—999 1000人以上 工厂数目 18260 4315 2233 1057 567 每工厂产值(万元) 100 250 500 1760 2250 标准差 80 200 600 1900 2500 (1) 若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率: (2) 按工厂数多少分配样本; 按最优(奈曼)分配。

16. 一个样本为1000的简单随机样本,其结果可分为三层,相应的

y2=10.2,12.6,17.1,sh=10.82(各层相同),s2=17.66,估计的层权是wh=0.5,0.3,0.2,

已知这些权数有误差,但误差在5%以内,最不好的情况是Wh=0.525,0.285,0.190或

2Wh=0.475,0.315,0.210,你认为是否需要分层?

17. 设费用函数具有形式CTc0ch1Lhnh,其中c0,ch(h=1,…,L)均为已知数。

22WS试证明当总的费用固定时,为了使V(yst)达到最小,nh必与(hh)23成比例。

ch18. 假设总体包含大小相等的L个层,且N相对于L和n来说很大。Vran表示简单随机样本均值的方差,Vprop表示按比例分配的分层随机抽样时的相应方差。试证明下列两式近似成立:

(1) nVranSh21L(YhY)2 Lh1 (2) nVpropSh

其中 Sh表示层内的平均方差,即Sh

2221L2Sh Lh1

因篇幅问题不能全部显示,请点此查看更多更全内容