您的当前位置:首页正文

分层随机抽样(答案)

2020-10-25 来源:九壹网


分层随机抽样(答案)

分层随机抽样(答案)

分层随机抽样

一、单选题

1、分层抽样设计效应满足(B )

A 、1deff =

B 、1deff <

C 、1deff ≈

D 、1deff >

2、分层抽样的特点是(A )

A 、层内差异小,层间差异大

B 、层间差异小,层内差异大

C 、层间差异小

D 、层内差异大

3、下面的表达式中错误的是(D ) A 、∑=1

h

f

B 、∑=n

n

h

C 、∑=1

h

W

D 、∑=1

h

N

4、在给定费用下估计量的方差)(st

y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C )

A 、常数分配

B 、比例分配

C 、最优分配

D 、奈曼分配

5、最优分配(opt

V )、比例分配(prop

V )的分层随

机抽样与相同样本量的简单随机抽样(srs

V )的精

度之间的关系式为(A )

A 、srs

prop opt

V V V

≤≤ B 、srs

opt prop

V V V

≤≤

C 、srs

opt prop

V V V

≥≥ D 、opt

prop srs

V V V

≤≤

6、下面哪种样本量分配方式属于比例分配?

( A)

A 、N

n N

n h

h

=

B 、h

L

h h

h

h h

h h

c S N

c S N n

n

∑==

1

C 、∑==

L

h h

h

h

h h

S N

S N n

n 1

D 、∑==

L

h h

h

h

h h

S

W S W n

n 1

7、下面哪种样本量分配属于一般最优分配?( B)

A 、N n N

n

h

h =

B 、h

L

h h

h

h h h h

c S N

c S N n

n

∑==

1

C 、∑==

L

h h

h

h

h h

S N

S N n

n 1

D 、∑==

L

h h

h

h

h h

S

W S W n

n 1

二、多选题

1.分层抽样又被称为( BC )

A. 整群抽样

B. 类型抽样

C. 分类抽样

D. 系统抽样

E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( BCD ) A. 分层比估计 B. 联合比估计 C. 分别回归估计

D.联合回归估计

E. 分别简单估计

3.样本量在各层的分配方式有( ABCD ) A. 常数分配 B. 比例分配 C. 最优分配 D. 奈曼分配 E. 等比分配

4.分层抽样的优点有( ABCDE ) A. 在调查中可以对各个子总体进行参数估计

B. 易于分工组织及逐级汇总

C. 可以提高估计量的精度

D. 实施方便

E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( CE )

A. 层数多一些比较好

B. 层数少一些比较好

C. 层数一般以不超过6为宜

D. 层数一般以 4 层为最好

E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( CD )

A. h h

n n N

N =

B. 1

/h h h

h

h

h

h

h N S c n n N S

c ==

∑ C.

1

k h h L h h

h n N S n

N S ==∑

D. 1

h

h h

L

h

h

h n W S n

W S

==

E. 1

h

h

h

h n n W S

==

7.事后分层的适用场合有(ABCD )

A. 各层的抽样框无法得到

B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难

C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道

D. 总体规模太大,事先分层太费事

E. 一般场合都可以适用

三、名次解释

1. 分层随机抽样

2. 自加权

3. 最优分配

四、简答题

1. 简述分层随机抽样相对于简单随机抽样的优点。

2. 请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。

3. 怎样分层能提高精度?

4. 总样本量在各层间分配的方法有哪些?

5. 分层的原则及其意义。

五、计算题

1. 抽查一个城市的家庭,目的是评估平均每个住户很容易变换为现款的财产金额。住户分

为高房租和低房租的两层。高房租这一层每家拥有的财产被看作是低房租层每家所拥有财产的9倍,

S与第h层的均值的平方根成正比。高房

h

租层有4000个住户,低房租层有2000个住户。请问:

(1)包含1000个住户的样本应该如何在这两层中分配?

(2) 若调查的目的是估计这两层平均每个住户拥有财产的差额,样本应如何分配(假定各层的单位调查费用相等)?

2. 一个县内所有农场按规模大小分层,各层内平均每个年农场谷物(玉米)的英亩数列在下表中。

现要抽出一个包含100个农场的样本,目的是估计该县平均每个农场的玉米面积,请问: (1)按比例分配时,各层的样本量为多少? (2)按最优分配时,各层的样本量为多少?(假定各层的单位调查费用相等)

(3)分别将比例分配、最优分配的精度与简单随机抽样的精确度比较。

3. 设费用函数具有形式0

h

C c t n =+∑,其中0

c 及h

t 均为已知数,请证明当总费用固定时,为了

使()st

V y 达到最小值,h

n 必与

222/3()h

h h W S t

成比例。并求出

下述条件中,一个含量为1000的样本所对应的

h

n 。

4. 在一个商行内,62%的雇员是熟练的或不熟练的男性,31%是办事的女性,7%是管理人员。从商行内抽取由400人组成的一个样本,目的是估计使用某些娱乐设备的人所

占的比例。按照粗略的猜测,这些设备40%到50%是由男性使用的,20%到30%是由女性使用的,5%到10%是由管理人员使用的。请问:

(1)你如何把样本单位分配在这三组人之间?

(2)若真正使用者占的比例分别是48%,21%和4%,则估计比例

p的标准误是多少?

st

(3)n=400的简单随机样本算得的p的标准误是多少?

5. 为调查某个高血压发病地区青少年与成年人高血压患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果见下表。求总体高血压患病率P的估计及其标准差的估计。

高血压患病率调查数据

6. 设计某一类商店销售额的调查,n=550,三层中的两层有以前调查的资料可用来得到2

h

S

的较好的估计值。第三层是一些新开设的商店和以前调查中没有销售额的商店,因此,3

S 的值只

好加以猜测。若3

S 的实际值是10,当被猜作(a )

5, (b) 20时,请分别计算一下由奈曼分配所得的估计量的()st

V y 。并请证明在这两种情况下,

与真正的最优值相比,方差中按比例的增量稍大于2%。

7. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层抽取10个村作为样本单元,经过调查获得下列数据:

请估计该地区养牛总头数Y 及其估计量的相对标准差()/s Y Y 。

8. 一公司希望估计某一个月内由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,故采用分层随机抽样。已知下列资料:

工人

技术人员

行政管理人员

1

N =132

2

1S =3

6

2

N =92 22

S =25

3

N =27 2

3S =9

若总样本量n=30,试用奈曼分配确定各层的样本量。

9. 上题中若实际调查了18个工人、10个技术人员、2个行政人员,其损失的工时数如下:

试估计总的工时损失数并给出它的置信度为95%的置信区间。

10. 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分为平原和山区两层采用分层抽样。同时当年产量和去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产出为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料列在下表中。试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误,并对上面的两种结果进行比较和分析。

平原

山区

11. 一公司希望估计某一个月内由于事故

引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:

若样本量n=30,试用你乃曼分配确定各层的样本量。

12. 上题中若实际调查了18个工人,10个技术人员,2个行政人员,其中损失的工时数如下:

试估计总的工时损失数并给出它的置信度为95%的置信区间。

13. 在估计比例问题时:

(1) 假设P=0.5,W

1=W

2

=0.5,则P

1

和P

2

为何值

时可以使按比例分配的分层抽样精度可以得益

20%(即)

()(srs prop

p V p

V =0.8)

(2) 若P=4%,其中W 1=0.05,P 1=45%;W 2=0.2,P 2=5%; W 3=0.75, P 3=1%.则采用按比例分配的分层抽样比简单随机抽样精度得益有多大?

14. 调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据

要求:

(1) 估计该地区养牛总头数Y 及其估计量的相对标准误差Y Y s ?)?(

(2) 讨论分层抽样与不分层抽样比较效率有否提高。

(3) 若样本量不变采用乃曼分配可以减少方差多少?

15. 用下面的工厂分组资料

(1) 若欲抽取3000个工厂作样本来估计产值,试比较下列各种分配的效率:

(2) 按工厂数多少分配样本;

按最优(奈曼)分配。

16. 一个样本为1000的简单随机样本,其结果可分为三层,相应的2

y=10.2,12.6,17.1,2h s=10.82(各层相同),2

s=17.66,估计的层权是h w=0.5,0.3,0.2,已知这些权数有误差,但误差在5%以内,最不好的情

况是h

W =0.525,0.285,0.190或h

W =0.475,0.315,

0.210,你认为是否需要分层?

17. 设费用函数具有形式∑=+=L

h h

h T

n c c C

1

0,其中

c ,h

c (h=1,…,L )均为已知数。试证明当总的

费用固定时,为了使)(st

y V 达到最小,

h

n 必与3

22

2)(h

h h c S

W 成比例。

18. 假设总体包含大小相等的L 个层,且N

相对于L 和n 来说很大。

ran

V 表示简单随机样本均值的方差,prop

V 表示按比例分配的分层随机抽样

时的相应方差。试证明下列两式近似成立: (1) ∑=-+=L

h h h

ran Y Y L S nV 1

2

2

)(1

(2) 2

h

prop S nV =

其中 2

h

S 表示层内的平均方差,即∑==L h h

h

S L S

1

221

因篇幅问题不能全部显示,请点此查看更多更全内容