样本轮换

2016-12-03 推荐阅读 阅读:

【一】:不同样本轮换方法的比较(35)

不同样本轮换方法的比较

金勇进 栾文英

摘要:样本轮换是定期连续性抽样调查中必须面对的一个问题。本文在系统介绍不同样本轮换方法的基础上,对各种方法的特点进行分析和比较,希望对连续抽样调查中样本轮换方法的选取有所启示。

关键词:样本轮换 子样本轮换 永久随机数轮换

随着统计改革的发展,抽样调查成为获取社会政治经济资料的主要方法。对于经常性的抽样调查(如我国的城市住户调查、农村抽样调查、全国的电视收视率调查、规模以下工业抽样调查等),样本的合理更新成为保证调查效率、提高估计精度的重要问题。样本轮换是样本更新最为合理的方法,它是指在定期抽样调查中,将上期样本的一部分单位抛除,同时用过去未被抽中的一部分单位代替它们,与上期样本中保留下来的单位拼配成现期样本进行调查估计。周而复始地重复以上做法,就形成了轮换。样本轮换可以解决固定样本容易产生的“老化”问题,同时兼顾调查资料的连续性和可比性。样本轮换的具体方法种类繁多,概括起来可以分为两类:子样本轮换和永久随机数轮换。本文将对这两类方法进行介绍和讨论,并对其特点进行比较,希望能对连续抽样调查中样本轮换方法的选取有所启示。

一、子样本轮换

子样本轮换是传统的轮换模式,一般可分为两种:单水平轮换、不完全单水平轮换,尤其不完全单水平轮换受到抽样调查专家的普遍关注。 两个时期的样本重叠率取决于样本轮换模式。样本轮换模式是指入选单位保留在样本中的时间模式,轮换模式因为样本单位保留在样本中的时间长度和时间间隔不同而不同。单水平轮换与不完全单水平轮换模式的共同特征是样本中的单位都只提供当期的资料。将这两种轮换模式用aba(m)模式表现出来,即样本单位在样本中保留a个月连续调查,离开样本b个月,然后再回到样本a个月,如此重复m次。如果b0则轮换模式变成“inform”模式,即样本单位只在样本中保留m个月,然后离开样本,不再返回,这就是单水平轮换模式;如果b0,轮换保持aba(m),则是不完全单水平轮换。aba(m)模式可以涵盖绝大部分

第 1 页( 共 7 页)

【二】:样本轮换工作报告(正式文件)

西统发(2011)17号

关于西峰区农产量抽样调查网点

样本轮换工作的报告

国家统计局庆阳调查队:

为了认真贯彻落实甘肃省人民政府办公厅《关于认真做好全省城乡抽样调查样本轮换工作的通知》和“甘统字[2011]6号”通知精神,根据《甘肃省城乡抽

样调查地方调查网点样本轮换工作方案》及《庆阳市农作物抽样调查地方网点样本轮换实施细则》要求,结合我区实际,抽中了8个农产量调查点。现就样本轮换有关工作予以报告。

一、整理抽样框

根据一致性评估结果,对西峰区总体抽样框资料进行核对、整理和校准。一是将2008年国家统计局城乡村级基本单位库中确定的农村村级(含部分居委会)单位编码、名称、城乡分类代码与普查小区抽样框资料进行了核实比较,对抽样框进行了修订。二是对普查后已经全部转为非农的,或已无经营耕地的抽样单元进行了核查并剔除。全区最后确定931个村民小组为本次样本轮换的抽样框。

二、抽选样本

根据分层、确定样本量、排序、抽选样本、检验、优化样本等步骤开展样本抽选工作。一是依据西峰区8乡镇、100个行政村2010年分村粮食平均亩产为主要标识,按照从低到高的顺序,以931个村民小组的耕地面积为辅助标识,采用随机起点,等距抽样的方法进行抽样,全区共抽中8个村民小组(见附表)为新的样本点。二是依据西峰区地理特点、农作物生长特性及历年农作物实际产量的高低,对所抽选的样本进行认真分

析、评估和调整,使其具有较强代表性(代表性检验值为0.23%)。

妥否,请批示。

附:西峰区农产量抽中样本

二〇一一年四月二十一日

主题词:样本 轮换 报告

庆阳市西峰区统计局 2011年4月21日印发 附件:

西峰区农产量抽中样本

【三】:农村抽样调查样本轮换方案

2011年陕西省以市为总体农村抽样调查样本轮换

工作方案及实施细则

2011年陕西省以市为总体农村抽样调查样本轮换工作方案

为推动统计工作科学发展,着力提升统计调查能力,努力提高农村抽样调查数据质量,全面真实反映我省各地农村居民收入情况,圆满完成省委省政府关于“十二五”期间城乡居民收入快速发展的目标任务,今年全省将开展以市为总体农村抽样调查样本轮换工作。为了保证此次样本轮换工作规范有序地运行,确保新样本对各市(区)的代表性,陕西省统计局根据国家统计局农村社会经济司《2010年全国农村抽样调查样本轮换方案》,并结合全省以市为总体城乡居民收入调查工作的具体实际,制定本工作方案。

一、样本轮换的目标和原则 (一)目标

此次样本轮换的目标,一是保持样本代表性。通过对现行农村抽样调查网点进行轮换,增强样本代表性,提高数据质量,达到真实客观反映近年来农村社会经济发展变化的目的。二是提高抽样调查方法的科学性。通过完成以市为总体农村住户调查工作的抽样设计,提升农村抽样调查的业务水平和统计调查能力。

(二)原则

1、随机性原则。样本轮换过程,要始终贯穿并科学运用随机抽

样方法,保证样本轮换工作符合抽样方案的技术规范,不能人为地指定和调整样本点。

2、可比性原则。每次样本轮换,都会面临着目标总体范围、统计概念上的一些变化,抽样设计过程中既要考虑到变化了的总体特性,又要与以往的范围、口径相衔接,使样本轮换前后的抽样数据具有可比性。

3、高效性原则。样本轮换抽样设计方法的改进,就是要提高抽样设计的精度和效率,即在一定调查资源和样本量的约束下,抽选出代表性高的样本,提高样本效率。

二、实施范围

2011年以市为总体农村抽样调查样本轮换工作范围涉及到全省11个市(区)所辖107个县(市、区),市县各级统计部门一律按本方案的要求开展样本轮换工作。

三、抽样方法

由于以市为总体农村住户调查工作涉及全省107个县(市、区),因此住户调查抽样设计以市为总体,原则上采用二阶段自加权抽样方案,即市抽普查小区、普查小区抽户,每个调查县的调查户数按规定由各市确定。

www.fz173.com_样本轮换。

第一阶段即市抽普查小区,由各市对其所辖县(市、区)按抽样框资料中的城乡分类代码和普查小区码进行排序,结合第二次农业普查资料,采用与人口规模成比例(PPS)的抽样方法,抽选三套方案的普查小区,由各县(市、区)在此三套普查小区中任选一套方案,www.fz173.com_样本轮换。

抽取调查户。第二阶段各县(市、区)在选定的普查小区内,用等概率系统抽样方法抽选固定数量的调查户。对于农村常住人口超过20万人的县(市、区),抽取不同村中的8个普查小区,每个普查小区抽取10个调查户。对于农村常住人口未达20万人的县(市、区),抽取不同村中的6个普查小区,每个普查小区抽取10个调查户。原则上各市(区)的样本总量不得低于轮换前的样本总量。各市(区)具体样本量见下表:

(一) 以市为总体农村抽样调查样本轮换工作流程图

2011年陕西省以市为总体农村抽样调查样本轮换实施细则

为了规范有序地做好以市为总体农村住户调查的样本轮换工作,进一步规范农村住户调查工作,提高样本代表性,确保数据质量,特制订农村住户调查样本轮换实施细则。本细则适用于农村住户调查。

一、抽样范围与对象

2011年陕西省以市为总体农村住户类调查的范围包括统计上新的城乡划分中的“乡村”以及“城镇”的涉农地域。具体指,统计上使用的新的城乡划分中“乡村”类别中所有的村委会、居委会、类似村委会、类似居委会1;“城镇”类别中所有的村委会、类似村委会。上述农村住户类调查的范围在本细则中简称为“农村”。

上述农村范围中有关村委会、居委会、类似村委会、类似居委会的界定,按国家统计局“统计用区划代码和城乡划分代码库”中村级单位的代码进行识别和归类。对代码库中称为“社区”、“管委会”等的单位,一律按其村级单位对应代码的码段进行识别,列入村委会码段的按村委会对待,列入居委会码段的按居委会对待。对代码库中的空壳村、即将拆迁的村委会或居委会,经各市核实后不纳入这次样本轮换的抽样范围。

农村住户调查的对象都是农村常住户及常住人口。农村常住户是在当地居住或即将居住时间在6个月以上的家庭户。农村常住人口是

1

对村委会、居委会、类似村委会、类似居委会的界定,按村级单位代码的第10-12位进行确定,居委会为001-199,村委会为200-399,类似居委会为400-497和499,类似村委会为500-597和599。

在当地居住生活半年以上的家庭户成员。

二、抽样方法

由于以市为总体农村住户调查工作涉及全省107个县(市、区),因此住户调查抽样设计以市为总体,原则上采用二阶段自加权抽样方案,即市抽普查小区、普查小区抽户,每个调查县的调查户数按规定由各市确定。

第一阶段:即市抽普查小区,由各市对其所辖县(市、区)按抽样框资料中的城乡分类代码和普查小区码进行排序,结合第二次农业普查资料,采用与人口规模成比例(PPS)的抽样方法,抽选三套方案的普查小区,由各县(市、区)在此三套普查小区中任选一套方案,抽取调查户。

第二阶段:各县(市、区)在选定的普查小区内,用等概率系统抽样方法抽选固定数量的调查户。对于农村常住人口超过20万人的县(市、区),抽取不同村中的8个普查小区,每个普查小区抽取10个调查户。对于农村常住人口未达20万人的县(市、区),抽取不同村中的6个普查小区,每个普查小区抽取10个调查户。原则上各市(区)的样本总量不得低于轮换前的样本总量。

三、工作步骤与具体要求 (一)编制普查小区抽样框

各市统计局根据第二次农业普查资料,提供各市总体范围的涉农普查小区抽样框初步资料。普查小区抽样框初步资料包括以下指标:普查小区代码、普查小区所在村的村码、村名、城乡分类代码、所在

【四】:永久随机数法样本轮换1

永久随机数法样本轮换初探

Study of Sampling Rotation using Permanent Random Numbers

金勇进 栾文英

①②

摘要 本文系统介绍了永久随机数法样本轮换理论,讨论了在等概率、不等概率抽样条件

下永久随机数法样本轮换的具体应用,并将其与传统的子样本轮换方法进行比较,希望能够促进永久随机数法样本轮换在经常性抽样调查中的应用和推广。

关键词 永久随机数 样本轮换 Poisson抽样

Abstractwww.fz173.com_样本轮换。

This article introduces the theory of sampling rotation using permanent random numbers and discusses the uses of sampling rotation using permanent random numbers in sampling with equal probabilities and unequal probabilities. It also compares sampling rotation using permanent random numbers with traditional method of sampling rotation. It hopes to promote the use of sampling rotation using permanent random numbers in regularity surveys.

Key Words

Permanent Random Numbers Sampling Rotation Poisson Sampling

对于经常性的抽样调查(如我国的城市住户调查、农村抽样调查、全国的电视收视率调查、规模以下工业抽样调查等),样本的合理更新是保证调查效率、提高估计精度的重要问题,样本轮换是样本更新最为合理的方法,它是指在定期抽样调查中,将上期样本的一部分单位抛除,同时用过去未被抽中的一部分单位代替它们,与上期样本中保留下来的单位拼配成现期样本进行调查估计。样本轮换可以解决固定样本容易产生的“老化”问题,同时兼顾调查资料的连续性和可比性。传统的子样本轮换在工作中逐渐暴露出其本身固有的弱点,本文对永久随机数法样本轮换进行系统介绍,讨论了在等概率、不等概率抽样条件下永久随机数法样本轮换的具体应用,并将其与传统的子样本轮换方法进行比较,希望能够促进永久随机数法样本轮换在经常性抽样调查中的应用和推广。

一、永久随机数法抽样技术简介

永久随机数(Permanent Random Numbers)法抽样技术在调查中的应用近几年蓬勃兴起,主要集中在农业调查以及能源调查方面。永久随机数法抽样技术是一种有序抽样技术。在这一抽样技术中,抽样框的每个单位都被赋予从区间(0,1)产生的随机数,并保留下来,不再改变。抽样框的所有单位按照随机数的大小排序,随机数具有某一特征的单位将入样。因为随机数被保存下来,因此称之为永久随机数(PRNs)。永久随机数法强调随机数与调查单位的唯一确定性。如果有新调查单位产生,则随即产生与之相对应的新的随机数,并参与到总体排序中;如果有旧①②

金勇进,中国人民大学统计学系教授,博士生导师。 栾文英,中国人民大学统计学系博士生。

的单位消亡则将随机数与单位一起从总体中删除。因而能够实现抽样框的维护。这一过程可以看成将总体各单位赋予随机数,均匀分布在(0,1)之间,于是可以实现抽样的随机性。Ohlsson(1995)曾详细证明这一过程是随机抽样。www.fz173.com_样本轮换。

利用永久随机数进行样本轮换主要是基于随机数的永久性,即随机数赋予单位之后不再改变。永久随机数抽样技术是有序抽样,这种排序实际上是对总体多主题无关标志排序,所以可以实现多主题抽样。样本轮换在永久随机数抽样技术里转化为随机数区间的移动。永久随机数抽样技术在抽取样本时可以抽取随机数最小的n个单位作为样本,也可以抽取随机数落在某一区间的单位作为样本。抽取样本的随机数起点可以不是0,而是0与1之间的任何一个随机数,这是因为(0,1)区间可以看作一个循环系统,当随机数区间的终点(起点加上抽样区间)大于1时,将其减掉1得到的新的数值就会重新落入(0,1)区间。这就是永久随机数法样本轮换的基本原理。当然永久随机数抽样技术还有许多其他的抽样方法,如下面将要谈到的Poisson抽样,这里不再一一介绍。

二、等概率抽样中的样本轮换

对于等概率抽样,Brewer et al.(1972)给出了利用PRNs进行样本轮换的常数平移法,只要在抽样的过程中将起点和终点移动一个特定距离即可。要注意的是,对同一项调查,年度间平移的距离必需为一个常数,否则会破坏样本轮换的一致性。为更形象地阐述样本轮换的原理,下面结合例子予以说明。由20个单位构成的总体当中,抽取50%的单位作为样本,每年轮换50%。将总体按照永久随机数排序,可抽取已有总体的前50%样本单位,或者抽取永久随机数小于50%的单位;此时抽样区间是(0,0.5),样本轮换时,将区间的上下限根据样本轮换率平移,如轮换50%的样本,则第二年抽取随机数在(0.25,0.75)之间的样本单位,第三年抽取永久随机数在(0.5,1.0)的样本单位。抽样及样本轮换结果如表1所示。表1中★表示抽中。由表1不难看出在等概率抽样中,永久随机数法能有效实现样本轮换。

三、不等概率抽样中的样本轮换

在调查单位的规模有较大差异或者调查单位在总体中所占的地位不一致的情况下,通常采用不等概率抽样调查方法。在永久随机数抽样技术中,通常采用的Poisson抽样来实现不等概率抽

www.fz173.com_样本轮换。

样。Poisson抽样的规则是如果iprni(其中i为入样概率,prni为永久随机数),则抽中第i个样本单位。在不等概率抽样,继续采用上述常数平移的做法会不可避免的将入样概率小的单位轮换出样本,而保留了入样概率较大的调查单位。这是因为调查单位对应的永久随机数的产生是随机的,如果入样概率较大,则大于其对应的永久随机数的可能性要比入样概率较小的调查单位大。为了减少入样概率对样本轮换的影响,将调查单位的入样概率引入样本轮换中。设与前一年样本的重复率为,新样本的起点是重复率的函数。定义新样本的终点如下:

liuii

其中,li下一年样本抽选区间的低限点,ui上一年样本抽选区间的高限点,i上一年第i个单位的抽样概率,=前后两年期望的样本重复率。



uilii 或在lii1时,uilii1

其中,ui下一年样本抽样区间的高限点,li上面计算所得的抽样区间中下一年低限点,i下一年第i个单位的抽样概率,如果liPRNui,则抽中该单位。需要注意的是,i是第i个个体的入样概率,对第i个个体而言,i与其规模大小pi成正比,即inpi。在抽样比例较高时,会出现入样概率i1的情形,此时取i1,即该单位为必选单位或者确定性单位,这种单位不再离开样本,这符合目录抽样中某一规模以上的样本单位全部入样的原理。

运用上述理论并结合上例中的数据,同样抽取50%的单位作为样本并每年轮换50%,考察在Poisson抽样中样本轮换的实现。表2是抽样及样本轮换结果。其中样本单位10、15、19时必选样本。需要说明的是Poisson抽样产生的样本量不是确定的量,而是以事先确定的样本量为期望的随机变量。因此在本例中,计划抽取50%的单位,即抽取10个单位作为样本,而实际抽取结果第一年抽到9个单位,第二年抽到9个单位,第三年抽到10个单位,这符合Poisson抽样的特点。由表2不难看出,在Poisson抽样条件下,确定性样本始终保留在样本中,非确定性样本能够有效地实现样本轮换。

四、永久随机数法样本轮换方法述评

相对于传统的子样本轮换,永久随机数法样本轮换的主要优点在于能有效实行抽样框的维护。子样本轮换无法实现抽样框的维护。子样本轮换通常是首先确定轮换组,因而新增样本无法纳入轮换组中,对于消亡的单位,也无法及时从轮换组中剔除。也有人曾提出对于新增样本单位单独列层以实现抽样框的维护,笔者认为这种做法欠妥,因为新增样本的具体情况是随机的,无法事先确定,新增样本层的抽样及轮换方法就无从实现。而永久随机数法样本轮换能有效实现抽样框更新。由于随机数与样本单位有唯一确定性,即随着样本单位的产生而产生,随着样本单位的消亡而消亡,而且各个样本单位独立存在,在样本轮换过程中,只要将新增的单位列入到抽样框中,将消亡的单位与其随机数一并删除,按照前述理论就可以实现样本轮换。需要注意的是,在抽样框发生变动时,要重新计算样本单位的入样概率,以保证对总体估计的精度和可靠性。只有采用永久随机数法抽样技术,才能够有效地维护抽样框,从而为样本轮换提供相对完备的抽样框。

永久随机数法抽样技术不仅能有效地

样本轮换

http://m.zhuodaoren.com/tuijian552751/

推荐访问:

推荐阅读推荐文章

推荐内容

上一篇:新郎婚礼简短致辞 下一篇:怎么知道自己的高考考号