时间:2023-07-27 00:13 所属分类:写作指导 点击次数:
当开展一个调查时,研究者是否应将目标群体的所有人纳入调查范围?一般来说,将目标群体全部调查清楚,不论是从时间还是从可行性上来说都是不现实的。如果研究者决定进行抽样,只调查目标群体的一部分,那么究竟要调查多少人,又如何决定人数才能确保基于该样本的研究能够顺利解决研究问题?为帮助研究者澄清该困惑,阿琳·芬克博士在其著作《调查研究实操指导:细节与示例》中总结了常用于调查研究的抽样方法并简单说明了其优缺点。
一、随机抽样方法
简单随机抽样、分层随机抽样、分层随机整群抽样是三种最常采用的随机抽样方法。
(一)简单随机抽样
简单随机抽样是总体中每个个体具有同等机会被选中的抽样法,总体包含符合调查要求的所有人。下面是一个简单随机抽样的示例。在这个场景中每个人都有同样的机会被选中。总体包含400人,谁会被选中只取决于运气。
你希望从慈善基金会中选择100人调查他们的资助类型。总共有400人可以提供此类信息。你把他们的名字按顺序排好。为每个名字赋予一个001到400的数字。然后,使用随机数表,选择数字最先出现的头100人。
何时需要选择简单随机抽样?简单随机抽样的优点如下:它是所有随机抽样方法中最简单的。能够较为方便地获取帮助,大多数统计教科书中都有易于使用的表格供随机抽样用,还可以选择使用所有统计软件都提供的随机数功能。简单随机抽样的一个主要缺点是其不能被用来对被调查者分群或层(如,60%的男性和40%的女性)。为了确保样本的比例符合你的需求,你可能需要进行分层抽样。
(二)分层随机抽样
在简单随机抽样中,你可以从一个总体中随机地选取一组被访者。在分层随机抽样中,你首先需要把总体细分成亚群或层,然后从每层中选择一定数量或比例的被访者以获得一个样本。举例来说,你可以使用分层随机抽样方法来确保男性和女性具有相同的代表性。你是通过把整群划分成男性和女性的亚群,然后从每个亚群中数的被访者来做到这一点的。这种抽样方法比简单随机抽样更为精确,因为它使群“同质化”,不过仅在正确地选择群时才是如此。
也就是说,不要分别抽取男性和女性,除非你准备在他们之间进行比较。只有事先确信这种比较是有意义的时候才进行这种比较。例如,在一个投票人偏好的调查中,如果你有某些据表明男性和女性的投票不同,此时才需要保证你的调查中包含足够多的男性和女性以进行比较。如果只使用简单随机抽样,你可能发现你的调查样本由于偶然因素而主要是由男性或主要是由女性组成的。下面是如何进行分层随机抽样的例子。
大学健康中心正在考虑开展一个新项目以帮助年轻人减肥。在改变项目前,管理部门打算开展一个调查,以了解新项目与老项目相比如何,以及不同年龄的男女学生的表现。之前的经验显示年纪较大的学生在减肥项目中成效更大。所以,调查者计划抽取一个由两个年龄群——17到22岁和23到28岁的男性和女性组成的样本,然后比较他们在每个项目中的表现。大约310名大学生报名参加健康中心冬季学期的常规减肥项目。在这310名参加者中,140人在17到22岁之间,其中62人是男性。170人在23到28岁之间,其中调查者从个子群(男性、女性、年龄17到22岁以及年龄23到28岁)中分别随机选出40人,然后每隔一人指派一个学生到新项目。
分层随机抽样的一个优点是调查者能够选择一个代表目标总体各种群体和特征模式的样本。分层随机抽样的缺点是它需要比简单随机抽样付出更多努力,且为了产生具有统计意义的结果,它经常需要一个比简单随机抽样更大的样本量。记住,对于每一层或子群体,你可能需要20到30人才能做出有意义的统计比较。
(三)简单随机整群抽样
使用简单随机整群抽样主要是出于管理上的便利,而不是为了增加抽样精度。有时候随机选择个人是不行的。例如,如果每个病房只选择少数病人调查的话,就会打搅到所有的病房。有时候个体的随机选择在管理上是难以实现的。解决个体作为抽样单位带来的问题的一个方法是使用被调查者的群体或群集。在简单随机抽样中,你从所有参与调查的可能个体中随机选择一个子集。整群抽样与随机抽样类似,除了随机指派的是群体而不是个体以外。这种方法假定总体是由自然的或预设的群集或群体组成。以下是其示例。
社区精神健康中心有40个独立的家庭辅导组,每组有大约30个成员中心。主任注意到去年出席率出现下降,因而决定尝试开展一个实验性项目。在该项目中,每个人将在开始治疗前接受单独的检查和问询。这个项目是昂贵的,中心开始的时候只能负担150人的项目费用。从所有群体成员中随机选择个人将会带来抵触和某些群体完整性的破坏。作为替代,采用了简单随机整群抽样的方案,随机选择了5个30人的群体(总共150人)参与实验性项目。每个群体被作为一个群集对待。在6个月后,将实验性项目的效果与传统项目进行了比较。
简单随机整群抽样的优点在于它简化了调查管理。它可以用于随机抽选个体存在不方便或不道德的情形。简单随机整群抽样的缺点是它需要复杂的统计方法去使抽样单位(医院、街道、学校)和分析单位(病人、工作者、学生)相吻合。也就是说,你根据群集(诸如学校)抽样,但却是在个体(诸如学生)层面分析数据。
虽然在上述例子中有150人参与调查,但实际上只有5个单位(5个30人的群体)需要研究。为什么你不能分别研究这150人中的每一个人?当人们处于特殊的群体中——班级、俱乐部、组织——他们倾向于共享相似的特征和观点。这种情况下研究每个人可能是多余的,因为某人可能与另外一个人相似。你需要每个群集有相对数量较多的人,以使这个问题不那么显著,具体需要多少人是一个统计学问题。
二、系统抽样
在系统抽样中,你选择一个数字,比如说5,然后在总体名单中每隔5个名字选择一个。如果名单包含10000个名字,而调查者需要个1000人的样本,那么可以每隔10个名字选一个。假设你有一个500个名字的名单,你希望从中选出100人。你可以随机选择一个1到10之间的数字。如果你选择数字3,你可以从名单中的第3个名字开始每5个名字选择一个。你的样本选择将会是第3个名字、第8个、第13个等,直到选够了100个名字。如果你随机选择“开始”数字,那么系统抽样很像简单随机抽样。
系统抽样中存在风险。名单中可能隐含着某种未被察觉的模式,如果你使用这样的名单,你的样本就很容易因为这种模式而产生偏倚。因此在考虑使用系统抽样时,首先仔细检查可能的被调查者名单。如果研究者怀疑抽样单位(人、教室)的排列或顺序可能带来偏倚,就使用其他抽样方法。
三、方便抽样
如果研究者能够在一定场所中顺利找到愿意参与调查的群体,那么可以采用方便抽样。比如你想了解学生健康服务如何,你计划访谈50名学生。如果你白天站在诊所门口,你可以招募每个经过的人。当你找够50名访谈对象,就有了一个方便抽样。这一抽样会在以下几个方面产生偏倚:愿意接受访谈的学生可能比拒绝的学生更关注健康服务。在你访谈的时间使用服务的学生可能是为了方便;而患病的学生可能晚间使用服务;和你交谈的学生可能有牢骚要去抱怨等。
因为存在偏倚,除非你提供其他证明,否则方便抽样不可信。以下措施可以增进方便抽样的可信度:询问被调查者对健康的关注程度并比较回答,你可能发现没有差别。如果是这样的话,那么你的方便抽样的发现就获得了支持。晚间访问诊所了解使用服务的学生的健康状况是否与白天的学生不同,你可能发现没有差别。同样,如果这样的话,你的抽样获得支持。询问学生他们是否有所抱怨,询问学生的满意度,询问学生为什么拒绝参与,是否因为现在没有时间。从年龄、性别等方面比较参与和未参与的学生。如果没有发现差别,你的方便抽样的发现相对更容易获得支持。如果发现差别,你需要重新考虑你的抽样方法。
小结
为了获得可信的数据,更建议研究者在确定样本对象使用随机抽样或方便抽样方法。随机抽样代表着客观的选择,可以计算出并确保每个人被选中的概率相当。方便抽样是选择找得到的并且愿意参加调查的人,可能会获得更有助于问题解决的数据,从而顺利解决问题。当然,方便抽样选择程序不能被认为是严格意义上的“客观的”,因为不是每个符合条件的人都有同等的机会,所以研究者最好能够提供相关证明。
上一篇:一篇好的文献综述是什么样的
下一篇:实证论文更规范的结构要素