總體:也被稱為母體,是研究對(duì)象的全體。如對(duì)某一定固定時(shí)間段和固定地點(diǎn)的單位、項(xiàng)目、服務(wù)、居民等的調(diào)查。
抽樣框:是總體中全部單位的物理目錄。
差距(gap):總體中的單位與抽樣框中的單位的差別。
如果縫隙中的單位分布與采樣盒中的單位分布相同,那么縫隙就沒(méi)有問(wèn)題。但是,如果間隙中的單位分布與取樣盒中的單位分布不同,那么取樣盒的分析就會(huì)出現(xiàn)系統(tǒng)偏差。例如,如果18歲以上紐約城市居民的抽樣框架是選民登記名單,而名單上18歲及以上人口的分布(抽樣框架)與不在名單上的人口分布(gap)不同,那么對(duì)名單上選民的統(tǒng)計(jì)分析就可能包含偏差。這種差異可能會(huì)有一些影響。例如,進(jìn)行一項(xiàng)調(diào)查以確定對(duì)移民的態(tài)度,但選民登記名單不包括尚未成為公民的居民。
樣本是總體的一部分,被選擇用來(lái)收集信息,然后為描述總體提供依據(jù)。與一般普查不同,統(tǒng)計(jì)抽樣程序側(cè)重于收集一般人口中的一小部分?jǐn)?shù)據(jù)。例如,從一個(gè)由10000個(gè)應(yīng)收賬款組成的數(shù)據(jù)列表或抽樣框中,選取50個(gè)應(yīng)收賬款組成樣本。最終樣本應(yīng)提供可用信息,用于估計(jì)整個(gè)采樣框架的特征。
使用抽樣調(diào)查有四個(gè)原因,如下表所示:
樣本有兩種類型:不等概率樣本和等概率樣本。
在不等概率樣本中,項(xiàng)目和個(gè)體的選擇不依賴于抽樣框。因?yàn)椴坏雀怕蕵颖静话闯闃涌蜻x擇單位,所以選擇概率是未知的(比如在某些情況下,被測(cè)對(duì)象有自我選擇行為)。
對(duì)于非等概率樣本,統(tǒng)計(jì)推斷理論不能適用于樣本數(shù)據(jù)。例如,許多公司通過(guò)要求訪問(wèn)其網(wǎng)站的訪問(wèn)者填寫(xiě)電子調(diào)查表并提交來(lái)進(jìn)行調(diào)查。來(lái)自調(diào)查的回答可以提供大量的數(shù)據(jù),但是因?yàn)闃颖景ㄗ赃x的網(wǎng)絡(luò)沖浪者,所以沒(méi)有抽樣框。通常情況下,基于專家的意見(jiàn)(判斷樣本),我們選擇非等概率樣本(便利樣本)是為了方便,或者是因?yàn)槿藗兿M麡颖局械哪承╉?xiàng)目、單位或人達(dá)到預(yù)定的比例(配額樣本)。非等概率樣本都包含未知程度的偏差。出現(xiàn)偏差是因?yàn)闆](méi)有使用取樣盒,然后項(xiàng)目或人的分類可能會(huì)系統(tǒng)性地否定樣本的代表性(缺口)。
非等概率樣本具有方便、快速和低成本的潛在優(yōu)勢(shì)。然而,它們也有兩個(gè)主要缺點(diǎn):潛在的選擇偏差和由此產(chǎn)生的結(jié)果缺乏普遍性。這些缺點(diǎn)遠(yuǎn)遠(yuǎn)大于優(yōu)點(diǎn)。所以,非等概率抽樣法只能用在你想以較低的成本做一個(gè)粗略的估計(jì),或者在小規(guī)模的初始研究或試點(diǎn)研究之后會(huì)有更嚴(yán)格的調(diào)查的時(shí)候。
盡可能使用等概率抽樣,因?yàn)榻y(tǒng)計(jì)推斷可以從一個(gè)等概率樣本中得出。
在等概率抽樣中,項(xiàng)目或個(gè)體是從抽樣框中選出的,因此,群體中的單個(gè)個(gè)體被選中的概率是已知的。
四種最常用的等概率抽樣類型是簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣和整群抽樣。這些采樣方法在成本、準(zhǔn)確性和復(fù)雜性方面各不相同。
天行健管理咨詢公司將在下一篇文章中詳細(xì)介紹這四種等概率抽樣類型。請(qǐng)注意。