關于抽樣調查方法的比較和總結
關于抽樣調查方法的比較和總結
篇一:幾種抽樣調查方法比較
數理統(tǒng)計是用概率論的思想,方法去解決實際問題.在實際問題中出現的總的研究對象,我們稱為總體,其分布一般是未知的,所以,首先要對總體進行抽樣,以獲取總體的有關信息——樣本,再利用這些信息對總體進行分析.對于如何選取樣本這個問題,經過人們不斷的嘗試、試驗,漸漸地就有了“抽樣論”,“試驗設計”的發(fā)展.1895年,Kiaer在國際統(tǒng)計學(ISI)最早提出了“代表性抽樣”的概念,后來經過Neyman、Hansen和Mahalanobis等人的杰出貢獻,抽樣調查理論與方法在過去的一百年間,已經取得了很大發(fā)展.從概率抽樣方法的發(fā)展和完善到收集信息與控制誤差方面日益復雜的方法的應用,抽樣調查已經取得了很大的進步.特別是近幾十年來,在實踐中實施的大型調查所涌現出的關于抽樣設計和數據分析的難題,更是推動了理論研究的發(fā)展.
在現實生活中,有很多實際問題將會用到數理統(tǒng)計的知識,它會有效地幫助我們分析和論證,從而得到我們需要的信息.為了更加有效地應用這些知識,就需要在總體中選取一個最合適的樣本來為我們服務.從這個方面來說,樣本的選取方法就成了一個至關重要的問題.只有找一個最簡潔又具有代表性的樣本,才能獲得隱藏在數據背后的真相.
本文主要介紹抽樣調查理論,以及抽樣調查的幾種方法,并通過舉例子介紹對比這幾種方法.最后,本文又對抽樣調查的這幾種方法做了簡單的總結和比較,顯示了抽樣調查理論在我們的生活中無處不在的強大生命力.
一、 基本概念
1.抽樣調查.它是一種非全面調查,它是從全部調查研究對象中,抽選一部分單位進行調查,并據以對全部調查研究對象作出估計和推斷的一種調查方法.
2.總體與樣本.總體是我們所研究(調查)的對象的全體.例如在全國兒童情況調查中,全國所有0—14歲的兒童就構成調查的總體.調查的目的是為了得到有關這個總體的某些數據.例如全國兒童總數、每個年齡男女兒童的平均身高和平均體重等.這些有關總體的指標就是調查的目標量.如果進行一次對全國兒童的普查,對每個兒童都進行有關指標的 調查,就可以獲得這些總體目標量的數據,當然這實際上是很難做到的,為此我們按某種方法只從總體中抽取一部分進行調查,這一部分兒童就構成樣本.根據這些樣本數據就可以對總體目標量進行估計.
3.概率抽樣.抽取樣本是抽樣調查中的一個重要方法.最常用且最科學的方法是進行概率抽樣,也稱隨機抽樣.其優(yōu)點是能保證樣本的代表性,避免人為的誤差,而且它可以對抽樣誤差進行估計,從而可以獲得估計的精度.為了抽樣便利,使概率抽樣能夠實施,通常將總體劃分成互不重疊且又窮盡的若干個部分,每個部分稱為一個抽樣單元.
4.誤差與精度.抽樣調查中有兩類誤差,一類是由于調查中獲得的原始數據不正確,抽樣框有缺陷,或在調查中由于種種原因無法得到按方案的全部樣本數據等等,這類誤差統(tǒng)稱為非抽樣誤差;另一類誤差是由于抽樣引起的,即用樣本估計總體所產生的誤差,稱為抽樣誤差.抽樣誤差通常用估計量的均方誤差、標準差(或方差)等來表示.抽樣誤差越小,調查的精度就越高,精度的另一種表示方法是給出總體目標量的置信區(qū)間,即以一定的置信度(也用概率表示,例如95%)表示總體目標量落在一定的范圍內.在相同的置信度下,置信區(qū)間長度愈短,精度就愈高.
二、 抽樣調查的優(yōu)缺點
1.優(yōu)點:①經濟性好,實效性強,適應面廣,準確性高;
、谡{查單位少,代表性強,所需調查人員少;
、鄢檫x的調查樣本數量經過科學的計算確定的,有可靠的保證;
、艹闃诱{查的誤差,是在調查前就可以根據調查樣本數量和總體中各單位之間的差異程度進
2.缺點:①所抽取樣本是否具有代表性是抽樣調查的關鍵;
、诰哂胁环(wěn)定性,有所偏差,存在一定的誤差率;
、鄢闃诱{查也存在調查的誤差和偏誤問題.通常誤差有兩種:一種是工作誤差(也稱登記誤差或調查誤差),一種是代表性誤差(也稱抽樣誤差).
三、 抽樣調查的特點
抽樣調查的本質特點是以部分來說明或代表總體.它是按照科學的原理和計算,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據以代表總體,推斷總體.
四、 基本的抽樣方法
1.簡單隨機抽樣
設一個總體的個體數為N.如果通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的機會相等,就稱這樣的抽樣為簡單隨機抽樣.簡單隨機抽樣是系統(tǒng)抽樣和分層抽樣不可或缺的基礎,如何實施簡單隨機抽樣有兩種常用方法:抽簽法和隨機數表法.用抽簽法抽取樣本過程中,每一個個體被抽到的機會是均等的,這也是一個樣本是否具有良好的代表性的關鍵前提.沒有每個個體機會均等,就沒有樣本的公平性和合理性.同抽簽法抽取樣本一樣,用隨機數表法抽取樣本的過程中, 關鍵也是要保證每一個剩余個體被抽到的機會是均等的,這就要求:隨機數表的確是隨機產生的,不含人為因素在內;在選擇隨機數表中開始位置和方向時,也要保證隨機性,如果在看過隨機數表后再使用,所抽取的樣本就失去了公平性,也就沒有實際意義了.
對于簡單隨機抽樣需要注意:①它是不放回抽樣;②它是逐個地進行抽。虎鬯且环N個體機會均等的抽樣;④簡單隨機抽樣適用于總體中的個體數不多的情況.生活中有許多用抽簽法或類似抽簽法的案例,如搖獎、電視節(jié)目中電話號碼抽獎、納稅憑證抽獎等.抽樣時也要防止出現貌似合理的抽樣方法,如到某星級賓館問卷調查客人的收入情況來推斷該地區(qū)的人均收入,或每隔一周到某一路口調查當地車流量等等.
2.系統(tǒng)抽樣
當總體中的個體數較多時,可將總體平均分成幾個部分,從每個部分抽取一個個體,得到所需的樣本,這樣的抽樣方法稱為系統(tǒng)抽樣.
從總體中抽取一個樣本來估計總體,樣本的抽取是否公平合理固然重要,樣本抽取的方法是否經濟可行也是十分重要的.面對容量很大的總體,抽取的樣本容量顯然不可太小,此時采用簡單隨機抽樣是不經濟也不可行的,這種情況下采用系統(tǒng)抽樣也就更為合理可行.系統(tǒng)抽樣以簡單隨機抽樣為基礎,通過將容量很大的總體分組,只需在某一個組內用簡單隨機抽樣方式來抽取一個個體,然后在一定規(guī)則下就能抽取出全部樣本,在保證公平客觀的前提下簡化抽樣過程.
對于系統(tǒng)抽樣需要注意:①系統(tǒng)抽樣適用于總體中的個體數較多的情況,它與簡單隨機抽樣的聯系在于:將總體均分后的每一部分進行抽樣時,采用的是簡單隨機抽樣;②與簡單隨機抽樣一樣,系統(tǒng)抽樣是等可能抽樣,它是客觀的、公平的;③總體中的個體數恰好能被樣本容量整除時,可用它們的比值行計算,并控制在允許范圍以內,調查結果的準確程度較高.作為系統(tǒng)抽樣的間隔;當總體中的個體數不能被樣本容量整除時,可用簡單隨機抽樣先從總體中剔除少量個體,使剩下的個體數能被樣本容量整除再進行系統(tǒng)抽樣.
3.分層抽樣
一般地,當總體由差異明顯的幾部分組成時,為了使樣本更客觀地反映總體情況,常將總體中的個體按不同的特點分成層次比較分明的幾部分,然后按照各部分所占的比例實施抽樣,這種抽樣方法叫做分層抽樣,其中所分成的各個部分叫做層.分層抽樣同樣是以簡單隨機抽樣為基礎的一種抽樣方式,對于容量較大、個體差異不明顯的總體通常采用系統(tǒng)抽樣方法,但對于許多容量較大、個體差異較大且明顯分成幾部分的總體,系統(tǒng)抽樣雖然保證公平性和客觀性,但樣本還是不具有良好的代表性,這時就考慮用分層抽樣的方法來抽取樣本.
對于分層抽樣需要注意:①分層抽樣適用于總體由差異比較明顯的幾個部分組成的情況,是等可能抽樣,它也是客觀的、公平的;②分層抽樣是建立在簡單隨機抽樣或系統(tǒng)抽樣的基礎上的,由于它充分利用了已知信息,使樣本具有較好的代表性,而且在各層抽樣時可以根據情況采用不同的抽樣方法,因此在實踐中有著非常廣泛的應用.
五、 簡單例子
Eg1. 某校高一年級有20個班,每班有50名學生.為了了解高一學生的視力狀況,從這1000人中抽取一個容量為100的樣本進行檢查,應該怎樣抽樣?
由分析可得,本例抽取方式可能有:1)以班級為單位,在每個班級內采用隨機抽樣方法來獲取5人樣本,最后匯總形成100人的所需樣本;2)在班級抽樣時,可以將50人按學號分成10組,分別由每組隨機抽出一個個體來組成10人樣本.
這兩種抽樣方式,雖然總體工作量還是大,但每個班級的每個小組的工作量卻很小,也基本能保證樣本的公平性.主要因為參與抽樣的人多了,易受到人為因素影響.如果在某個班級由學號分成的10個小組中任取一個小組來,采用隨機抽樣的方式抽出一名學生,其他小組直接抽出與這位學生學號個位數一致的學生,最后在其余班級中找出與該班級學號一致的學生共同組成樣本.
從而,系統(tǒng)抽樣方法為:先將容量較大的總體平均分成容量較小的幾個小組,在某一個小組內用簡單隨機抽樣的方法來抽取一定個體,再按一定規(guī)則從其他小組抽出同樣數量的個體,最后組成樣本.這樣,使得整個抽樣過程大大簡化.
這個簡單的例子說明:當樣本容量過大時,應該采用系統(tǒng)抽樣的方法,既可簡化工作量,又能夠簡單快速的得到人們想要的結果.
Eg2. 某單位在崗職工共624人,為了調查工人用于上班途中的時間,決定抽取10%的工人進行調查.如何采取抽樣方法完成這一抽樣?
由分析可得,因為此樣本容量過多,符合系統(tǒng)抽樣的要求,且能簡化工作量,因此我們采用系統(tǒng)抽樣的方法. 根據系統(tǒng)抽樣的步驟,由于624的10%約為62,624不能被62整除,為了保證“等距”分段,應剔除4人,得到如下解法:
1) 將624名職工用隨機方式進行編號;
2) 從總體中剔除4人(剔除方法可用隨機數表法),將剩下的620名職工重新編號(分別為000,001,002,??,619),并分成62段;
3) 在第一段000,??,009這十個編號中用簡單隨機抽樣確定起始號碼i0;
4) 將編號為i0,i0+10,??,i0+610的個體抽出,組成樣本.
如果只采用最簡單的隨機抽樣,由于不知道應該抽取多少的個體才會使構成的樣本具有代表性,會產生很多不必要的誤差,所以在這種情況下,采用系統(tǒng)抽樣會更好一點.需要注意的是,系統(tǒng)抽樣適合于容量較大而差異不太大的總體,而現實生活中,許多總體的容量非常龐大,甚至不可數,如測量某一棉田中棉株的平均高度,測量某一路口在某一時段的車流量等,這時用簡單隨機抽樣已無法完成抽樣,那么可以用系統(tǒng)抽樣的方法.測量某一棉田中棉株的平均高度,其樣本的抽取可采用如下方式:先確定所要測量的樣本容量大。╪),測量這塊棉田中所有行的長度之和(S),然后從第一行第一株開始,每隔S/(n-1)距離就測一株棉花的高度,也就能得到全部樣本的高度.測量某一路口在某一時段的車流量,其樣本采集可用類似方式:每隔3天(從測量的第一天開始,在第1,4,7,??天測量),測量n次后,就可獲得一個容量為n的樣本.在確定時間間隔時,要考慮如下因素:車流量變化一般以周為周期,還受季節(jié)氣候的影響.
上述兩個例子表明在使用抽樣方法時,為了使結果客觀、合理、公平,應該把系統(tǒng)抽樣,簡單隨機抽樣以及分層抽樣結合起來,而不是單獨使用其中一種,他們三者之間是相互輔助,相互滲透的關系. Eg3. 某電視臺在因特網上就觀眾對某一節(jié)目的喜愛程度進行調查,參加查的總人數為12000人,其中對于這個問題可以有以下三種解法:
、 采用簡單隨機抽樣方法,其總體容量為12000. 可以隨機抽取60人 進行調查.
、 采用系統(tǒng)抽樣方法,其總體容量為12000.依照系統(tǒng)抽樣的步驟,可先把這12000人編號00000到11999;再每200人分為一組編號零零一組到二零零組;從每組中分別隨機抽取一個個體;抽取的這60個個體就組成了一個樣本;對這組樣本進行調查.
、 采用分層抽樣方法,其總體容量為12000.
“很喜愛”占2415/12000,應取60×2415/12000≈12人;
“喜愛”占4567/12000,應取60×4567/12000≈23人;
“一般”占3926/12000,應取60×3926/12000≈20人;
“不喜愛”占1072/12000,應取60×1072/12000≈5人.
因此,采用分層抽樣的方法在“很喜愛”、“喜愛”、“一般”、“不喜愛”的人中分別抽取12人、23人、20人和5人.然后對這組樣本進行調查.
根據上面的分析解答,由于樣本容量過多,采用簡單的隨機抽樣會使問題不具有代表性,所以不適合采用簡單隨即抽樣;而由于持有不同態(tài)度的人差異較大,進行系統(tǒng)抽樣的話,因喜愛此節(jié)目的人較多,使得在這種情況下選取的樣本不具有公平和等概率性,所以也不適合采用系統(tǒng)抽樣方法;采用分層抽樣,得到的樣本既具有代表性,又具有公平性和隨機性,是最適合的抽樣方法.
六、 小結
系統(tǒng)抽樣是對于樣本容量較大而相互之間差距不是很大的總體比較好,它包括抽樣和估計兩個環(huán)節(jié);而分層抽樣是對于樣本容量較大且差距較明顯的總體比較適合,他包括分層、抽樣和估計三個環(huán)節(jié).簡單隨機抽樣是系統(tǒng)抽樣和分層抽樣得以進行的基礎.在很多問題中,應該把三者結合起來,才會達到更好的效果.它們之間是相輔相成,相互影響的,只有把這三者結合起來,才能使抽樣調查的技術走向前進.
樣本的抽取是否得當對研究總體來說十分關鍵,掌握正確的抽樣方法是十分重要的.抽樣調查是根據數理統(tǒng)計理論建立起來的一種科學的統(tǒng)計調查方法.它雖然是非全面調查,但它的目的卻在于取得反映總體情況的信息資料,因而,也可起到全面調查的作用.抽樣調查在人類活動的許多領域,特別是在社會經濟領域中有著廣泛的應用.
我國目前還處在抽樣調查理論和技術發(fā)展相對落后的階段,僅僅是在國外研究的基礎上稍加改進.但是我相信,在我國相關人士的努力下,我國在這方面一定會奮起直追,研究出新的適合我國國情的抽樣調查理論新方法.
參考文獻:
[1] 盛驟 概率論與數理統(tǒng)計[M] 北京 高等教育出版社 2008
[2] 夏寧茂 新編概率論與數理統(tǒng)計[M] 上海 華東理工大學出版社 2005
[3] 趙雪慧 抽樣調查理論與方法的最新進展[J] 北京 系統(tǒng)與信息論壇 2003.9
[4] 克拉美H 統(tǒng)計學數學方法(魏宗舒等譯)[J] 上海 上?茖W技術出版社 1966
[5] 費史M 概率論于數理統(tǒng)計(王福保譯)[J] 上海 上?茖W技術出版社 1962
[6] 郝向東 淺談系統(tǒng)抽樣與分層抽樣[J] 北京 統(tǒng)計與信息論壇 1996:04
[7] Greg Dickman Business Statistics[J] Nelson 1998
[8] F S Hillier Introduction to Management Science[J] McGraw-Hill Companies Inc 2001
[9] B Efron Bootstrap Methods:Another Look at the Jackknife[J] Annals of statistics 1979:25-26
[10]R Musil,M Baur,W Pfister Testing Practices for the AC Breakdown Voltage “Testing of
Insulation Liquids”[J] IEEE Electrical Insulation Magazine 1995:21-26
[11]E.L.Lehmann Nonparametrics:Statistical Methods Based on Ranks[J]美國Holden-Day公司 1975
[12]Fisher R A Theory of Statistical Estimation Proceedings of the Cambridge Philosophical
Society 1925(22):710-715
[13]Barr D R Darling D A A.Kolmogorov-Smirnov Test for Gensored Samples[J] Technometrics
1973(15):739-757
[14]Kaziol J A Byar D P Percentage Points of the Asymptotic Distributions of one and two Samples
K-S Statistics for Truncated or Censored Date[J] Technometrics 1975(17):507-510
[15]Finklestein J M,Schafer R E Improved Goodness of Fit Tests[J] Biometrika 1971(58):641-645
篇三:抽樣調查及其主要方法
抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。概率抽樣是按照隨機原則進行抽樣,不加主觀因素,組成總體的每個單位都有被抽中的概率(非零概率),可以避免樣本出現偏差,樣本對總體有很強的代表性。非概率抽樣是按主觀意向進行的抽樣(非隨機的),組成總體的很大部分單位沒有被抽中的機會(零概率),使調查很容易出現傾向性偏差。
現代被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查是指概率抽樣,其定義為:抽樣調查,又稱抽樣推斷,是一種重要的、科學的非全面調查方法。它根據調查的目的和任務要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據來推斷總體。
抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:
。1)簡單隨機抽樣(也叫純隨機抽樣,SPS抽樣)。也就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調查單位。特點是:每個樣本單位被抽中的概率相等,樣本的每個單位完全獨立,彼此之間無一定的關聯性和排斥性。簡單隨機抽樣是其他各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數目較少時,才采用這種方法。
。2)等距抽樣(也叫機械抽樣或系統(tǒng)抽樣,SYS抽樣)。是將總體各單位按一定標志或次序排列成為圖形或一覽表式(也就是通常所說的排隊),然后按相等的距離或間隔抽取樣本單位。特點是:抽出的單位在總體中是均勻分布的,而且抽取的樣本可少于純隨機抽樣。等距抽樣既可以用同調查項目相關的標志排隊,也可以用同調查項目無關的標志排隊。等距抽樣是實際工作中應用較多的方法,目前我國城鄉(xiāng)居民收支等調查,都是采用這種方式。
。3)類型抽樣(也叫分層抽樣,STR抽樣)。就是將總體單位按其屬性特征分成若干類型或層,然后在類型或層中隨機抽取樣本單位。特點是:由于通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調查樣本。該方法適用于總體情況復雜,各單位之間差異較大,單位較多的情況。
(4)整群抽樣(又稱集團抽樣)。就是從總體中成群成組地抽取調查單位,而不是一個一個地抽取調查樣本。特點是:調查單位比較集中,調查工作的組織和進行比較方便。但調查單位在總體中的分布不均勻,準確性要差些。因此,在群間差異性(轉 載于:wWW.cSsYq.cOM 書業(yè)網)不大或者不適宜單個地抽選調查樣本的情況下,可采用這種方式。
。5)多階抽樣(又稱多級抽樣)。就是將調查分成兩個或兩個以上的階段進行抽樣。第一階段先將總體按照一定的規(guī)范分成若干抽樣單位,稱之為一級抽樣單位(或稱初級抽樣單位),再把抽中的一級抽樣單位分成若干更小的二級抽樣單位,從抽中的二級抽樣單位再分三級抽樣單位等等,這樣就形成一個多階段抽樣過程。特點是,在對超大而又復雜總體調查的抽樣中實施和管理更加方便,且不需要對每級抽樣單位編制完全的抽樣框。
(6)二重抽樣(又稱兩相抽樣)。就是先抽取一個容量比較大的初始樣本,用初始樣本估計總體的某些參數或某些必要的信息作為分層的比例或再次抽樣的標志,然后將抽出的初始大樣本作為"總體",從中抽取容量合適的樣本進行比較詳細的調查。特點是,適合用于對總體信息了解比較少的調查。
。7)比率抽樣(PPS抽樣)。就是將總體按一種準確的標準劃分出容量不等的具有相同標志的單位在總體中不同比率分配的樣本量進行的抽樣。特點是總體中含量大的部分被抽中的概率也大,可以提高樣本的代表性。
在抽樣調查的實際工作中,經常是要將幾種抽樣方法結合起來應用。比如,城市居民的收支調查,是將二重抽樣、多階段抽樣、分層抽樣、機械抽樣等多種方法結合起來使用。
在現實的商業(yè)性的市場調查中也有非概率抽樣的應用。如,配額抽樣、隨意抽樣、志愿者抽樣、判斷抽樣、修正的概率抽樣和滾雪球抽樣等等,由于這些抽樣方法容易出現偏差,所以只在對共性特別強的群體的商業(yè)性調查中應用。
【抽樣調查方法的比較和總結】相關文章:
細胞結構和功能的實驗研究方法總結07-19
面積和周長的比較優(yōu)秀教學設計(精選10篇)05-09
施工總進度計劃的編制步驟和方法11-25
預防近視的方法總結08-02
腦癱治療的最佳方法總結03-20
關于小升初復習方法總結02-24
css的調試方法與經驗總結03-20
總結的作用和概念03-21
謙辭和敬辭總結09-20
教《學弈》的方法總結(精選11篇)04-10