統(tǒng)計(jì)學(xué)教學(xué)中亟需重論文
無響應(yīng)問題無論在抽樣調(diào)查理論還是實(shí)踐中都是十分重要的問題。然而,我國使用的統(tǒng)計(jì)學(xué)教材極少討論這一問題。本文系統(tǒng)地論述了無響應(yīng)問題引起的后果和對(duì)無響應(yīng)問題的處理方法,希望能引起重視。
一、引言
抽樣調(diào)查是統(tǒng)計(jì)學(xué)課程中的重要內(nèi)容,而無響應(yīng)(Nonresponse)問題是抽樣調(diào)查中的重要問題!盁o響應(yīng)”也稱為“無回答”。概括地說,無響應(yīng)是指在抽樣調(diào)查中無法從所有的樣本單位及問卷中的所有項(xiàng)目獲得有效數(shù)據(jù)。無響應(yīng)可具體分為兩種類型,一種是“單位無響應(yīng)”,一種是“項(xiàng)目無響應(yīng)”。單位無響應(yīng)是指被調(diào)查單位沒有接受調(diào)查;而項(xiàng)目無響應(yīng)是指被調(diào)查單位雖然接受了調(diào)查,但對(duì)調(diào)查中的某些項(xiàng)目沒有給出有效的回答。在我國使用的經(jīng)濟(jì)管理類統(tǒng)計(jì)學(xué)教材(包括引入的國外教材)中,基本上都沒有涉及這方面的內(nèi)容,個(gè)別討論到的,也只是很簡單的幾句話。
但是,“無響應(yīng)”在實(shí)際的抽樣調(diào)查中是經(jīng)常碰到的問題。如果學(xué)生不了解這方面的知識(shí),就不知道該如何處理;而直接使用帶有“無響應(yīng)”問題的調(diào)查問卷,后果將很嚴(yán)重。筆者認(rèn)為,經(jīng)濟(jì)管理類統(tǒng)計(jì)學(xué)教材中亟需增加無響應(yīng)的后果及其處理方法方面的內(nèi)容。
二、無響應(yīng)的后果
1.無響應(yīng)從兩方面影響推斷結(jié)果。在抽樣調(diào)查中,無響應(yīng)問題會(huì)從如下兩個(gè)方面影響推斷結(jié)果。一方面,由于部分調(diào)查單位或調(diào)查項(xiàng)目無響應(yīng),使得樣本容量減少,從而使估計(jì)量的方差變大。這種后果相對(duì)來說是較容易處理的,比如,可以用補(bǔ)充樣本、事先估計(jì)回答率并由此相應(yīng)增加調(diào)查單位數(shù)量等方法來處理。
另一方面,無響應(yīng)的樣本單位與回答的樣本單位如果在所調(diào)查的項(xiàng)目上存在顯著差異,則會(huì)使得依據(jù)回答樣本單位的數(shù)據(jù)所作的統(tǒng)計(jì)推斷存在偏差,即無響應(yīng)偏差,這是一種系統(tǒng)偏差。這種后果的處理比第一種復(fù)雜得多,但由于它對(duì)調(diào)查結(jié)論的影響很大,我們不能不重視這一問題的研究。事實(shí)上,在實(shí)際調(diào)查中,在回答的樣本單位與無回答的樣本單位(尤其是拒絕回答的樣本單位)之間往往存在著很大的差別。比如,在對(duì)私營企業(yè)的依法納稅情況的抽樣調(diào)查中,回答的樣本單位比無回答的樣本單位(如上所述,含有拒絕回答和提供不合乎要求的回答等單位)通常有較少的偷稅漏稅行為。
2.對(duì)無響應(yīng)誤差的分析。在分析無響應(yīng)誤差的影響問題時(shí),不同統(tǒng)計(jì)學(xué)家持有不同的觀點(diǎn)。兩種通常的觀點(diǎn)分別被稱為無響應(yīng)的“確定論”和“隨機(jī)論”。如果記第i個(gè)總體單位的回答概率為pi,則“確定論”認(rèn)為,總體所有單位有pi=0或pi=1,就是說,總體的N個(gè)單位含有兩類單位,一類是如果被抽中則肯定回答的單位(N1個(gè)),另一類則是如果被抽到肯定不回答的單位(N0個(gè),N=N1+N0)。而“隨機(jī)論”則認(rèn)為對(duì)所有的總體單位有0≤pi≤1,各pi可能取各種不同數(shù)值,而且在大多數(shù)情況下,pi被視為條件概率,即它的大小取決于調(diào)查時(shí)的環(huán)境。無論是從哪種觀點(diǎn)出發(fā),我們都可看到,無響應(yīng)偏差的大小取決于兩個(gè)因素:一個(gè)是回答率;另一個(gè)是回答單位與無響應(yīng)單位在Y變量值之間的差異(這里,Y變量是指對(duì)調(diào)查中具體分析的指標(biāo)的測(cè)度)。而兩種觀點(diǎn)的差別則體現(xiàn)在對(duì)形成回答率的機(jī)制的不同看法。
3.關(guān)于可接受的回答率問題。如上所述,較低的回答率將會(huì)破壞樣本的代表性,從而產(chǎn)生較大的無回答偏差。那么,什么樣的回答率是可以接受的呢?這一問題目前尚沒有一個(gè)明確的、公認(rèn)的結(jié)論。科克倫和伯恩鮑姆(A.Birnbaum)等人認(rèn)為對(duì)一般調(diào)查而言,回答率應(yīng)在90%甚至95%以上。美國廣告研究基金會(huì)則建議郵寄調(diào)查的回答率應(yīng)80%以上。我國學(xué)者盧淑華也持這種看法。愛爾達(dá)斯(Erdos)則認(rèn)為一個(gè)可靠的郵寄調(diào)查應(yīng)有50%以上的回答率,或能用某種方法證實(shí)不回答者與回答者是相似的。萊斯勒(J.T.Lessler)認(rèn)為對(duì)這一問題的回答不應(yīng)是絕對(duì)的.,而應(yīng)考慮多方面因素。她指出應(yīng)結(jié)合如下因素來討論:(1)調(diào)查前對(duì)回答率的期望值,它取決于調(diào)查的內(nèi)容、總體與數(shù)據(jù)收集方式;(2)提高回答率的成本;(3)是否對(duì)無回答采用補(bǔ)救方法以及采用何種方法。(4)調(diào)查內(nèi)容及其結(jié)論的重要性。
應(yīng)該指出的是,在調(diào)查報(bào)告或研究結(jié)果中說明回答率是一項(xiàng)良好的調(diào)查研究應(yīng)有的內(nèi)容。
三、無響應(yīng)問題的處理方法
為了盡量減少無響應(yīng)誤差的影響,統(tǒng)計(jì)學(xué)家們提出了許多的處理方法。這些處理方法可以歸納成兩類,一類是在進(jìn)行統(tǒng)計(jì)分析之前的處理,即在調(diào)查階段的處理,一類是在統(tǒng)計(jì)分析中進(jìn)行的處理,即調(diào)查完成之后的處理。
1.分析前的處理。分析前的處理方法的主要目標(biāo)是提高回答率。主要方法包括:(1)認(rèn)真選聘、培訓(xùn)、督導(dǎo)調(diào)查員。(2)對(duì)被調(diào)查者進(jìn)行適當(dāng)激勵(lì)。(3)由有名望的機(jī)構(gòu)出面組織調(diào)查。(4)多次訪問。(5)改進(jìn)調(diào)查方法。如,科學(xué)地設(shè)計(jì)調(diào)查項(xiàng)目與問卷外觀,以使被調(diào)查者能較輕松地回答問題;調(diào)查前先與被調(diào)查者聯(lián)系;仔細(xì)分析不同受訪者最可能在家的時(shí)間;等等。(6)在無響應(yīng)的樣本單位中再次抽樣。(7)使用隨機(jī)化回答技術(shù)。如果引起無響應(yīng)的主要原因是問卷或某些項(xiàng)目為敏感性問題(如隱性收入、偷稅漏稅、吸毒等),則可用使用隨機(jī)化回答技術(shù)來進(jìn)行調(diào)查。這種調(diào)查技術(shù)通過設(shè)置巧妙的“隨機(jī)化裝置”,使得被調(diào)查者可以說出實(shí)情而調(diào)查者并不會(huì)知道他的回答的真正含義。但調(diào)查者可以由整個(gè)樣本的回答獲得某類人數(shù)所占比重或某敏感性指標(biāo)的均值等的估計(jì)值。
2.分析中的處理。如果由于某些原因未能采用上文所述的分析前的處理方法,或者雖已采用但仍未能達(dá)至足夠高的回答率,我們就需要采取事后的補(bǔ)救措施。各國統(tǒng)計(jì)學(xué)家已為此而提出了許多方法。(1)波利茲-西蒙斯(Politz-Simmons)方法。這種方法是預(yù)先在調(diào)查時(shí)詢問回答者在K個(gè)類似的期間里他有多少期間可以被找到,然后在分析時(shí)用他可被找到的期間數(shù)對(duì)其Y變量值(Y為所研究的指標(biāo)的測(cè)度)作“倒數(shù)加權(quán)”。例如,對(duì)于在調(diào)查的前5天中在相同時(shí)間內(nèi)呆在家里并可以接受調(diào)查的天數(shù)分別為0、1、2、3、4和5的回答者,分別用6/1、6/2、6/3、6/4、6/5、6/6作為其Y變量值的權(quán)數(shù)(分母是前5天可接受調(diào)查的天數(shù)加1,即加上調(diào)查的當(dāng)天)。
這種方法的隱含假設(shè)是在家天數(shù)越少者,其Y變量值越接近不在家者。(2)時(shí)間趨勢(shì)法。這種方法通過考察連續(xù)各批回答者(如郵寄調(diào)查中按時(shí)間先后對(duì)回件分批)的答案,分析其中的趨勢(shì),然后將此趨勢(shì)延伸,以此推測(cè)出無響應(yīng)者的答案。比如,如果各批回答者的收入呈上升趨勢(shì),則推測(cè)無響應(yīng)者的收入是最高的。(3)分組加權(quán)估計(jì)。這種方法要求按某些輔助信息將總體單位分成若干組,使組內(nèi)各單位的Y變量值盡可能相近。在抽樣調(diào)查之后,若出現(xiàn)無響應(yīng)問題,則按各組的單位數(shù)占總體單位數(shù)的比例進(jìn)行加權(quán)調(diào)整。我們用一個(gè)簡化的例子來說明,設(shè)總體分成兩組,第一、二組單位數(shù)分別占總體單位數(shù)的30%與70%。假設(shè)抽樣調(diào)查的結(jié)果如下表。
如果不作加權(quán)調(diào)整,則對(duì)總體的Y變量均值的估計(jì)為:
(3230×300+2110×500)/800=2530
但考慮到第2組的不回答率遠(yuǎn)高于第一組,為減少無響應(yīng)偏差,使用分組加權(quán)估計(jì),則總體的Y變量均值的估計(jì)調(diào)整為:3230×30%+2110×70%=2446。(4)替代方法。概括地說,替代方法是用“精心選擇”的回答單位的數(shù)據(jù)或者用按輔助信息推測(cè)的數(shù)據(jù)來“替代”無響應(yīng)單位數(shù)據(jù)的方式來處理無響應(yīng)問題。而具體的替代方法則多種多樣。
——均值替代法。指將總體分組,用組內(nèi)回答單位的樣本均值替代無響應(yīng)單位的值。這種方式實(shí)質(zhì)上與“分組加權(quán)估計(jì)”方法非常類似。
——完全匹配替代法。使用某些外部來源的記錄來替代無響應(yīng)單位或無響應(yīng)項(xiàng)目的數(shù)據(jù)。如從工商、稅務(wù)、海關(guān)等管理部門取得無響應(yīng)的被調(diào)查企業(yè)的注冊(cè)資本、所得稅、出口貨物情況等來作替代值。
——最后回答者替代法。以最后一批回答者的答案替代無響應(yīng)者的答案。比如,在郵寄調(diào)查中,以幾次追蹤后最后寄回問卷者來代表未回件者。
——演繹估計(jì)法。如果所研究的Y變量與另一變量X存在已知的函數(shù)關(guān)系,即Y=F(X),且可了解到X的值,則可用此方法得出Y的缺失值。
——回歸替代法。如果所研究的Y變量與另外一些變量存在高度的相關(guān)關(guān)系,則可建立一個(gè)回歸模型,并利用回答數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行估計(jì)。然后利用估計(jì)的回歸方程預(yù)測(cè)Y的缺失值。
——“熱層”(Hot-deck)方法。通常用于項(xiàng)目無響應(yīng)。一般做法是對(duì)調(diào)查中的項(xiàng)目缺失值用同一調(diào)查中具有類似背景的回答者的數(shù)值來替代。
——最近距離替代法。通常用于項(xiàng)目無響應(yīng)。這種方法要選擇一些輔助變量及一種距離測(cè)度。它按照輔助變量距離最近的原則選擇替代者。有人認(rèn)為“熱層”方法采用的是非數(shù)值分類的方式,而最近距離替代法采用的是數(shù)值分類方式,因而后者是前者的修正。
幾十年來,統(tǒng)計(jì)學(xué)家們針對(duì)無響應(yīng)問題提出了許多的處理方法,本文難以一一介紹。統(tǒng)計(jì)學(xué)教材應(yīng)按照所針對(duì)的學(xué)生層次、教學(xué)時(shí)間等來選擇介紹適當(dāng)?shù)姆椒ā?/p>
【統(tǒng)計(jì)學(xué)教學(xué)中亟需重論文】相關(guān)文章:
統(tǒng)計(jì)學(xué)教學(xué)模式論文07-04
統(tǒng)計(jì)學(xué)案例教學(xué)論文07-04
高職院校亟需構(gòu)建人性化的教學(xué)體系論文07-05
項(xiàng)目教學(xué)在統(tǒng)計(jì)學(xué)基礎(chǔ)課程中運(yùn)用研究論文04-16
項(xiàng)目教學(xué)在統(tǒng)計(jì)學(xué)基礎(chǔ)課程中運(yùn)用研究的論文04-16
統(tǒng)計(jì)學(xué)專業(yè)實(shí)踐教學(xué)論文04-05
《統(tǒng)計(jì)學(xué)》實(shí)踐教學(xué)探索論文07-04
關(guān)于項(xiàng)目教學(xué)在統(tǒng)計(jì)學(xué)基礎(chǔ)課程中運(yùn)用研究論文04-16