前言:本站為你精心整理了社會調查回報率分析及思索范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
本文作者:吳煒作者單位:南京大學
CGSS與GSS的一個比較
風文笑天(2007)對發(fā)表在《社會學研究》上的2004年第2期至2006年第3期所有論文中利用抽樣調查數據撰寫的全部研究中的論文中的回收率進行了統(tǒng)計,發(fā)現在27篇論文中,有8篇沒有報告調查回收率,甚至有4篇沒有辦法通過其他方式計算其回收率。在通過各種方式能夠得到調查回收率的23篇論文中(涉及16項調查),有17篇(屬于11項調查)回收率超過了90%。特別是其中兩項全國范圍的大規(guī)模調查(樣本量在6000份左右)的回收率更是達到了99.2%和99.9%。這兩個調查分別為“中國社會結構變遷調查”和“2003年度中國綜合社會調查(簡稱CGSS)”,筆者選擇對CGSS2003做一分析,原因有三個:一是CGSS的影響范圍較大,是國內目前比較正規(guī)、調查質量比較好的一項全國范圍的調查項目;二是CGSS2003的調查回收率比中國社會結構變遷調查還高,達到驚人的99.9%;三是與筆者的經歷有關,如此高的回收率與筆者所了解的CGSS調查情況完全不符,筆者曾經接觸過CGSS的調查員與督導員,他們給筆者的反饋是調查進行得并不十分順利,經常會被拒訪,這么高的回收率與事實是不符的。筆者認為,比較分析作為一種思維方式和分析方法,能夠更深刻的認識調查回收率。因此,本文將美國綜合社會調查回收率與中國綜合社會調查回收率做一對比分析,以便更好的展現國內調查回收率的現狀。美國的全國綜合調查(簡稱GSS)是一項從1973年開始實行的、面向全美國的、連續(xù)的大型社會調查計劃。在這個調查的支持下,美國芝加哥大學以此為基礎建立了一個規(guī)模龐大的、開放性的抽樣調查數據庫,免費為全世界的社會科學研究者使用,為推動社會科學和社會政策研究的發(fā)展發(fā)揮了重要作用。2003年之前,大型的、連續(xù)開展多年的、開放的全國性數據庫在我國社會科學研究領域還是一個空白。這一年,參照美國GSS,由中國人民大學社會學系和香港科技大學調查研究中心共同推進中國大陸的綜合社會調查(簡稱CGSS)項目啟動,從2003年開始至2008年度的調查是這一項目的第一期(每年一次,其中2007年暫停了一年),目前在中國綜合社會調查項目的官方網站上已經公開了2003~2006年的4次調查數據。在官方網站中,筆者并未看到調查回收率的狀況,甚至連樣本規(guī)模也未作說明,能看到的只是其列出的完成有效樣本規(guī)模。為了計算其調查回收率,筆者查閱了其中國綜合社會調查項目組編寫的《中國綜合社會調查報告(2003~2008)》,在書中對樣本規(guī)模進行了說明,所計算得到的調查回收率具體情況見表1。由表1可知,美國綜合社會調查的歷年計劃調查樣本規(guī)模、完成的有效樣本規(guī)模和回收率都被明確的給出或者可以經過計算得出,都穩(wěn)定在70~80%之間。而中國綜合社會調查通過計算得出以上的回收率結果,讀者稍微看一眼,就肯定會問,為什么CGSS的調查回收率如此奇怪?其回收率接近等于甚至都超過了100%。這也是本文所要分析的第三個問題。
為何CGSS調查回收率如此奇怪
根據調查回收率的定義和計算公式,可知其涉及的是樣本規(guī)模和實際完成的有效樣本量。除非普查或者所有被調查者的特征都一樣,否則所有旨在根據樣本特征來推論總體特征的抽樣調查,都面臨一個如何確定樣本規(guī)模的問題。因為,在一項抽樣調查研究中,按照一般程序,在研究設計階段,研究者在界定了總體之后會制定一個抽樣框,按照一定的規(guī)則從這一抽樣框中抽取樣本。在實際抽取樣本之前,需要確定樣本規(guī)模。一般來說,樣本規(guī)模的大小與總體規(guī)模、估計的把握性與精確性要求、總體的異質性程度以及研究者所擁有的經費、人力和時間有關(風笑天,2009),樣本規(guī)模往往是研究者綜合考慮有關影響因素之后進行主觀判斷的一個結果。以CGSS為例,其計劃調查的總體樣本規(guī)模的大小的確定考慮了很多因素才最終確定的。在中國人民大學中國調查與數據中心中國綜合社會調查項目編組編寫的《中國綜合社會調查報告(2003~2008)》中明確寫到:“綜合考慮精確度、費用以及調查實施的可行性等因素,以及以往若干全國社會調查的經驗,再加上考慮到調查實施中通常會存在一部分戶內找不到、或沒有合格調查對象以及各種原因造成的無回答等情況,根據對回答率的估計,以及總體劃分為五個抽樣框,我們把樣本量確定為10000。這10000個樣本不僅能滿足對總體的估計,而且也能滿足抽樣框各自總體的估計,所以是比較合適的樣本量”(李路路等,2009)。筆者認為,CGSS在研究設計時確定的計劃調查樣本規(guī)模是十分明確的,即10000個,那么根據調查回收率的計算公式,作為分母的計劃調查樣本量為10000個,如果問題并非出在抽樣設計中的樣本規(guī)模這一分母上,那么就只能出在作為分子的完成的有效樣本規(guī)模上。完成的有效樣本規(guī)模表明的是調查的具體開展過程中的完成了多少個有效的樣本量,這涉及到了調查的具體實施過程。根據CGSS歷年調查結果(見表1),可以發(fā)現實際完成的有效樣本規(guī)模居然和計劃完成的樣本規(guī)模幾乎一致、或甚至比計劃完成的樣本規(guī)模還要多。因而,對第三個問題的回答引出了筆者所要分析的第四個問題:在實際實地執(zhí)行過程中發(fā)生了什么,從而導致實際完成的有效樣本規(guī)模出現這樣的情形。
實地執(zhí)行過程中發(fā)生了什么
CGSS依據其抽樣方案(具體抽樣方案見其官方網站或《中國綜合社會調查報告(2003~208)》一書)可以確定到居委會或村委會,在抽中的居委會/村委會中如何抽取居民戶和抽中的居民戶中如何抽取被調查者,則是實地執(zhí)行的內容。那么在這個實地執(zhí)行過程中發(fā)生了什么呢?仔細分析實地執(zhí)行過程的程序,可以發(fā)現問題出現在居民戶抽樣的過程中,如在城市居民戶抽樣中:“隨機選取起點之后(可以是翻一本書看頁數或看一下表等方式),按右手原則,隔六抽一(如果起點是第三戶,中間凈隔六戶,即第二戶應抽取第十戶),同時標注其+1(下一戶)及-1(上一戶)戶地址,并多抽3倍的備用地址”(李路路等,2009)。不難看出,問題就出在最后一段話上面——并多抽3倍的備用地址。那么這些備用地址來干什么的?再看下面一段話:“如果所抽取的地址不夠使用,則由抽樣員在此居委會繼續(xù)抽取,如果該居委會地址全部抽完,訪問中仍然不夠用,則繼續(xù)按右手原則在相鄰居/村委會進行抽取”(李路路等,2009)。這多抽的3倍備用地址是用來干什么的?答案已經很明顯了。由于現實被調查者和調查者的各種特殊情況,總會導致樣本中的某些個體無法成功訪問,或者說總有一部分樣本會訪問失敗,那么多抽的這3倍的備用地址的居民戶就是用來作為替補那么訪問失敗的樣本的,甚至于在多抽的3倍備用地址仍不夠用時,還需繼續(xù)在相鄰的居委會/村委會抽取備用地址以彌補訪問失敗的樣本。為了更好的理解這種備用地址導致所發(fā)生的變化,筆者舉一個例子:一項調查計劃從總體抽取400個調查對象作為樣本,研究者采用結構式訪問的方式收集資料,實地執(zhí)行中訪問了400人,實際成功訪問240人,那么該項調查回收率為60%。而遵循CGSS的方式,則以上調查則變成為:一項調查計劃從總體中抽取400個調查對象作為樣本,研究者采用結構式訪問的方式收集資料,實地執(zhí)行中第一步抽取400人作為調查對象,筆者稱之為樣本1;第二步抽取另外1200人作為替補調查對象,筆者稱之為樣本2;第三步對第一步所抽取的400個樣本進行訪問,如果全部成功則到此結束;如果未能成功,如成功訪問了240人,則缺少的160人,則從第二步選擇的1200人即樣本2中選擇替代者進行訪問,直到訪問成功160人,調查結束。如果這樣本2中的1200人種未能成功訪問160人,則還需要在其它地域如相鄰的居委會抽取人員作為調查對象進行訪問,這部分被抽取的調查對象筆者稱之為樣本3,直到160人滿為止,調查結束。該項的回收率理論上按照調查回收率的公式計算為100%。任何一個讀者看到這里對100%回收率都會存在疑問,即是不是公式本身有問題?筆者認為,問題不是出現在公式上,而是由于實地執(zhí)行過程中的操作導致按照這一個公式進行計算得到的回收率變得毫無意義。根據CGSS的調查方式,原本作為計劃調查樣本的規(guī)模變成了實際調查過的完成的有效樣本規(guī)模,即在計算公式中本應作為分母的樣本規(guī)模變成了作為分子的完成的有效樣本規(guī)模,那么分母在哪里呢?筆者認為,實地執(zhí)行過程中所調查的所有樣本,不論是訪問成功還是訪問失敗,構成實際調查回收率的分母即實際發(fā)生的訪談數量,那么這個分母的數字是究竟為多少呢?從調查的實際過程來看,樣本1肯定是包含在分母中的,樣本2和樣本3也或多或少的包含在分母之中。用公式表示為:實際調查回收率=計劃完成的樣本量(/計劃完成的樣本量+備用樣本的使用量)=樣本1(/樣本1+樣本2(部分或全部)+樣本3(0或部分或全部))從以上公式中可見,分母數字究竟多大,已經很難確定,因為在實地調查的執(zhí)行中一旦完成了樣本1規(guī)模的數量,調查就已經結束,此時,已經調查了的樣本2和樣本3中調查對象屬于分母,尚未調查的樣本2和樣本3中的調查對象不屬于分母。在CGSS調查中,實地執(zhí)行過程是由具體調查單位執(zhí)行的,他們對訪問過程的記錄是不全面和不詳細的,甚至可以說是有問題的,使得這些調查人員究竟調查了多少個樣本2和樣本3,CGSS項目組是無從得知或者很難統(tǒng)計的。一方面,實際調查回收率的分母的確切數字無法得知,導致實際的調查回收率已經成謎;另一方面,CGSS按照回收率的定義進行計算,其調查回收率就變的如此奇怪,甚至調查回收率超過100%。基于以上分析,筆者認為,CGSS在實地執(zhí)行過程中發(fā)生了一些重大改變,樣本規(guī)模被替換了,即實地調查的樣本規(guī)模并非計劃調查的樣本規(guī)模,而是實際發(fā)生的訪談數量。實地執(zhí)行中的樣本規(guī)模除了包含研究設計中計劃調查的樣本量之外,還包含了計劃外的替代樣本,這種將樣本規(guī)模引入實地調查過程的做法,導致的結果是其調查回收率已經不可知了。筆者認為,樣本規(guī)模與調查中的無應答數量是相關的,然而,無應答數量對于樣本規(guī)模的影響是發(fā)生在研究設計階段時確定樣本規(guī)模中的,無應答個案的存在導致樣本規(guī)模會大于研究需要的被調查者數量。
目前國內社會學界社會調查的實地執(zhí)行狀況及思考
抽樣調查是通過樣本來推論總體,樣本的質量直接決定了總體推論的可信度,因此,抽樣調查中必須以規(guī)范調查和提高總體推論可信度為目標。從前一部分的分析中,可知,在目前中國的CGSS實地調查中,發(fā)生了一種樣本替換的過程,導致按照調查回收率的公式計算得到的回收率數據虛高。在前文所提到的另外一個回收率超過99%的調查為陸學藝主持的“中國社會結構變遷調查”,通過仔細查閱相關資料,在其以此調查為基礎出版的《當代中國社會流動》一書中,在介紹研究方法時寫到“調查員持抽樣名單、選樣表和問卷進入被調查戶選擇被訪人;如果選樣順利則繼續(xù)進行訪問,如果選樣失敗,則需要告知督導員,由后者根據備訪戶名單進行更換,再度入戶選樣”(陸學藝,2004)。也即在這個調查中同樣發(fā)生了類似CGSS調查的情況。這種情況的發(fā)生是造成其回收率畸高的原因。以上兩個發(fā)生了樣本替換導致調查回收率虛高的全國性的調查中,都是由較為有名的調研機構和和社會科學研究者所主持的,促使筆者不得不思考是否國內的調查研究在實地執(zhí)行中是否普遍發(fā)生了這種情況。如果這種情況較為普遍,那么有學者指出的國內調查回收率較高的現狀(風笑天,2007)就能夠得到一個較好的解釋。筆者至今參與的大大小小近10項社會調查項目,均為發(fā)生樣本替換導致回收率虛高甚至回收率不可計算。例如邊燕杰所主持的“社會資本與職業(yè)經歷”大型問卷調查,筆者作為調查員參與了這一項目的濟南部分,其抽樣方式和CGSS完全一樣,實地執(zhí)行中也發(fā)生了樣本替換現象,但是在替換樣本的選擇方法上和CGSS有較大差別,CGSS使用的是隨機方法。而這次調查為非隨機方法,具體為其替換樣本為是抽中的戶的上一戶和下一戶(如果訪問失敗,先訪問上一戶,如果繼續(xù)失敗則訪問下一戶,如果仍然失敗,訪問所抽中戶的上上一戶,以此類推)。從筆者的調查對象來看,第一批入戶名單中訪問成功率沒有達到50%,在超過一半的不成功的案例中,拒訪占了絕大部分。在調查完成之后,項目組只是在成功完成的訪問問卷中剔除了一些無效的問卷,得出完成的有效樣本規(guī)模,并最終未計算調查回收率。在國內目前所開展的社會學調查研究中,樣本替換現象較為常見。有相當多的調查對無應答單位進行了替換處理。樣本替換也是社會調查中經常使用的一種方法,使用得當會在很大程度上提高調查的質量。這里并不想專門討論樣本替換問題,筆者想強調的是,這些對無應答單位進行替換處理的調查中,有一些甚至是大部分并未全面保存有關初始應答單位的替換記錄(郝大海,2008),甚至完全沒有這方面的記錄。在這些調查之中,真實的調查回收率已經被隱藏起來了,而根據回收率定義所得到的理論上的回收率卻是虛高的,是不真實的。回收率作為樣本代表性的一個重要指標,缺失或者不真實的狀況將嚴重動搖其研究結論的可靠性。為了保證推論的有效,部分調查研究的調查回收率往往是一個理論上的虛假回收率,并非其實際的回收率,甚至有些調查的回收率可能僅僅是完成的有效樣本規(guī)模與完成的樣本規(guī)模之比(百分比的形式)。調查研究作為社會學研究中最重要的一種“科學”方法,必須遵循一套嚴格的程序,確保資料的信度和效度。但是實地執(zhí)行過程中的對樣本替換的不規(guī)范操作,使這一科學”方法偏離了軌道,無法得出能代表其樣本質量的調查回收率,甚至產生一個虛假的調查回收率。對此,風笑天(2007)認為對于調查中的無回答現象,比較合適的做法是先按照正規(guī)的抽樣設計,將可能的無回答比例考慮進去,計算出相對較大的樣本容量。這樣能方便計算調查回答率。如果要采用樣本替換,則需要研究者實地執(zhí)行過程中,嚴格遵循研究設計,同時要考慮樣本替換對整個調查的影響。在整個調查過程中要全面保存替換記錄,并在調查結果中如實地呈現給讀者。國內一些調查正是由于沒有能夠保存這些數據,而在回收率上出現了問題。在今后的社會調查中,應該制定出保存調查執(zhí)行數據的辦法,嚴格執(zhí)行,以確保調查的信度和質量。