談談統計誤差
如何減少統計誤差,把統計誤差控制在科學合理范圍,是統計理論研究的重要內容,也是統計實踐的重要方面。在統計生產過程中,減少各個環節統計誤差,對確保數據真實準確、提高統計數據質量至關重要。
一、基本概念
統計誤差也稱統計數據誤差,是統計工作實際獲取數據結果與相應客觀真值之間的差距。根據統計生產的主要過程,統計誤差可分為設計誤差、調查誤差和整理誤差,調查誤差是統計誤差的主要來源,實際工作中,如果不加特別說明,統計誤差通常指的是調查誤差。根據統計誤差產生的原因,統計誤差可分為抽樣誤差和非抽樣誤差。根據誤差的表現形式,統計誤差又可分為絕對誤差與相對誤差。
二、統計誤差產生的原因
統計誤差的產生原因多種多樣,既有技術性因素引起的誤差,例如統計方法不科學、統計指標設計不合理造成的誤差;也有非技術性因素導致的誤差,例如統計對象故意謊報,人為干擾統計工作造成的誤差。統計誤差產生的原因可以概括為抽樣誤差和非抽樣誤差。
抽樣誤差是當采用隨機原則從總體中抽取部分個體組成樣本研究總體時,樣本估計值與總體真值之間的差異。抽樣誤差是由樣本抽取隨機性導致的,而不是調查錯誤的結果,只要采用抽樣調查,抽樣誤差就不可避免。全國大型抽樣調查的抽樣誤差一般應控制在 5% 以內,才能保證調查結果的可靠性。
非抽樣誤差是相對于抽樣誤差而言的,指除了抽樣隨機性以外,由于其他多種原因引起的調查結果與總體真值之間的差異。在抽樣調查和全面調查(普查)中都可能存在非抽樣誤差,具體產生的原因包括:
(1)全面調查中由于統計指標、統計分組、調查方法設計不周、調查對象范圍界定不清而產生的涵蓋誤差;
(2)抽樣調查構造抽樣框時,目標總體與抽樣總體不一致所導致的抽樣框誤差;
(3)由于被調查對象無回答造成的無回答誤差;
(4)統計人員填寫調查表錯誤,以及數據錄入、整理、處理等環節中存在錯誤所產生的計量誤差。實踐中,非抽樣誤差通常是上述全部或部分原因綜合作用結果。
三、如何正確理解統計誤差
統計誤差是反映統計數據質量的重要指標。統計誤差越大,準確性越低,統計數據質量越差;統計誤差越小,準確性越高,統計數據質量越好。
首先,統計誤差可以作為評判一項調查結果是否準確可靠的重要依據。當統計誤差被控制在可接受范圍內時,統計推斷的結果才有意義。
其次,統計誤差可以作為對比統計數據質量的重要依據。
四、如何控制統計誤差
對于全面調查,控制統計誤差的主要措施有:
(1)提高統計設計的科學性。
(2)加強培訓,提高調查員素質。
(3)降低被調查者的不回答率和回答誤差。
(4)采用先進的信息處理技術,降低數據匯總整理過程中的統計誤差。
對于抽樣調查,重點是控制抽樣誤差,主要措施有:
(1)設計科學合理的抽樣方法。全國大型抽樣調查的抽樣方法通常是簡單隨機抽樣、分層抽樣、整群抽樣、系統抽樣、多階段抽樣等多種方法的組合,保證從總體中抽取出有代表性的樣本。
(2)適當增加樣本量。在其他條件相同的情況下,樣本量越大,抽樣誤差越小,在確定樣本量時還要考慮可承擔的調查成本。