内蒙古快3 500期走势|内蒙古快3近200期走势图
平臺介紹
統計方法

統計流程

 

樣本加權算法

在實際統計過程中,樣本結構與總體結構往往難以完全吻合,而不同類型的網民其互聯網行為偏好也存在著差異。在這種情況下,要想較為準確地推斷總體信息,提高估計的精度,就必須對樣本結構進行加權調整。 樣本加權利用樣本的輔助變量,以及既有調查得到的總體輔助變量信息,給每一個樣本賦予一個合適權重,使得加權后的樣本結構盡可能接近總體結構,從而達到提高估計精度的目的。 在選擇輔助變量時,應選擇那些與研究變量有較高相關性的輔助變量,同時輔助變量的總體數據也應該是可以獲得或估算的。中國互聯網數據平臺目前選用的輔助變量包括性別、年齡、學歷、職業、月收入、地理位置等。

實現上,中國互聯網數據平臺采用了“校準加權調整算法”[1]:

記有限總體為U={1,…,k,…,N},S?U為抽取的一個樣本,基于抽樣設計的樣本單元初始權數為d k=1/π k ,其中π k是樣本中第k個單元被抽中的概率。記由多個輔助變量構造的示性向量形式為(X 1,X 2,…,X p)',樣本中第k個單元的示性向量為x k=(x 1k,x 2k,…,x pk)',其中若樣本k在第i類,則x ik=1,否則x ik=0。

用X=∑UXk 表示已知的輔助信息的總體總量,校準加權調整就是根據輔助信息X對dk進行校準得到樣本權重wk,使得在滿足校準方程∑Sx kw k=∑ Ux k 的約束條件下,d k與w k之間的距離最小。若使用距離函數G(x),其中x= w k/d k ,則上述問題轉化為:

其中,λ是拉格朗日乘子。當w k=d kF(x' kλ)時,上式取得最小值,其中F(u)=g -1 (u),g(x)=G' (x)。將w k=d kF(x' kλ)帶入校準方程∑ Sx kw k=∑ Ux k ,可求解得到λ,進而得到w k

在計算過程中,中國互聯網數據平臺選用了指數型距離函數,作為d k與w k之間的距離衡量。

 

參考文獻:

[1]金勇進,薛芳,侯志強.樣本結構性偏差的校準加權調整方法[J].統計與決策,2007,(10):8~10

[2]金勇進,王飛.多變量聯合加權應用研究[J].統計與決策,2002,(10):8~14

[3]金勇進,王飛.校準調整估計量線性和指數距離函數的比較[J].統計與決策,2006,(1):6~7

[4]Deville, J. C. and Sarndal, C. E. Calibration Estimation in Survey Sampling[J]. Journal of the American Statistical Association, 1992, 87: 376-382.

[5]Deville, J. C. Sarndal, C. E. and Sautouy. Generalized Raking Procedures in Survey Sampling[J]. Journal of the American Statistical Association, 1993, 88: 1013-1020.

[6]Li-Chun Zhang. Post-Stratification and Calibration-A Synthesis, the American Statisticaian, 2000, 54(3): 178-184.

[7]Alain Theberge. Extensions of Calibration Estimators in Survey Sampling[J]. Journal of the American Statistical Association, 1999, (94): 635-644.

[8]Oh, H. L. and Scheuren, F. Modified Raking Ratio Estimation, Survey Methodology, 1987, (13): 209-219.

 

關于中國互聯網數據平臺使用的統計方法,我們真誠歡迎任何人提出建議或與我們討論,從而幫助我們不斷改進,相關建議可以發送至郵箱:[email protected]

京ICP備09112257號 版權所有 Copyright ? 2010 CNNIC (建議使用瀏覽器:IE8、Firefox、Google Chrome)
内蒙古快3 500期走势 二八杠游戏网站 环球星娱乐 金都棋牌游戏送50元 双胆技巧 抢庄牛牛游戏斗牛牛 12选五复式投注表 单机麻将免费 赌龙虎有什么规律 近期电子送彩金网址 188金宝慱88金宝搏安卓