主 題:不完全回答數(shù)據(jù)下基尼系數(shù)與缺失機(jī)制的估計(jì)
內(nèi)容簡介:在調(diào)查一個(gè)群體的收入時(shí), 很多時(shí)候會(huì)出現(xiàn)被調(diào)查者拒絕回答或者回答不真實(shí)的情況。這一現(xiàn)象在收入過高或者過低這兩個(gè)極端情況時(shí)越發(fā)明顯,對(duì)于數(shù)據(jù)不完整的情況, 從已有的文獻(xiàn)看來, 通常的做法是將問題假設(shè)為數(shù)據(jù)是左截?cái)嘤覄h失模型。對(duì)其處理的基本思路是借用生存分析中的PL估計(jì)等方法, 先估計(jì)出分布函數(shù)F, 然后利用分布函數(shù)和Lorenz曲線之間的關(guān)系估計(jì)出Lorenz曲線. 而本報(bào)告處理數(shù)據(jù)缺失的情形, 這樣做可以符合調(diào)查實(shí)際更多情況。直觀上, 我們可以想象, 這樣的調(diào)查結(jié)果是有偏差的. 由于缺失了高收入或低收入者的回答, 這樣的偏差會(huì)導(dǎo)致對(duì)個(gè)體間收入差距的估計(jì)偏小, 反映到對(duì)基尼系數(shù)的影響時(shí)就體現(xiàn)為單純依據(jù)樣本計(jì)算出的基尼系數(shù)會(huì)比真實(shí)的基尼系數(shù)偏小. 因此, 僅僅是使用那些回答者的樣本是不夠的, 我們需要再加上缺失機(jī)制等信息, 盡可能地將原始的情況恢復(fù)出來. 假定數(shù)據(jù)缺失機(jī)制與收入水平有關(guān), 即假定不回答的概率與被調(diào)查者的收入有關(guān). 在幾種不同的收入分布模型和缺失機(jī)制下研究了基尼系數(shù)的估計(jì)問題. 模擬研究表明在假定了缺失機(jī)制下對(duì)基尼系數(shù)的估計(jì)更加準(zhǔn)確。 另外,如果通過某種方式已知基尼系數(shù)的真實(shí)值或者范圍,利用現(xiàn)有數(shù)據(jù)我們可以估計(jì)出缺失機(jī)制,從而可以恢復(fù)出真實(shí)的收入分布。
報(bào)告人:房祥忠 教授 博導(dǎo)
教育部統(tǒng)計(jì)學(xué)類教學(xué)指導(dǎo)委員會(huì)副主任委員
中國工業(yè)統(tǒng)計(jì)學(xué)教學(xué)研究會(huì)副會(huì)長
中國現(xiàn)場統(tǒng)計(jì)研究會(huì)空間統(tǒng)計(jì)學(xué)會(huì)理事長
時(shí) 間:2016-03-24 9:00
地 點(diǎn):競慧東樓305
舉辦單位:理學(xué)院