• 1. §2.6 异方差性 Heteroskedasticity一、异方差性的概念 二、异方差性的后果 三、异方差性的检验 四、异方差性的估计 五、案例
    • 2. 回归分析,是在对线性回归模型提出若干基本假设的条件下,应用普通最小二乘法得到了无偏的、有效的参数估计量。 但是,在实际的计量经济学问题中,完全满足这些基本假设的情况并不多见。 如果违背了某一项基本假设,那么应用普通最小二乘法估计模型就不能得到无偏的、有效的参数估计量,OLS法失效,这就需要发展新的方法估计模型。 如果随机误差项序列不具有同方差性,即出现异方差性。说 明
    • 3. 一、异方差的概念
    • 4. 1、异方差的概念即对于不同的样本点,随机误差项的方差不再是常数,则认为出现了异方差性。
    • 5. 2、异方差的类型 同方差性假定的意义是指每个i围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个i的方差保持相同,即 i2 =常数 在异方差的情况下, i2已不是常数,它随X的变化而变化,即 i2 =f(Xi)
    • 6. 异方差一般可归结为三种类型:(1)单调递增型: i2随X的增大而增大; (2)单调递减型: i2随X的增大而减小; (3)复 杂 型: i2与X的变化呈复杂形式。
    • 7. 3、实际经济问题中的异方差性 在该模型中, i的同方差假定往往不符合实际情况。对高收入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定目的而储蓄),差异较小。 因此,i的方差往往随Xi的增加而增加,呈单调递增型变化。 例如:在截面资料下研究居民家庭的储蓄形为 Yi=0+1Xi+i Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
    • 8. 一般情况下:居民收入服从正态分布,处于中等收入组中的人数最多,处于两端收入组中的人数最少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那么对于不同的样本点,随机误差项的方差随着解释变量观测值的增大而先减后增,出现了异方差性。 例如,以绝对收入假设为理论假设、以截面数据作样本建立居民消费函数: Ci= 0+1Yi+i 将居民按照收入等距离分成n组,取组平均数为样本观测值。
    • 9. 例如,以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3eI 产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,为复杂型的一种。
    • 10. 二、异方差性的后果
    • 11. 1、参数估计量非有效 普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。因为在有效性证明中利用了 E(NN’)=2I 而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。
    • 12. 以一元线性回归模型为例进行说明:(1)仍存在无偏性:证明过程与方差无关
    • 13. (2)不具备最小方差性
    • 14. (本页无文本内容)
    • 15. 2、变量的显著性检验失去意义在该统计量中包含有随机误差项共同的方差,并且有t统计量服从自由度为(n-k-1)的t分布。如果出现了异方差性,t检验就失去意义。 其它检验也类似。
    • 16. 3、模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质; 另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2。 所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
    • 17. 三、异方差性的检验
    • 18. 1、检验方法的共同思路 由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。 问题在于用什么来表示随机误差项的方差
    • 19. 一般的处理方法:
    • 20. 2、图示检验法(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)
    • 21. 看是否形成一斜率为零的直线
    • 22. 3、解析法(1)戈德菲尔德-匡特(Goldfeld-Quandt)检验 G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。 G-Q检验的思想: 先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差之比构造统计量进行异方差检验。 由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。
    • 23. G-Q检验的步骤:①将n对样本观察值(Xi,Yi)按解释变量观察值Xi的大小排队 ②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2
    • 24. (本页无文本内容)
    • 25. (2)戈里瑟(Gleiser)检验与帕克(Park)检验戈里瑟检验与帕克检验的思想: 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
    • 26. 注意: 由于f(Xj)的具体形式未知,因此需要进行各种形式的试验。
    • 27. 四、异方差性的估计 ——加权最小二乘法(WLS) Weighted Least Squares
    • 28. 1、加权最小二乘法的基本思想 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。 例如,在递增异方差下,对来自较小Xi的子样本,其真实的总体方差较小,Yi与回归线拟合值之间的残差ei的信度较大,应予以重视; 而对较大Xi的子样本,由于真实总体的方差较大,残差反映的信息应打折扣。
    • 29. 加权最小二乘法就是对加了权重的残差平方和实施OLS法: 对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。
    • 30. 2、一个例子 例如,如果在检验过程中已经知道:
    • 31. (本页无文本内容)
    • 32. 3、一般情况对于模型 Y=XB+N (2.4.8)
    • 33. (本页无文本内容)
    • 34. 这就是原模型(2.4.8)的加权最小二乘估计量,它是无偏、有效的。 这里权矩阵为D-1,它来自于矩阵W 。
    • 35. 4、求得权矩阵W的一种实用方法 从前面的推导过程看,它来自于原模型(2.4.8)残差项N的方差-协方差矩阵,因此仍然可对原模型(2.4.8)首先采用OLS法,得到随机误差项的近似估计量,以此构成权矩阵的估计量,即
    • 36. 5、加权最小二乘法具体步骤
    • 37. 6、注意 在实际建模过程中,尤其是截面数据作样本时,人们通常并不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。
    • 38. 在应用软件中,给出了权矩阵的多种选择。 例如在Eviews中给出了权矩阵的3种选择:White权矩阵、Newey-West权矩阵和自己输入权矩阵。
    • 39. 五、案例—1 —某地区居民储蓄模型
    • 40. 某地区31年来居民收入与储蓄额数据表
    • 41. 1、普通最小二乘估计
    • 42. 2、异方差检验 (1)图示检验
    • 43. ⑵ G-Q检验①求两个子样本(n1=n2=12)回归方程的残差平方和RSS1与RSS2;
    • 44. ②计算F统计量 F=RSS2/RSS1=769899.2/162899.2=4.726③查表 在5%的显著性水平下,第1和第2自由度均为(31-7)/2-2=10的F分布临界值为 F0.05(10,10)=2.97 由于 F=4.72 > F0.05(10,10)= 2.97 因此,否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。
    • 45. ⑶ Park检验 显然,lnXi前的参数表现为统计上显著的,表明原数据存在异方差性。
    • 46. 3、异方差模型的估计
    • 47. 与OLS估计结果相比较,拟合效果更差 。 为什么?关于异方差形式的假定…
    • 48. 与OLS估计结果相比较,拟合效果更好 。
    • 49. 五、案例—2 —居民消费二元模型
    • 50. 1、OLS估计结果
    • 51. 2、WLS估计结果
    • 52. 3、比较各项统计检验指标全面改善 R2 : 0.999739→0.999999 F: 28682→980736 ∑e2: 438613→29437 t: 6.4 22.0 4.2→25.2 134.1 22.9 D.W.: 1.45→1.81