第章 回分析概述
11 变量间统计关系函数关系区什?
答:变量间统计关系指变量间具密切关联某某变量唯确定外变量关系变量间函数关系指变量唯确定外变量确定关系
12 回分析相关分析联系区什?
答:联系回分析相关分析研究变量间关系统计学课题区a回分析中变量y称变量处解释特殊位相关分析中变量x变量y处等位研究变量y变量x密切程度研究变量x变量y密切程度回事b相关分析中涉变量y变量x全机变量回分析中变量y机变量变量x机变量非机确定变量C相关分析研究刻画两类变量间线性相关密切程度回分析仅揭示变量x变量y影响回方程进行预测控制
13 回模型中机误差项ε意义什?
答:ε机误差项正机误差项引入变量间关系描述机方程助机数学方法研究yx1x2…xp关系客观济现象错综复杂种济现象难限素准确说明机误差项概括表示认识客观原局限没考虑种种偶然素
14 线性回模型基假设什?
答:线性回模型基假设:1解释变量x1x2…xp非机观测值xi1xi2…xip常数2等方差相关假定条件{E(εi)0 i12… Cov(εiεj){σ^2
3正态分布假定条件相互独立4样容量数解释变量数n>p
15 回变量设置理根什?回变量设置时应注意问题?
答:理判断某变量应该作解释变量便显著果理法判断采统计方法判断解释变量解释变量存统计关系应注意问题:选择变量时注意专门领域专家合作认回模型涉变量越越回变量确定工作次完成需反复试算终找出合适变量
16 收集整理数包括容?
答常样数分时间序列数横截面数数收集方法时间序统计数时间截面统计数数收集中样容量少般设置解释变量数目相配套数整理仅变量数进行折算差分甚数数化标准化等时需注意剔特特野值
17 构造回理模型基什?
答:选择模型数学形式济行理根变量样数作出解释变量解释变量间关系散点图散点图显示变量间函数关系作理模型数学形式问题采形式进行计算机模拟模拟结果选择较作理模型
18 什回模型进行检验?
答:建立回模型目应研究济问题果马模型预测控制分析显然够慎重必须通检验确定模型否真正揭示解释变量解释变量间关系
19 回模型方面应?
答:回模型应方面:济变量素分析进行济预测
110 什强调运回分析研究济问题定性分析定量分析相结合?
答:回模型运中强调定性分析定量分析相结合数理统计方法事物外数量表面研究问题涉事物质规定性单纯表面数量关系否反映事物质?质究竟?必须专门学科研究定济问题研究中仅样数估计结果加分析说长道短必须参数估计结果具体济问题现实情况紧密结合样保证回模型济问题研究中正确应
第二章 元线性回
214 解答:(1)散点图:
(2)xy间致呈线性关系
(3)设回方程
(4)
(5)
服度n2t分布
:
:(249115)
服度n2t分布
(6)xy决定系数
(7)
ANOVA
x
方
df
均方
F
显著性
组间
(组合)
9000
2
4500
9000
100
线性项
加权
8167
1
8167
16333
056
偏差
833
1
833
1667
326
组
1000
2
500
总数
10000
4
拒绝说明回方程显著xy显著线性关系
(8) 中
接受原假设认显著0变量y变量x元线性回成立
(9)相关系数
表中相应值时表中相应值xy显著线性关系
(10)
序号
1
1
10
6
4
2
2
10
13
3
3
3
20
20
0
4
4
20
27
7
5
5
40
34
6
残差图:
图残差围绕e0机波动模型基假定满足
(11)广告费42万元时销售收入
(171397)
215 解答:
(1) 散点图:
(2)xy间致呈线性关系
(3)设回方程
(4)
02305
04801
(5)
服度n2t分布
:
:(0002800044)
服度n2t分布
(6)xy决定系数 0908
(7)
ANOVA
x
方
df
均方
F
显著性
组间
(组合)
1231497500
7
175928214
5302
168
线性项
加权
1168713036
1
1168713036
35222
027
偏差
62784464
6
10464077
315
885
组
66362500
2
33181250
总数
1297860000
9
拒绝说明回方程显著xy显著线性关系
(8) 中
接受原假设认显著0变量y变量x元线性回成立
(9) 相关系数
表中相应值时表中相应值xy显著线性关系
(10)
序号
1
825
3.5
30768
04232
2
215
1
08808
01192
3
1070
4
39588
00412
4
550
2
20868
00868
5
480
1
18348
08348
6
920
3
34188
04188
7
1350
45
49688
04668
8
325
15
12768
02232
9
670
3
25188
04812
10
1215
5
44808
05192
图残差围绕e0机波动模型基假定满足
(11)
(12)
(2747)
似置信区间:(274466)
(13)置信水(333407)
216 (1)散点图:
直线回描述yx间关系
(2)回方程
(3)
图出检验误差项服正态分布
第三章 元线性回
311 解:(1)SPSS算出yx1x2x3相关系数矩阵:
相关性
y
x1
x2
x3
Pearson 相关性
y
1000
556
731
724
x1
556
1000
113
398
x2
731
113
1000
547
x3
724
398
547
1000
y
048
008
009
x1
048
378
127
x2
008
378
051
x3
009
127
051
N
y
10
10
10
10
x1
10
10
10
10
x2
10
10
10
10
x3
10
10
10
10
系数a
模型
非标准化系数
标准系数
t
Sig
B 950 置信区间
相关性
线性统计量
B
标准 误差
试版
限
限
零阶
偏
部分
容差
VIF
1
(常量)
348280
176459
1974
096
780060
83500
x1
3754
1933
385
1942
100
977
8485
556
621
350
825
1211
x2
7101
2880
535
2465
049
053
14149
731
709
444
687
1455
x3
12447
10569
277
1178
284
13415
38310
724
433
212
586
1708
a 变量 y
(2)
三元线性回方程
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
更改统计量
R 方更改
F 更改
df1
df2
Sig F 更改
1
898a
806
708
2344188
806
8283
3
6
015
a 预测变量 (常量) x3 x1 x2
(3)
决定系数R方0708 R0898较认拟合度较高
(4)
Anovab
模型
方
df
均方
F
Sig
1
回
13655370
3
4551790
8283
015a
残差
3297130
6
549522
总计
16952500
9
a 预测变量 (常量) x3 x1 x2
b 变量 y
F8283 P0015<005认回方程整体拟合
(5)
系数a
模型
非标准化系数
标准系数
t
Sig
B 950 置信区间
相关性
线性统计量
B
标准 误差
试版
限
限
零阶
偏
部分
容差
VIF
1
(常量)
348280
176459
1974
096
780060
83500
x1
3754
1933
385
1942
100
977
8485
556
621
350
825
1211
x2
7101
2880
535
2465
049
053
14149
731
709
444
687
1455
x3
12447
10569
277
1178
284
13415
38310
724
433
212
586
1708
a 变量 y
(6)P值x30284x3回系数没通显著检验应
x3作F检验:
Anovab
模型
方
df
均方
F
Sig
1
回
12893199
2
6446600
11117
007a
残差
4059301
7
579900
总计
16952500
9
a 预测变量 (常量) x2 x1
b 变量 y
表知通F检验
继续做回系数检验
系数a
模型
非标准化系数
标准系数
t
Sig
B 950 置信区间
相关性
线性统计量
B
标准 误差
试版
限
限
零阶
偏
部分
容差
VIF
1
(常量)
459624
153058
3003
020
821547
97700
x1
4676
1816
479
2575
037
381
8970
556
697
476
987
1013
x2
8971
2468
676
3634
008
3134
14808
731
808
672
987
1013
a 变量 y
时发现x1x2显著性提高
(7)x1(09978485) x2(005314149) x3(1341538310)
(8)
(9)
残差统计量a
极值
极值
均值
标准 偏差
N
预测值
1754748
2925545
2315000
3895206
10
标准 预测值
1438
1567
000
1000
10
预测值标准误差
10466
20191
14526
3127
10
调整预测值
1883515
3181067
2401835
4983914
10
残差
2519759
3322549
00000
1914022
10
标准 残差
1075
1417
000
816
10
Student 化 残差
2116
1754
123
1188
10
已删残差
9761523
5088274
868348
4343220
10
Student 化 已删残差
3832
2294
255
1658
10
Mahal 距离
894
5777
2700
1555
10
Cook 距离
000
3216
486
976
10
居中杠杆值
099
642
300
173
10
a 变量 y
置信区间(17547482925545)
(10)x3回系数显著性检验未通居民非商品支出货运总量影响回方程整体数拟合较
312 解:固定第二产业增加值考虑第三产业增加值影响情况第产业增加单位GDP增加0607单位
固定第产业增加值考虑第三产业增加值影响情况第二产业增加单位GDP增加1709单位
第四章 违背基假设情况
48
加权变化残差图点散步较前残差图没明显趋势点散步较机加权二估计效果较二估计
49 解:
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
831
442
1882
065
x
004
000
839
11030
000
a 变量 y
SPSS计算:0831+0004x
残差散点图:
(2)残差散点图知存异方差性
等级相关系数分析:
相关系数
x
t
Spearman rho
X
相关系数
1000
318*
Sig(双侧)
021
N
53
53
T
相关系数
318*
1000
Sig(双侧)
021
N
53
53
* 置信度(双测) 005 时相关性显著
P0021 方差变量相关性显著
(3)
模型描述
变量
y
变量
1
x
权重
源
x
幂值
1500
模型 MOD_1
M15时建立优权函数时:
ANOVA
方
df
均方
F
Sig
回
006
1
006
98604
000
残差
003
51
000
总计
009
52
系数
未标准化系数
标准化系数
t
Sig
B
标准误
试版
标准误
(常数)
683
298
2296
026
x
004
000
812
082
9930
000
:0683+0004x
(4)
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
582
130
4481
000
x
001
000
805
9699
000
a 变量 yy
410 济变量滞性会序列带相关性前期消费额期消费额般会明显影响时济变量种滞性表现出种规循环运动济情况处衰退低谷时济扩张期开始时数济时间序列升快济扩张时期济时间数列部种动力受影响时间序列直升循环顶点顶点时刻济收缩开始样时间序列数中序观察值间相关现象恨然
411 线性回模型机误差项存序列相关时违背线性回方程基假设果然直接普通二估计未知参数会产生严重果般情况序列相关性会带列问题:
(1)参数估计值具方差线性偏性
(2)均方误差MSE严重低估误差项方差
(3)容易导致t值评价高常F检验t检验失效果忽视点导致出回参数统计检验显著实际显著严重错误结
(4)存序列相关时二估计量抽样波动变非常敏感
(5)果加处理运普通二法估计模型参数模型进行预测进行结构分析会带较方差甚错误解释
412 优点:DW检验着广泛应模型简单方便判断该模型序列相关性DW值2左右时需查表放心认模型存序列相关性
缺点:DW检验两确定区域旦DW值落两区域法判断时增样容量选取方法DW统计量界表求n>15果样利残差难相关存性作出较正确判断DW检验适合机项具高阶序列相关检验
413 解:
(1)
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
1435
242
5930
000
x
176
002
999
107928
000
a 变量 y
1435+0176x
(2)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
999a
998
998
09744
663
a 预测变量 (常量) x
b 变量 y
DW0663 查DW分布表知:095
DW<误差项存正相关
残差图:
t变化逐次变化频繁改变符号说明误差项存正相关
(3)105*DW06685 计算:
Y’ x’
739 4490
765 4580
684 4069
800 4850
779 4685
826 4945
796 4847
828 5004
790 4803
Y’ X’
849 5117
788 4726
877 5233
893 5269
932 5495
929 5554
948 5677
938 5583
967 5800
990 5922
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
996a
993
993
07395
1344
a 预测变量 (常量) xx
b 变量 yy
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
303
180
1684
110
xx
173
004
996
49011
000
a 变量 yy
回方程 0303+0173x’
:0303+06685+0173(—06685)
(4)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
978a
957
955
07449
1480
a 预测变量 (常量) x3
b 变量 y3
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
033
026
1273
220
x3
161
008
978
19528
000
a 变量 y3
△0033+0161△
:0033++0161()
(5)差分法DW值148消相关性彻底迭代法值007395拟合较
414解:(1)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
541a
293
264
32969302
745
a 预测变量 (常量) x2 x1
b 变量 y
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
574062
349271
1644
107
x1
191098
73309
345
2607
012
x2
2045
911
297
2246
029
a 变量 y
回方程:574062+191098x1+2045x2
DW0745
- 残差图:
(2)105*DW06275
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
688a
474
452
25767064
1716
a 预测变量 (常量) x22 x12
b 变量 y2
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
179668
90337
1989
052
x12
211770
47778
522
4432
000
x22
1434
628
269
2283
027
a 变量 y2
时方程:’179668+21177x1’+1434x2’
回方程:
(3)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计误差
DurbinWatson
1
715a
511
490
28379102
2042
a 预测变量 (常量) x23 x13
b 变量 y3
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
7698
39754
194
847
x13
209891
44143
544
4755
000
x23
1399
583
274
2400
020
a 变量 y3
时方程:△
回方程:
415 异常值原 异常值消方法
1)数登记误差存抄写录入错误 重新核实数
2)数测量误差 重新测量误差
3)数机误差 删重新观测异常值数
4)缺少重变量 增加必变量
5)缺少观测数 增加观测数适扩变
量取值范围
6)存异方差 采加权线性回
7)模型选错误线性模型适 改非线性回模型
416
编号 学生化残差 删学生化残差 杠杆值 库克距离
1 089353 087604 035418 016609
2 062767 059277 014025 003115
3 026517 024349 016079 000620
4 000433 000396 009935 000000
5 175400 229383 024702 040874
6 211566 383214 064187 321601
7 117348 122039 049277 050110
8 116281 120606 036129 028946
9 040935 037902 016366 001500
10 106462 107911 033883 022158
表中绝值学生化残差2115663根学生化残差诊断认数存异常值绝值删学生化残差3832143根学生化残差诊断第6数异常值变量异常值中心化杠杆值等064187 库克距离等321601中心化杠杆均值03001第6数杠杆值等0641872倍中心化杠杆值杠杆值第6数变量异常值时第6数库克距离等3216011样第6数异常值原变量异常变量异常两原引起
第五章 变量选择逐步回
59 退法:输出结果
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
1438120
2252472
638
533
农业x1
626
168
1098
3720
002
工业x2
328
207
1352
1587
135
建筑业x3
383
555
251
691
501
口x4
004
025
014
161
875
终消费x5
672
130
3710
5178
000
受灾面积x6
006
008
015
695
499
2
(常量)
1079754
299759
3602
003
农业x1
642
130
1126
4925
000
工业x2
303
131
1249
2314
035
建筑业x3
402
525
263
765
456
终消费x5
658
095
3636
6905
000
受灾面积x6
006
007
017
849
409
3
(常量)
1083150
295816
3662
002
农业x1
624
127
1095
4931
000
工业x2
373
093
1535
3998
001
终消费x5
657
094
3627
6981
000
受灾面积x6
005
007
015
758
460
4
(常量)
874604
106869
8184
000
农业x1
611
124
1073
4936
000
工业x2
353
088
1454
3994
001
终消费x5
637
089
3516
7142
000
a 变量 财政收入y
Anovae
模型
方
df
均方
F
Sig
1
回
1365E8
6
2274E7
602127
000a
残差
528793319
14
37770951
总计
1370E8
20
2
回
1365E8
5
2729E7
772734
000b
残差
529767852
15
35317857
总计
1370E8
20
3
回
1364E8
4
3411E7
991468
000c
残差
550440103
16
34402506
总计
1370E8
20
4
回
1364E8
3
4547E7
1355753
000d
残差
570180931
17
33540055
总计
1370E8
20
a 预测变量 (常量) 受灾面积x6 建筑业x3 口x4 农业x1 终消费x5 工业x2
b 预测变量 (常量) 受灾面积x6 建筑业x3 农业x1 终消费x5 工业x2
c 预测变量 (常量) 受灾面积x6 农业x1 终消费x5 工业x2
d 预测变量 (常量) 农业x1 终消费x5 工业x2
e 变量 财政收入y
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
更改统计量
R 方更改
F 更改
df1
df2
Sig F 更改
1
998a
996
994
19434750
996
602127
6
14
000
2
998b
996
995
18793046
000
026
1
14
875
3
998c
996
995
18547913
000
585
1
15
456
4
998d
996
995
18313944
000
574
1
16
460
a 预测变量 (常量) 受灾面积x6 建筑业x3 口x4 农业x1 终消费x5 工业x2
b 预测变量 (常量) 受灾面积x6 建筑业x3 农业x1 终消费x5 工业x2
c 预测变量 (常量) 受灾面积x6 农业x1 终消费x5 工业x2
d 预测变量 (常量) 农业x1 终消费x5 工业x2
回方程:
逐步回法:输出结果
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
更改统计量
R 方更改
F 更改
df1
df2
Sig F 更改
1
994a
989
988
28568373
989
1659441
1
19
000
2
996b
992
991
24777768
003
7258
1
18
015
3
998c
996
995
18313944
004
15948
1
17
001
a 预测变量 (常量) 终消费x5
b 预测变量 (常量) 终消费x5 农业x1
c 预测变量 (常量) 终消费x5 农业x1 工业x2
Anovad
模型
方
df
均方
F
Sig
1
回
1354E8
1
1354E8
1659441
000a
残差
1550688654
19
81615192
总计
1370E8
20
2
回
1359E8
2
6794E7
1106637
000b
残差
1105088003
18
61393778
总计
1370E8
20
3
回
1364E8
3
4547E7
1355753
000c
残差
570180931
17
33540055
总计
1370E8
20
a 预测变量 (常量) 终消费x5
b 预测变量 (常量) 终消费x5 农业x1
c 预测变量 (常量) 终消费x5 农业x1 工业x2
d 变量 财政收入y
系数a
模型
非标准化系数
标准系数
t
Sig
相关性
B
标准 误差
试版
零阶
偏
部分
1
(常量)
710372
90891
7816
000
终消费x5
180
004
994
40736
000
994
994
994
2
(常量)
1011912
136901
7392
000
终消费x5
311
049
1718
6374
000
994
832
135
农业x1
414
154
726
2694
015
987
536
057
3
(常量)
874604
106869
8184
000
终消费x5
637
089
3516
7142
000
994
866
112
农业x1
611
124
1073
4936
000
987
767
077
工业x2
353
088
1454
3994
001
992
696
062
a 变量 财政收入y
回方程
510
(1)
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
1
908a
824
736
62588326
2
000b
000
000
121715945
a 预测变量 (常量) x6 x3 x2 x4 x5
b 预测变量 (常量)
Anovac
模型
方
df
均方
F
Sig
1
回
1830E7
5
3660971683
9346
002a
残差
3917298522
10
391729852
总计
2222E7
15
2
回
000
0
000
b
残差
2222E7
15
1481477129
总计
2222E7
15
a 预测变量 (常量) x6 x3 x2 x4 x5
b 预测变量 (常量)
c 变量 y
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
5922827
2504315
2365
040
x2
4864
2507
677
1940
081
x3
2374
842
782
2818
018
x4
817901
187279
1156
4367
001
x5
14539
147078
050
099
923
x6
846867
291634
899
2904
016
2
(常量)
7542938
304290
24789
000
a 变量 y
回方程:
(2)退法:输出结果
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
1
908a
824
736
62588326
2
907b
824
759
59704776
a 预测变量 (常量) x6 x3 x2 x4 x5
b 预测变量 (常量) x6 x3 x2 x4
Anovac
模型
方
df
均方
F
Sig
1
回
1830E7
5
3660971683
9346
002a
残差
3917298522
10
391729852
总计
2222E7
15
2
回
1830E7
4
4575257669
12835
000b
残差
3921126262
11
356466024
总计
2222E7
15
a 预测变量 (常量) x6 x3 x2 x4 x5
b 预测变量 (常量) x6 x3 x2 x4
c 变量 y
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
5922827
2504315
2365
040
x2
4864
2507
677
1940
081
x3
2374
842
782
2818
018
x4
817901
187279
1156
4367
001
x5
14539
147078
050
099
923
x6
846867
291634
899
2904
016
2
(常量)
6007320
2245481
2675
022
x2
5068
1360
706
3727
003
x3
2308
486
760
4750
001
x4
824261
167776
1165
4913
000
x6
862699
232489
916
3711
003
a 变量 y
(3)逐步回
模型汇总
模型
R
R 方
调整 R 方
标准 估计误差
1
498a
248
194
109283206
2
697b
485
406
93795038
3
811c
657
572
79660909
a 预测变量 (常量) x3
b 预测变量 (常量) x3 x5
c 预测变量 (常量) x3 x5 x4
Anovad
模型
方
df
均方
F
Sig
1
回
5502210090
1
5502210090
4607
050a
残差
1672E7
14
1194281918
总计
2222E7
15
2
回
1079E7
2
5392697554
6130
013b
残差
1144E7
13
879750910
总计
2222E7
15
3
回
1461E7
3
4869041506
7673
004c
残差
7615032418
12
634586035
总计
2222E7
15
a 预测变量 (常量) x3
b 预测变量 (常量) x3 x5
c 预测变量 (常量) x3 x5 x4
d 变量 y
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
5161259
1142744
4517
000
x3
1511
704
498
2146
050
2
(常量)
472298
2150138
220
830
x3
3188
913
1050
3492
004
x5
212325
86643
737
2451
029
3
(常量)
1412807
1865912
757
464
x3
3440
782
1133
4398
001
x5
348729
92220
1210
3782
003
x4
415136
169163
587
2454
030
a 变量 y
(4)两种方法模型回退法剔x5保留x6 x3 x2 x4作终模型逐步回法引入x3说明方法变量重性认变量相关性关联相退法首先做全模型回变量机会展示作结果更说服力
第六章 重线性情形处理
66
解表出
系数a
模型
非标准化系数
标准系数
t
Sig
线性统计量
B
标准 误差
试版
容差
VIF
1
(常量)
6381575
2736958
2332
035
x1
593
279
1040
2127
052
003
318536
x2
549
199
2260
2753
016
001
897470
x3
756
911
495
830
420
002
472951
x4
080
031
281
2590
021
064
15706
x5
006
006
038
918
374
434
2305
x6
010
014
027
750
466
574
1742
a 变量 y
方差扩子VIF2897470首先应剔变量x2剩变量继续进行回表:
系数a
模型
非标准化系数
标准系数
t
Sig
线性统计量
B
标准 误差
试版
容差
VIF
1
(常量)
2677422
2858846
937
364
x1
053
237
092
221
828
006
160620
x3
1433
533
937
2690
017
009
112478
x4
036
032
127
1137
274
087
11509
x5
006
008
041
822
424
434
2303
x6
002
015
006
157
878
647
1545
a 变量 y
时方差扩子VIF1160620时x1系数负x1应剔继续剩变量进行回:
系数a
模型
非标准化系数
标准系数
t
Sig
线性统计量
B
标准 误差
试版
容差
VIF
1
(常量)
2214129
1888503
1172
258
x3
1318
109
862
12068
000
199
5023
x4
031
019
107
1586
132
221
4523
x5
006
007
041
841
412
434
2302
x6
003
015
008
209
837
671
1489
a 变量 y
时方差扩子10回方程:
2214129+1318x3+0031x4+0006x5+0003x6
第七章 岭回
1 岭回估计什情况提出?
答:解释变量间出现严重重线性时普通二法估计模型参数参数估计方差太普通二法效果变理想解决问题统计学家模型数角度考虑采回诊断变量选择克服重线性影响时岭回作种新回方法提出
2 岭回估计定义统计思想什?
答:种改进二估计方法做岭估计变量间存重线性∣X'X∣≈0时设想X'X加正常数矩阵kI(k>0)X'X+kI 接奇异程度考虑变量量纲问题先数作标准化计算方便标准化设计阵然X表示定义 称岭回估计中k称岭参数
3 选择岭参数k种方法?
答:选择岭参数种常方法1岭迹法2方差扩子法3残差方确定k值
4 岭回方法选择变量应遵基原?
答:岭回方法选择变量应遵原:
1 岭回计算中假定设计矩阵X已中心化标准化样直接较标准化岭回系数剔掉标准化岭回系数较稳定绝值变量
2 k值较时标准化岭回系数绝值稳定着k增加迅速趋零样岭回系数稳定震动趋零变量予删
3 掉标准化岭回系数稳定变量果干岭回系数稳定究竟掉掉般原循需根掉某变量重新进行岭回分析效果确定
5 第5章题9数逐步回结果保留3变量x1x2x5y3变量做岭回分析?
答:
6 题312 问题分普通二岭回建立GDP第二产业增加值x2第三产业增加值x3二元线性回解释回系数?
答:
RSQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ x2 x3
______ ______ ________ ________
00000 99923 774524 225943
05000 99803 512296 463711
10000 99629 489067 463649
15000 99367 473860 456649
20000 99025 461162 448152
25000 98615 449761 439303
30000 98147 439219 430476
35000 97628 429332 421821
40000 97067 419984 413400
45000 96470 411101 405242
50000 95842 402632 397352
55000 95189 394536 389732
60000 94514 386782 382376
65000 93822 379344 375274
70000 93116 372200 368419
75000 92398 365330 361799
80000 91672 358717 355405
85000 90939 352345 349227
90000 90202 346201 343255
95000 89462 340271 337480
10000 88720 334545 331892
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
4352859
679065
6410
000
第二产业增加值
1438
151
775
9544
000
第三产业增加值
679
244
226
2784
017
a 变量 GDP
RSQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ x2 x3
______ ______ ________ ________
00000 99923 774524 225943
01000 99888 587428 408049
02000 99866 548878 441659
03000 99847 531054 454593
04000 99827 520110 460694
05000 99803 512296 463711
06000 99776 506176 465082
07000 99745 501080 465475
08000 99710 496653 465244
09000 99672 492691 464593
10000 99629 489067 463649
Run MATRIX procedure
****** Ridge Regression with k 001 ******
Mult R 999439
RSquare 998878
Adj RSqu 998691
SE 1301292455
ANOVA table
df SS MS
Regress 2000 181E+010 904E+009
Residual 12000 20320345 16933621
F value Sig F
5341336020 000000
Variables in the Equation
B SE(B) Beta BSE(B)
x2 1090606 060219 587428 18110661
x3 1226660 097506 408049 12580325
Constant 3980247846 738314258 000000 5390994
END MATRIX
结合表图形知普通二法回方程 显然回系数0679明显合理
岭参数图岭参数k0001间岭参数已基稳定参复决定系数k001时复决定系数0998691然固k001做回未标准化岭回方程
7 家型商业银行家分行年该银行贷款额稳增长良贷款额较例提高弄清楚良贷款形成原希利银行业务关数做定量分析便找出控制良贷款办法表75该银行属25家分行2002年关业务数
(1) 计算y余四变量简单相关系数
(2) 建立良贷款y4变量线性回方程回系数否合理?
(3) 分析回模型线性
(4) 采退法逐步回法选择变量回方程回系数否合理否存线性?
(5) 建立良贷款y4变量岭回
(6) 第4步剔变量回方程做岭回
(7) 某研究员希做y项贷款余额年累计应收贷款贷款项目数三变量回认种做否行果行应该做?
相关性
良贷款y
项贷款余额x1
年累计应收款x2
贷款项目数x3
年固定资产投资额x4
Pearson 相关性
良贷款y
1000
844
732
700
519
项贷款余额x1
844
1000
679
848
780
年累计应收款x2
732
679
1000
586
472
贷款项目数x3
700
848
586
1000
747
年固定资产投资额x4
519
780
472
747
1000
Sig (单侧)
良贷款y
000
000
000
004
项贷款余额x1
000
000
000
000
年累计应收款x2
000
000
001
009
贷款项目数x3
000
000
001
000
年固定资产投资额x4
004
000
009
000
N
良贷款y
25
25
25
25
25
项贷款余额x1
25
25
25
25
25
年累计应收款x2
25
25
25
25
25
贷款项目数x3
25
25
25
25
25
年固定资产投资额x4
25
25
25
25
25
系数a
模型
非标准化系数
标准系数
t
Sig
线性统计量
B
标准 误差
试版
容差
VIF
1
(常量)
1022
782
1306
206
项贷款余额x1
040
010
891
3837
001
188
5331
年累计应收款x2
148
079
260
1879
075
529
1890
贷款项目数x3
015
083
034
175
863
261
3835
年固定资产投资额x4
029
015
325
1937
067
360
2781
a 变量 良贷款y
线性诊断a
模型
维数
特征值
条件索引
方差例
(常量)
项贷款余额x1
年累计应收款x2
贷款项目数x3
年固定资产投资额x4
1
1
4538
1000
01
00
01
00
00
2
203
4733
68
03
02
01
09
3
157
5378
16
00
66
01
13
4
066
8287
00
09
20
36
72
5
036
11215
15
87
12
63
05
a 变量 良贷款y
退法
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
1022
782
1306
206
项贷款余额x1
040
010
891
3837
001
年累计应收款x2
148
079
260
1879
075
贷款项目数x3
015
083
034
175
863
年固定资产投资额x4
029
015
325
1937
067
2
(常量)
972
711
1366
186
项贷款余额x1
041
009
914
4814
000
年累计应收款x2
149
077
261
1938
066
年固定资产投资额x4
029
014
317
2006
058
3
(常量)
443
697
636
531
项贷款余额x1
050
007
1120
6732
000
年固定资产投资额x4
032
015
355
2133
044
a 变量 良贷款y
逐步回
系数a
模型
非标准化系数
标准系数
t
Sig
B
标准 误差
试版
1
(常量)
830
723
1147
263
项贷款余额x1
038
005
844
7534
000
2
(常量)
443
697
636
531
项贷款余额x1
050
007
1120
6732
000
年固定资产投资额x4
032
015
355
2133
044
a 变量 良贷款y
RSQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ x1 x2 x3 x4
______ ______ ________ ________ ________ ________
00000 79760 891313 259817 034471 324924
05000 79088 713636 286611 096624 233765
10000 78005 609886 295901 126776 174056
15000 76940 541193 297596 143378 131389
20000 75958 491935 295607 153193 099233
25000 75062 454603 291740 159210 074110
30000 74237 425131 286912 162925 053962
35000 73472 401123 281619 165160 037482
40000 72755 381077 276141 166401 023792
45000 72077 364000 270641 166949 012279
50000 71433 349209 265211 167001 002497
55000 70816 336222 259906 166692 005882
60000 70223 324683 254757 166113 013112
65000 69649 314330 249777 165331 019387
70000 69093 304959 244973 164397 024860
75000 68552 296414 240345 163346 029654
80000 68024 288571 235891 162207 033870
85000 67508 281331 231605 161000 037587
90000 67003 274614 227480 159743 040874
95000 66508 268353 223510 158448 043787
10000 66022 262494 219687 157127 046373
Run MATRIX procedure
****** Ridge Regression with k 04 ******
Mult R 802353780
RSquare 643771588
Adj RSqu 611387187
SE 2249999551
ANOVA table
df SS MS
Regress 2000 201275 100638
Residual 22000 111375 5062
F value Sig F
1987906417 00001172
Variables in the Equation
B SE(B) Beta BSE(B)
x1 025805860 003933689 574462395 6560218798
x4 004531316 007867533 050434658 575951348
Constant 357087614 741566536 000000000 481531456
END MATRIX
Yx1 x2 x3 做岭回
Run MATRIX procedure
****** Ridge Regression with k 04 ******
Mult R 850373821
RSquare 723135635
Adj RSqu 683583583
SE 2030268037
ANOVA table
df SS MS
Regress 3000 226089 75363
Residual 21000 86562 4122
F value Sig F
1828313822 00000456
Variables in the Equation
B SE(B) Beta BSE(B)
x1 016739073 003359156 372627316 4983118685
x2 156806656 047550034 275213878 3297719120
x3 067110931 032703990 159221005 2052071673
Constant 819486727 754456246 000000000 1086195166
END MATRIX
图表知(1)y x1 x2 x3 x4 相关系数分0844073207000519
(2) y余四变量线性回方程 系数负说明存线性固回系数合理
(3) 条件数1125>10说明存较强线性
(4) 表知退法逐步回法线性回方程 系数负说明然存线性
(5) Y余四变量岭回表示
(6) 选取岭参数k04岭回方程回系数合理解释
(7) yx1 x2 x3 做岭回选取岭参数k04岭回方程回系数合理解释 B SE(B) 似t值知x1 x2 x3 显著yx1 x2 x3岭回行
您欢迎您阅读文章WORD文档编辑修改直接印阅读希您提出保贵意见建议阅读学种非常惯坚持进步
您欢迎您阅读文章WORD文档编辑修改直接印阅读希您提出保贵意见建议阅读学种非常惯坚持进步
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档