偏最小二乘回归=多元线性回归分析+典型相关分析+主成分分析


    偏二回种新型元统计数分析方法1983年伍德阿巴诺等首次提出十年理方法应方面迅速发展密西根学弗耐尔教授称偏二回第二代回分析方法
    偏二回方法统计应中重性方面:
    (1)偏二回种变量变量回建模方法
    (2)偏二回较解决许普通元回法解决问题普通元线形回应中常受许限制典型问题变量间重相关性果采普通二方法种变量重相关性会严重危害参数估计扩模型误差破坏模型稳定性变量重相关问题十分复杂长期理方法未出满意答案直困扰着事实际系统分析工作员偏二回中开辟种效技术途径利系统中数信息进行分解筛选方式提取变量解释性强综合变量辨识系统中信息噪声更克服变量重相关性系统建模中良作
    (3)偏二回称第二代回方法实现种数分析方法综合应

    偏二回元线性回分析+典型相关分析+成分分析

    偏二回建模时实现数结构简化二维面图维数特性进行观察偏二回分析图形功十分强次偏二回分析计算变量变量回模型面图直接观察两组变量间相关关系观察样点间相似性结构种高维数层面视见性数系统分析容更加丰富时建立回模型予许更详细深入实际解释

    偏二回建模策略\原理\方法
    11建模原理
    设 q变量{}p变量{}研究变量变量统计关系观测n样点构成变量变量数表X{}Y{}偏二回分XY中提取出成分 (说 线形组合 线形组合)提取两成分时回分析需列两求
    (1) 应携带数表中变异信息
    (2) 相关程度够达
    两求表明 应代表数表XY时变量成分 变量成分 强解释力
    第成分 提取偏二回分实施X 回 Y 回果回方程已达满意精度算法终止否利 X解释残余信息Y 解释残余信息进行第二轮成分提取复直达较满意精度止终 X提取 m成分…偏二回通实施 … 回然表达成关原变量… 回方程k12…q

    12计算方法推导
    数学推导方便起见首先数做标准化处理X 标准化处理数矩阵记(…)标准化处理数矩阵记(…)
    第步 记第成分第轴单位量||||1
    记第成分 第轴||||1
    果分代表XY中数变异信息根成分分析原理应该
    Var()max
    Var()max
    方面回建模需求解释力典型相关分析思路相关度应达值
    r()max
    综合起偏二回中求协方差达
    Cov()r() max
    正规数学表述应该求解列优化问题

    st
    ||||1||||1约束条件求()值
    果采拉格朗日算法记
    s- (-1)- (-1)
    s分求关偏导令零
    -0 (1 2)
    -0 (13)
    -(-1)0 (14)
    -(-1)0 (15)
    式(12)~(15)推出

    记正优化问题目标函数值
    式(12)式(13)写成
    (16)
    (17)
    式(17)代入式(16)
    (18)

    (19)

    见矩阵特征量应特征值目标函数值求取值 应矩阵特征值单位特征量方面 应矩阵特征值单位特征量
    求轴成分


    然分求三回方程
    (110)
    (111)
    (112)
    式中回系数量
    (113)
    (114)
    (115)
    分三回方程残差矩阵
    第二步 残差矩阵取代然求第二轴第二成分



    应矩阵特征值特征值 应矩阵特征值特征量计算回系数


    回方程


    计算果秩会
    (116)
    (117)
    均表示成线性组合式(117)原成关回方程形式
    k12…q
    残差距阵第k列
    13交叉效性
    面讨问题现数表确定更回方程许情形偏二回方程需选全部成分进行回建模象成分分析样采截尾方式选择前m 成分仅m 续成分预测性较模型事实果续成分已解释提供更意义信息时采成分会破坏统计趋势认识引导错误预测结元回分析章中调整复测定系数容中讨观点
    面问题样确定应提取成分数
    元回分析中介绍抽样测试法确定回模型否适预测应手中数分成两部分第部分建立回方程求出回系数估计量拟合值残差均方第二部分数作实验点代入刚求回方程求出般回方程会更预测效果 回方程宜预测
    偏二回建模中究竟应该选取少成分宜通考察增加新成分否模型预测功明显改进考虑采类似抽样测试法工作方式n样点分成两部分第部分某样点样点集合(含n1样点)部分样点h成分拟合回方程第二部分刚排样点代入前面拟合回方程样点拟合值12…n重复述测试定义预测误差方
    (118)
    定义Y 预测误差方
    (119)
    显然果回方程稳健性误差样点变动会十分敏感种扰动误差作会加值
    外采样点拟合含h 成分回方程记第样点预测值记误差方
    (120)
    定义Y误差方
    (121)
    般说总总面较全部样点拟合具h1成分方程拟合误差 增加成分含样点扰动误差果h成分回方程含扰动误差定程度(h1)成分回方程拟合误差认增加成分会预测结果明显提高希值越越SIMCAP软件中指定

    时增加成分益者反说时认增加新成分减少方程预测误差明显改善作
    种等价定义称交叉效性变量定义
    (122)
    全部变量Y成分交叉效性定义
    (123)
    交叉效性测量成分预测模型精度边际贡献两尺度
    (1) 时 成分边际贡献显著显易见 完全等价决策原
    (2) k12…q少k

    时增加成分少变量预测模型显著改善考虑增加成分明显益
    明确偏二回方法基原理方法算法步骤做实证分析




    附 录
    function wmaxdet(A)
    求矩阵特征值
    [vd]eig(A)
    [np]size(d)
    d1d*ones(p1)
    d2max(d1)
    ifind(d1d2)
    wv(i)

    function [cmv]norm1(C)
    数进行标准化处理
    [ns]size(C)
    for i1n
    for j1s
    c(ij)(C(ij)mean(C(j)))sqrt(cov(C(j)))
    end
    end
    mmean(C)
    for j1s
    v(1j)sqrt(cov(C(j)))
    end

    function [tqwwhf0FF]fun717(pxpyC)
    px变量输入数
    py输入变量数
    C输入变量变量组成矩阵
    t提取成分
    q回系数
    w特征值应特征量
    wh处理特征量
    f0回标准化方程系数
    FF原始变量回方程系数
    cnorm1(C) norm1标准化函数
    yc(px+1px+py) 截取标准化变量
    E0c(1px)
    F0c(px+1px+py)
    AE0'*F0*F0'*E0
    w(1)maxdet(A) 求特征量
    t(1)E0*w(1) 提取成分
    E(1px)E0t(1)*(E0'*t(1)(t(1)'*t(1)))' 获回系数
    p(1px)(E0'*t(1)(t(1)'*t(1)))'
    for i0px2
    B(px*i+1px*i+px)E(px*i+1px*i+px)'*F0*F0'*E(px*i+1px*i+px)
    w(i+2)maxdet(B(px*i+1px*i+px))
    maxdet求特征值函数
    t(i+2)E(px*i+1px*i+px)*w(i+2)
    p(px*i+px+1px*i+2*px)(E(px*i+1px*i+px)'*t(i+2)(t(i+2)'*t(i+2)))'
    E(px*i+px+1px*i+2*px)E(px*i+1px*i+px)t(i+2)*(E(px*i+1px*i+px)'*t(i+2)(t(i+2)'*t(i+2)))'
    end

    for s1px
    q(s)p(1px*(s1)+1px*s)'
    end

    [nd]size(q)

    for h1px
    iweye(d)
    for j1h1
    iwiw*(eye(d)w(j)*q(j)')
    end

    wh(h)iw*w(h)
    end
    for j1py
    zr(j)(regress1(y(j)t))' 求回系数
    end

    for j1px
    fori1py 生成标准化变量方程系数矩阵
    w1wh(1j)
    zr1(zr(i1j))'
    f0(ij)(w1*zr1)'
    end

    [normxymeanxycovxy]norm1(C) normxy标准化数矩阵
    meanxy列均值
    covxy列方差
    ccxxones(py1)*meanxy(11px)
    ccy(covxy(1px+1px+py))'*ones(1px)
    ccxones(py1)*(covxy(11px))
    ffccy*f0(j)ccx
    fff(sum((ccy*ccxx*f0(j)ccx)')meanxy(1px+1px+py))'
    FF(j)[fffff] 生成原始变量方程常数项系数矩阵
    end

    function [rRdytRdYtRdYttRdyttVIP]fun8y(pxpyc)
    Xc(1px)
    Yc(px+1px+py)
    xnorm1(X)
    ynorm1(Y)
    [tqw]fun717(pxpy[XY])
    r1corrcoef([yt])
    rr1(py+1px+py1py)'
    Rdytr^2
    RdYtmean(Rdyt)
    for m1px
    RdYtt(1m)sum(RdYt(11m)')
    end
    for j1py
    for m1py
    Rdytt(jm)sum(Rdyt(j1m)')
    end
    end
    for j1px
    for m1px
    Rd(jm)RdYt(11m)*((w(j1m)^2)')
    end
    end
    for j1px
    VIP(j)sqrt((px*ones(1px)RdYtt)*Rd(j))
    end

    function [rRdxtRdXtRdXttRdxtt]fun8x(pxpyc)
    Xc(1px)
    Yc(px+1px+py)
    xnorm1(X)
    ynorm1(Y)
    [tqw]fun717(pxpy[XY])
    r1corrcoef([xt])
    rr1(px+1px+px1px)'
    Rdxtr^2
    RdXtmean(Rdxt)
    for m1px
    RdXtt(1m)sum(RdXt(11m)')
    end
    for j1px
    for m1px
    Rdxtt(jm)sum(Rdxt(j1m)')
    end
    end
    for j1px
    for m1px
    Rd(jm)RdXt(11m)*((w(j1m)^2)')
    end
    end
    for j1px
    VIP(j)sqrt((px*ones(1px)RdYtt)*Rd(j))
    end

    function [tu]TU(pxpyC)
    t提取变量成分
    u 提取变量成分
    cnorm1(C)
    yc(px+1px+py)
    E0c(1px)
    F0c(px+1px+py)
    AE0'*F0*F0'*E0
    w(1)maxdet(A)
    t(1)E0*w(1)
    BF0'*E0*E0'*F0
    cc(1)maxdet(B)
    u(1)F0*cc(1)

    function drew(pxpyc)
    Xc(1px)
    Yc(px+1px+py)
    [linel]size(Y)
    [tqwwhf0FF]fun717(pxpyc)
    YYX*FF(2px+13)'+ones(line1)*FF(13)'

    subplot(1111)
    bar(f0(3))
    title(' 直方图')
    legend('SG''TZBFB''FHL''JK''HPZD''JPZD''TZ''ZG''GPK')
    grid on
    plot(YY(4)Y(4)'+')
    lsline

    for i1py
    vmod(i4)
    d(iv)4
    subplot(22vd+1)
    plot(YY(i)Y(i)'*')
    lsline
    end

    function [ QhjQhprey]crossval7(pxpyc)
    px变量数
    py量
    PRESShjzeros(pxpy)
    Xc(1px)
    Yc(px+1px+py)
    xnorm1(X)
    ynorm1(Y)
    [linerow]size(x)
    for h1px
    for j1line
    newxX
    newyY
    newx(j)[]
    newy(j)[]
    [tp0wwhf0FF]fun717(pxpy[newxnewy])
    prey(jh)X(j)*FF(2px+1h)'+FF(1h)'
    end
    PRESShj(h)sum((Yprey(h))^2)
    end
    PRESSh(sum(PRESShj'))'

    for h1px
    [t1p0wwhf0FF]fun717(pxpyc)
    prey2(h)X()*FF(2px+1h)'+ones(line1)*FF(1h)'
    SShj(h)sum((Yprey2(h))^2)
    end
    SSh(sum(SShj'))'
    Qhjones(px1py)PRESShj(2px)SShj(1px1) 错位
    Qhones(px11)PRESSh(2px1)SSh(1px11)


    文档香网(httpswwwxiangdangnet)户传

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 2 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    多元线性回归模型公式

    二、 多元线性回归模型在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。(一) 多元线性回归模型的建立假设某一因变量...

    2年前   
    603    0

    薪酬设计回归分析

    相关与回归分析第一节 简单线性相关分析 一、相关关系的概念与种类(一)相关关系的概念在自然界和人类社会中,普遍着存在现象之间的相互依赖、相互制约的关系。一些现...

    9年前   
    547    0

    第八章 回归分析

      第八章 回归分析 第一节 Linear过程 8.1.1 主要功能 8.1.2 实例操作 第二节 Curve Estimation过程 8.2.1 主要功能 8.2.2 实例操...

    11年前   
    4851    0

    假设检验、回归分析与方差分析

    项目八 假设检验、回归分析与方差分析实验3 方差分析实验目的 学习利用Mathematica求单因素方差分析的方法.基本命令1.调用线性回归软件包的命令<<Statistics\Line...

    2年前   
    402    0

    主成分分析方法与因子分析方法的比较研究

    主成分分析和因子分析是多元统计中较为关键和常用的两种方法,二者皆是从变量的方差-协方差结构着手,尽可能多的保存原始变量的信息。在此基础上用少量的新变量解释那些原始变量的统计分析方法。本篇论文对主...

    3年前   
    729    0

    基于DEA与多元回归分析的中国商业银行效率评价

    摘要这篇文章联系一些资料,阐释了钱庄效能的含义及与理论原理。第一步区分投入变量和产出变量,采纳DEA方式估计2011~2015年境内的四大公有钱庄和十家重要股份钱庄技术效能值。但由于DEA方法...

    3年前   
    388    0

    用回归系数的最小二乘估计法确定直线方程

    用回归系数的最小二乘估计法确定直线方程 为了研究附表3中数据之间的关系,我们以实际销售量x为横坐标,以计划销售量y为纵坐标将这些数据点()在平面直角坐标系上标出,这些数据点大致落在一条直线附...

    6个月前   
    180    0

    相关分析表(二)

    相关分析表(二) 地区 销售顺位U 商店数顺位V W=U—V W A 7 11 —4 16 B 6 8 —2 4 C 8 6 ...

    12年前   
    3587    0

    《应用回归分析》课后题答案解析

    《应用回归分析》部分课后习题答案第一章 回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的...

    3年前   
    1645    0

    員工構成分析表

    員工構成分析表 分類 人數 占全員比例 分類 人數 占全員比例 部 門 行政部門 年 齡 20歲以下 人事部門 20至30歲 工...

    8年前   
    8817    0

    线性分析报告003A

    杭州永磁集团有限公司量具线性分析报告 QR/HC31007-003A 样本名称: 样本编号: 质量特性: 规范公差: ...

    13年前   
    13504    0

    相关分析表(一)

    相关分析表(一) 地区 a销售额 b商店数 a的平方根 b的平方根 销售额×商店数 A 549 34 301,401 1, 156 18,666 B 631 ...

    14年前   
    2602    0

    基于主成分分析法的浑河抚顺段多环芳烃来源分析

    :随着城镇化程度的提高,给生态环境带来负面影响,多环芳烃(PAHs)由于难降解等特性存在于河流、土壤环境中,对居民健康造成一定威胁。本文选取浑河抚顺段与抚新城为研究区域,利用同分异构体比值法与主...

    3年前   
    433    0

    英语句子成分分析

    句子一般要有主语。在简单句中,主语一般由名词、代词、动名词或动词不定式(短语) 来充当。动名词、动词不定式作主语时通常用 it 作形式主语。

    4年前   
    1347    0

    人性回归

    人性回归,第三种管理模式    什么是管理模式?    管理模式,通俗地讲就是一个企业在管理制度上和其它企业不一样的地方,从制度经济学的角度说包括了正式制度和非正式制度两...

    13年前   
    19550    0

    《计量经济学》多媒体教学课件-多元线性回归模型练习题参考解答

    第三章练习题参考解答 练习题3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市...

    3年前   
    796    0

    利益相关者分析

    利益相关者分析   (一) 简介   用于分析利与客户利益相关的所有个人(和组织),帮助客户在战略制定时分清重大利益相关者对于战略的影响。   (二)详解   利益相关者是指有与客户有...

    10年前   
    29113    0

    记者的相关实习报告分析

    记者的相关实习报告分析  近50天的实习让我受益匪浅。刚进xxxx日报报社听到老师的第一句话就是:做新闻就是要多听多看多想多感受。到了报社当然是先了解报社和报纸,《xxxx日报》系中共xxxx...

    12年前   
    422    0

    企业管理重点的偏离与回归

    科目:企业诊断与策划 指导老师:张雪宁 老师 学生:周淮滨 学号:2000041159 专业:工商管理 浅...

    11年前   
    17011    0

    熟料耗比偏大原因分析

      近段时间熟料耗比偏大的原因分析   通过对近几天(4月26---30日)的物料盘存发现,虽然熟料的配比给定是52﹪左右,但实际的熟料耗比却达到65﹪以上。对近阶段的生产控制情况进行了分...

    11年前   
    11919    0

    文档贡献者

    z***u

    贡献于2022-09-19

    下载需要 2 香币 [香币充值 ]
    亲,您也可以通过 分享原创文档 来获得香币奖励!
    下载文档