第五章数据分析(梅长林)习题


    第五章习题 1.习题5.1 解:假定两总体服从正态分布,且协方差矩阵,误判损失相同又先验概率按比例分配,通过SAS计算得到先验概率如表: Class Level Information group Variable Name Frequency Weight Proportion Prior Probability G1 G1 6 6.0000 0.428571 0.428571 G2 G2 8 8.0000 0.571429 0.571429 即: 又计算可得: 有计算的总体协防差距矩阵S为: Pooled Within-Class Covariance Matrix, DF = 12 Variable x1 x2 x1 1.081944444 -0.310902778 x2 -0.310902778 0.174756944 并且: 计算广义平方距离函数: 并计算后验概率: 回代判别结果如下: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 1 G1 G1 0.9387 0.0613 2 G1 G1 0.9303 0.0697 3 G1 G1 0.9999 0.0001 4 G1 G2 * 0.4207 0.5793 5 G1 G1 0.9893 0.0107 6 G1 G1 1.0000 0.0000 7 G2 G2 0.0007 0.9993 8 G2 G2 0.0026 0.9974 9 G2 G2 0.0008 0.9992 10 G2 G2 0.0586 0.9414 11 G2 G2 0.0350 0.9650 12 G2 G2 0.0006 0.9994 13 G2 G2 0.0038 0.9962 14 G2 G2 0.0012 0.9988 由此可见误判的回代估计: 若按照交叉确认法,定义广义平方距离如下: 逐个剔除, 交叉判别,后验概率按下式计算: 通过SAS计算得到表所示结果。发现同样也是属于G1的4号被误判为G2,因此误判率的交叉确认估计为 Posterior Probability of Membership in group Obs From group Classified into group G1 G2 1 G1 G1 0.9060 0.0940 2 G1 G1 0.7641 0.2359 3 G1 G1 1.0000 0.0000 4 G1 G2 * 0.1950 0.8050 5 G1 G1 0.9743 0.0257 6 G1 G1 1.0000 0.0000 7 G2 G2 0.0012 0.9988 8 G2 G2 0.0051 0.9949 9 G2 G2 0.0014 0.9986 10 G2 G2 0.0713 0.9287 11 G2 G2 0.0422 0.9578 12 G2 G2 0.0009 0.9991 13 G2 G2 0.0059 0.9941 14 G2 G2 0.0022 0.9978 其中=12.1138, ,又因为,所以, 最后可得后验概率p为:0.048709 习题5.3 解:(1)在并且先验概率相同的的假设前提下,建立矩离判别的线性判别函数。利用SAS的proc discrim过程首先计算得到总体的协方差矩阵,如表: Pooled Within-Class Covariance Matrix, DF = 25 Variable x1 x2 x3 x4 x5 x6 x7 x8 x1 2.25705591 -0.91513311 0.34259974 -0.6084399 -0.9576508 -0.8929719 -0.0539445 -0.2192724 x2 -0.9151331 25.2318255 -0.3390873 -2.5515272 -5.0966371 0.78571637 -0.0835586 4.37529806 x3 0.34259974 -0.33908734 3.30063123 1.42276017 1.78692343 0.40208409 -0.0676655 -0.0732213 x4 -0.6084399 -2.55152726 1.42276017 6.07845863 5.78100857 2.32039331 -0.3205116 0.48605897 x5 -0.9576508 -5.09663714 1.78692343 5.78100857 8.15854743 3.44983429 -0.1096651 0.08904743 x6 -0.8929719 0.78571637 0.40208409 2.32039331 3.44983429 4.16657066 -0.2236278 0.87862549 x7 -0.0539445 -0.08355869 -0.0676655 -0.3205116 -0.1096651 -0.2236278 0.26009291 -0.0767347 x8 -0.2192724 4.37529806 -0.0732213 0.48605897 0.08904743 0.87862549 -0.0767347 2.51054423 各个总体的马氏平方距离见表: Generalized Squared Distance to group From group G1 G2 G1 0 24.61468 G2 24.61468 0 线性判别函数为: 得到训练样本回判法判别结果如表: Error Count Estimates for group G1 G2 Total Rate 0.0000 0.0000 0.0000 Priors 0.5000 0.5000 训练样本的交叉确认判别结果: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 17 G1 G2 * 0.4501 0.5499 19 G1 G2 * 0.0920 0.9080 Error Count Estimates for group G1 G2 Total Rate 0.1000 0.0000 0.0500 Priors 0.5000 0.5000 (2)假设两总体服从正态分布,先验概率按比例分配且误判损失相同,在两总体协方差矩阵相同,即的条件下进行Bayes判别分析,通过SAS discrim过程得到结果: Error Count Estimates for group G1 G2 Total Rate 0.0000 0.0000 0.0000 Priors 0.7407 0.2593 交叉确认判别结果: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 19 G1 G2 * 0.2246 0.7754 25 G2 G1 * 0.5282 0.4718 Error Count Estimates for group G1 G2 Total Rate 0.0500 0.1429 0.0741 Priors 0.7407 0.2593 在,并且先验概率按比例分配的假设前提下利用SAS的proc discrim过程进行Bays判别分析,这时以个总体的训练样本单独估计各总体的协方差矩阵,可到的训练样本的回判和交叉确认结果: 回判结果: Error Count Estimates for group G1 G2 Total Rate 0.0000 0.0000 0.0000 Priors 0.7407 0.2593 交叉确认判别结果: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 21 G2 G1 * 1.0000 0.0000 22 G2 G1 * 1.0000 0.0000 23 G2 G1 * 1.0000 0.0000 24 G2 G1 * 1.0000 0.0000 25 G2 G1 * 1.0000 0.0000 26 G2 G1 * 1.0000 0.0000 27 G2 G1 * 1.0000 0.0000 Error Count Estimates for group G1 G2 Total Rate 0.0000 1.0000 0.2593 Priors 0.7407 0.2593 (3)在不同的假设前提,采用不同判别方法得到待判样本的判别结果: 1.距离判别分析得到西藏、上海、广东的判别结果: Posterior Probability of Membership in group Obs Classified into group G1 G2 1 G2 0.0000 1.0000 2 G2 0.0000 1.0000 3 G2 0.0000 1.0000 2.在协方差矩阵相同的前提下,Bayes对西藏、上海、广东的判别结果: Posterior Probability of Membership in group Obs Classified into group G1 G2 1 G2 0.0000 1.0000 2 G2 0.0000 1.0000 3 G2 0.0000 1.0000 3在协方差不同矩阵相同的前提下,Bayes对西藏、上海、广东的判别结果: Posterior Probability of Membership in group Obs Classified into group G1 G2 1 G1 1.0000 0.0000 2 G1 1.0000 0.0000 3 G1 1.0000 0.0000 3.习题5.4 解:(1)假设两总体服从正态分布且在两总体协方差矩阵相同,即,先验概率按相同的条件下进行Bayes判别分析,通过SAS discrim过程得到结果: 首先得到线性判别函数: 回代误判结果: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 9 G1 G2 * 0.3401 0.6599 29 G2 G1 * 0.8571 0.1429 由计算结果发现,第9号样本被误判到G2,29号样本被误判到G1.误判率为6.34% Error Count Estimates for group G1 G2 Total Rate 0.0833 0.0435 0.0634 Priors 0.5000 0.5000 交叉确认判别结果:由计算发现总共有四个样本被判错,分别是9、28、29、35号样品。累计误判率为10.69% Posterior Probability of Membership in group Obs From group Classified into group G1 G2 9 G1 G2 * 0.0973 0.9027 28 G2 G1 * 0.6130 0.3870 29 G2 G1 * 0.9643 0.0357 35 G2 G1 * 0.8470 0.1530 Error Count Estimates for group G1 G2 Total Rate 0.0833 0.1304 0.1069 Priors 0.5000 0.5000 (1)假设两总体服从正态分布且在两总体协方差矩阵相同,即,先验概率按比例分配且误判损失相同的条件下进行Bayes判别分析,通过SAS discrim过程得到结果: 首先得到线性判别函数: Linear Discriminant Function for group Variable G1 G2 Constant -99.91796 -95.41991 x1 30.35060 29.87680 x2 -0.15214 -0.15210 x3 -0.78868 -0.22662 x4 1.95176 1.39528 x5 0.58964 0.06490 x6 -108.10195 -85.33735 x7 -0.31156 -0.25957 回代误判结果 Posterior Probability of Membership in group Obs From group Classified into group G1 G2 9 G1 G2 * 0.2119 0.7881 29 G2 G1 * 0.7579 0.2421 Error Count Estimates for group G1 G2 Total Rate 0.0833 0.0435 0.0571 Priors 0.3429 0.6571 交叉确认误判结果: Posterior Probability of Membership in group Obs From group Classified into group G1 G2 5 G1 G2 * 0.3436 0.6564 9 G1 G2 * 0.0532 0.9468 11 G1 G2 * 0.4052 0.5948 12 G1 G2 * 0.3519 0.6481 29 G2 G1 * 0.9338 0.0662 35 G2 G1 * 0.7428 0.2572 Error Count Estimates for group G1 G2 Total Rate 0.3333 0.0870 0.1714 Priors 0.3429 0.6571 本文档由香当网(https://www.xiangdang.net)用户上传

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 2 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    农林牧渔业经济数据分析

    农林牧渔业2012年第一季度统计分析   我县认真贯彻落实中央、省、州农业农村工作会议精神,紧紧抓住我州制定的“加速发展、加快转型、奋力赶超、推动跨越”主基调,在农业生产上做到任务早安排,...

    8年前   
    10588    0

    数据结构练习题及答案

    数据结构练习题及答案第1章 绪论一、 判断题1. 数据的逻辑结构与数据元素本身的内容和形式无关。 (√)2. 一个数据结构是由一个逻辑...

    6个月前   
    292    0

    分析数据的采集

    二、专利分析 (一)分析数据的采集 此次分析的数据来源于国家知识产权局专利局的“中国专利文献数据库”,检索于2004年1月8-9日进行。因此本分析是基于该数据库中2004年1月7日前收录的...

    8年前   
    5965    0

    数据分析

    表四: 数据分析部及KASP信息管理职数表 编制 部门 职 能 岗 位 工作描述 数据分析部(共7人) 1、建立公司数据信息管理平台 2、规划各部门数据分析报表 ...

    12年前   
    12266    0

    《梅林传奇》观后感

    《梅林传奇》观后感      《梅林传奇》观后感都说“只要人人都献出一点爱,世界将变得更美好。”爱的重要性由此可见一斑。同样,责任心的重要性也是不必细说的。   古代有君臣之礼,但是如果君主没...

    9年前   
    265    0

    人口增长数据的统计与分析-环境教学课题

    人口增长数据的统计与分析-环境教学课题  人口增长数据的统计与分析课题: 一次方程组的应用 年级: 初中一年级 目的: 1. 会列出二元一次方程组解简单的应用题,使学生使用代数中的方程去反映现...

    7年前   
    195    0

    关于从严管理林改电子数据的通知

    关于从严管理林改电子数据的通知关于从严管理林改电子数据的通知各林改内业技术人员:近日来,在林改工作检查中,发现不少技术人员对林改电子数据管理不善、存放混乱、备份不及时,一些技术人员寻找自己存放...

    7年前   
    133    0

    数据结构练习题(含答案)

    数据结构练习题习题1 绪论1.1 单项选择题1. 数据结构是一门研究非数值计算的程序设计问题中,数据元素的① 、数据信息在计算机中的② 以及一组相关的运算等的课程。 ...

    3个月前   
    410    0

    数据结构习题集附答案

    数据结构习题集附答案第一章 绪 论一、选择题1.组成数据的基本单位是( )A.数据项 B.数据类型 C.数据元素 D.数据变量2.数据结构是研究数据的( )以及它们之间的相互关系。A.理...

    4周前   
    108    0

    人力资源数据分析

    人力资源数据分析刘建华在HR的绩效考核里经常性会看到一些指标,比如招聘的到达率、培训完成率等等,到底人力资源要分析哪些指标,这些指标到底如何设计?01基于运营的人力资源数据分析首先第一个核心点...

    6年前   
    207    0

    数据分析管理办法

    数据分析管理办法 1 目的 为规范有关数据、信息的确定、收集和分析工作,用以识别改进的方向并实施持续的改进,特制定本办法。 2 适用范围 本办法适用于公司职能部门、项目和专业公司的数据...

    7年前   
    29669    0

    数据分析质量记录

    数据分析质量记录 编号: 序号: 数据来源部门: 日期: 数据类型: 分析要求: 数据分析附表: 分析报告: ...

    8年前   
    30416    0

    数据分析质量记录-1

    数据分析质量记录 编号: 序号: 数据来源部门: 日期: 数据类型: 分析要求: 数据分析附表: 分析报告: ...

    5年前   
    2543    0

    数据分析统计表

    数据分析统计表 编号:CBEA/QF8.4-02 序号: 序号 应用数据分析场合 ...

    5年前   
    3579    0

    大学课件 创业教育第五章习题

    一、填空/单选1、创业管理的基础因素有两个方面:一是( )、二是( )。2、现代企业是一个复杂的( )系...

    11个月前   
    421    0

    林长制工作总结

    实施林长制是贯彻落实习近平总书记视察安徽重要讲话中关于生态文明论述的重要要求,是推动绿色发展的重要抓手。2019年以来,县委政法委牢固树立“绿水青山就是金山银山”的发展理念,以加强组织建设为抓手...

    9个月前   
    520    0

    《市场调查与分析》习题(五)

    《市场调查与分析》习题(五) 一、单项选择题     1.为了确保与会者广开思路,专家座谈会调查法会议时间一般为      。     A.O.5小时 B.1.5小时 C.2.5小时 D...

    9年前   
    12515    0

    数据分析培训小结

    数据分析培训小结     本次数据分析课程主要是教我们如何使用OFFICE组件中的EXCEL表格以多种形式对现有数据进行分析。 从我个人的理解来看,数据分析能力,在绝大部分情况下的目的在于...

    8年前   
    10130    0

    数据分析的思路和套路

    数据分析的思路和套路  1、无论进行任何的分析,首先要把基础数据、资料整理清楚,收集齐全。在这个过程中,对指标、系统、全局的状况要有一个总体的评价和基调。 2、通过数据对比(与计划比、与同...

    8年前   
    9996    0

    xx年数据分析员个人总结

     xx年数据分析员个人总结撰写人:___________日 期:___________xx年数据分析员个人总结工作总结范文一、日常工作在xx年上半年,从总体来讲,日常的数据采集依然占据了很大...

    1个月前   
    80    0

    文档贡献者

    文***品

    贡献于2021-05-03

    下载需要 2 香币 [香币充值 ]
    亲,您也可以通过 分享原创文档 来获得香币奖励!
    下载文档

    该用户的其他文档