聚类分析算法对高校学生成绩分析的应用研究


    聚类分析算法高校学生成绩分析应研究
    *** 15级信4班 222015602063077
    摘:数挖掘量完全模糊机数中提取隐含中事先知道潜信息知识程聚类分析指物理抽象象集合分组类似象组成类分析程聚类分析目标相似基础收集数分类聚类应源领域包括数学计算机科学统计学生物学济学应领域聚类技术发展技术方法作描述数衡量数源间相似性数源分类簇中
    聚类分析常算法原理:KmeansDBSCAN层次聚类聚类分析非监督学重领域谓非监督学数没类标记算法原始数探索中提取出定规律
    关键词数挖掘 聚类分析 学生成绩分析
    1概述
    11研究意义
    数挖掘方法种聚类分析法目前应前景方法聚类分析法作独立工具获数分布情况观察簇特点集中特定某簇进行特定分析文旨研究聚类算法应学生成绩分析中学生成绩进行评价分析量学生成绩中提取出更信息传统方法基绝分数评价种方法存定缺陷充分反映学生原始成绩中蕴涵信息学生原始成绩进行登记评定教学理中重环节传统评定方法基分数绝评价种方法存定缺陷学生成绩分析典型层次角度指标综合评估分析问题利数挖掘中聚类分析算法获取学生成绩中隐含规律挖掘科成绩背表达出学生性力差异文应聚类分析思想学生成绩进行划分评价弥补传统方法缺陷评价结果教学员提供利
    12背景
    现分类类认识世界方式理世界效手段分类科学研究中非常重许科学研究分类工作出发没分类没效率没分类世界没秩序初分类定性分类着科学发展产生数值分类学数值分类学等研究中抽象出专门定量聚类方法包括基统计学种聚类分析基模糊数学聚类技巧等元统计学中聚类分析点群分析研究样品指标分类问题种元统计方法谓类(cluster)通俗讲相似元素集合聚类分析常算法原理:KmeansDBSCAN层次聚类聚类分析非监督学重领域谓非监督学数没类标记算法原始数探索中提取出定规律聚类分析试图数集中样划分干相交子集子集称簇
    高校教学科研重基培养重场教学理工作中学生成绩分析高校理工作重组成部分衡量高校理水目前高校着招生规模扩信息量幅度增加学校运行着类理系统存着类数库成绩理学籍理等系统积累量数程度提高工作效率现教学理系统中理员教师学生进行数操作局限量数信息充分应
    13发展现状
    聚类分析领域产生巨作具体表现方面:(1)商业领域:聚类分析发现客户群通购买模式刻画客户群特征聚类分析细分市场效工具时研究消费者行寻找新潜市场选择实验市场作元分析预处理(2)生物领域:聚类分析动植物分类基进行分类获取种群固结构认识(3)理领域:聚类够帮助球中观察数库商趋相似性(4)保险行业领域:聚类分析通高均消费鉴定汽车保险单持者分组时根住宅类型价值理位置鉴定城市房产分组(5)特网领域:聚类分析网进行文档类修复信息(6)电子商务领域:聚类分析电子商务中网站建设数挖掘中重方面通分组聚类出具相似浏览行客户分析客户特征更帮助电子商务户解客户客户提供更合适服务
    2数挖掘理
    21数挖掘
    数挖掘(Data Mining)通分析数量数中寻找规律技术数准备规律寻找规律表示3步骤数挖掘务关联分析聚类分析分类分析异常分析特异群组分析演变分析等工智领域惯称数库中知识发现(Knowledge Discovery in Database KDD) 数挖掘视数库中知识发现程基步骤知识发现程三阶段组成:(1)数准备(2)数挖掘(3)结果表达解释数挖掘户知识库交互
    22聚类分析
    聚类分析指物理抽象象集合分组类似象组成类分析程种重类行
    聚类分析目标相似基础收集数分类聚类源领域包括数学计算机科学统计学生物学济学应领域聚类技术发展技术方法作描述数衡量数源间相似性数源分类簇中聚类方法:(1)层次聚类(Hierarchical Clustering):合法分解法树状图(2) 非层次聚类:划分聚类谱聚类
    23三种聚类分析常算法
    231 KMeans聚类算法
    属非层次聚类法种
    KMeans算法定数k够数集分成k簇C{C1C2⋯Ck}种分类否合理者否意义算法需化方误差:

    KMeans基算法流程
    输入:样数集D 聚类簇数k
    (1) 样中机选取k样点作初始均值量{μ1 μ2 ⋯μk }
    (2)循环步直达停止条件:
    (21)令Ci ∅(1≤i≤k)
    (22)样点计算k均值量间距离取中距离短距离应均值量标记作该点簇标记然该点加入相应簇Ci
    (23)簇计算新均值量果相前量变化更新作新均值量果没变化变
    出KMeans基算法容易理解算法身挺简单运行较快KMeans非常型数集
    232密度聚类(DBSCAN)
    密度聚类思想KMeans更符合类思维基思想通否紧密相连判断样点否属簇代表性算法DBSCAN基组邻域参数(ϵMinPts)表征某处样否紧密介绍算法前先介绍概念
    ϵ 邻域:样点xi距离ϵ属样集D中点集合N ϵ(xj){si∈D|dist(xixj)≤ϵ}
    233层次聚类
    层次聚类类算法总称通断合簇者断分离簇形成嵌套簇种层次类通树状图表示AgglomerativeClustering算法种层次聚类算法算法原理简单开始时候数点身作簇然找出距离两簇合断重复步骤直达预设簇数关键方判断簇间距离判断准做链接准
    3.目标需求分析
    31 课题意义
    学生成绩教学效果测量学质量记录学生成绩数蕴藏量信息分析挖掘评价教学效果促进教学改革完善质量监控具代作应该成教学理重环节
    国高等教育规模发展转涵提升天完善教学质量理体系建设已成高校涵建设首务国高校理者应充分认识学生成绩信息涵丰富性成绩分析教学工作反馈作学生成绩理应仅仅数登录查询应该成教学质量理监控必环节构建维度视角层次学生成绩分析方法体系时效反馈机制形成培养参者关注学生成绩深度分析挖掘动查找原积极改进提升意识氛围必国高等教育质量提升起重推动作
    32课题研究原
    国高校学生成绩分析现状存着问题:(1)高校学生成绩分析研究成果计算机理系统设计容表明高校教学音理者学生成绩理丰富涵认识够成绩分析重视足存提交成绩意味教学工作结束错误认识导致学生成绩分析尚未纳教学质监控体系成绩信息统计分析反馈机制尚未建立培养指导作尚未发挥属学生成绩信息资源浪费(2)方法研究够维分析缺失目前高校开展课程考试相关分析仅限课教师(命题)完成单广]课程试卷分析种分析方法存问题命题分析教学分析少强调学风反思白身少分析指标单结果全面反映教学整体情况法诊断教学中存问题强化学生成绩整体性历史性较性分析分析原教学决策教学改革提供科学应该成教学理重环节(3)信息利够反馈机制缺失目前国高校学生成绩理流程般教学程考试阅卷成绩登录 学生成绩仅课程学分学籍资格毕业资格学位资格等审查属开环理模式尚未形成效学生成绩信息分析反馈机制导致理者解整体教学情况理决策缺乏针性科学性教学单位解教师教学状况教学改革缺乏时性效性学生学效果缺乏整体握学方法改进学目标调整缺乏
    4KMeans应
    41 KMeans特点
    总体KMeans聚类算法簇数分布凸情况效果
    (1)初始值敏感KMeans初始值选导致终结果优化实化方误差难优化采种贪心算法种算法掉进局部优坑里面量选初始值计算次(2)特殊分布数集够出合理结果

    图希结果应该左图KMeans出右图出想结果
    42 聚类分析工具软件(WEKASQL Server 2012)
    WEKA怀卡托智分析环境( Waikato Environment for KnowledgeAnalysis)款免费非商业化基JAVA环境开源机器学(Machine Leaning) 数挖掘( DataMining)软件WEKA作公开数挖掘工作台集合量承担数挖掘务机器学算法包括数进行预处理分类回聚类关联规新交互式界面视化开发者Java 语言利WEKA架构开发出更数挖掘算法WEKA中集成算法甚鉴方法实现视化工具件困难事情聚类分类关联分窗口提供数应应类数挖掘算法界面尤成绩理系统中数值数选WEKA工具高校学生成绩分析够效结果
    Microsoft SQL Server 2012微软发布新代数台产品全面支持云技术台够快速构建相应解决方案实现私云公云间数扩展应迁移
    5.实验程
    51 数挖掘程
    数挖掘复杂阶段程图示分阶段:

    (1)确定挖掘象
    (2)数准备
    ①数选择
    ②数预处理
    ③数转换
    (3)数挖掘
    (4)结果分析
    (5)知识表达解释
    52 聚类分析程
    文数挖掘程中工具WEKA WEKA 支持数格式两种:ARFF 文件CSV 文件原始数EXCEL 文件转换ARFF CSV 文件转换方法:EXCEL 中开MARKxls 选择菜单—>存弹出话框中文件名输入Mark 保存类型选择CSV ( 逗号分隔)保存便Markcsv 文件结果图示:

    开WEKA 软件Exporler 菜单点击Open file 钮开刚Markcsv 文件点击Save 钮弹出话框中文件名输入Mark 文件类型选择Arff date files (*arff)样数文件Markarff
    开WEKA 软件中Exporler 点击刚Markarff
    切换Cluster点Choose钮选择SimpleKmeansWEKA中实现K 均值算法点击旁边文框numClusters设置3实例分成三簇K3结果默认值
    右击左方Result list列出结果点Visualize cluster assignments显示弹出窗口出实例散点图
    Cluster0簇里实例占总实例32中男生相较类学生分专业时选择硬件方计算机专业学生分方时计算机硬件结构系统定解具较强动手力创新意识学选择硬件方
    Cluster1簇里实例占总实例41中男生样相较根该簇里面实例成绩出分析数实例中类学生分专业时选择网络方计算机专业学生分方时计算机常命令强识力学选择网络方
    Cluster2簇里实例占总实例27中女生相较女生符合思维周密求耐心创新意识根文分析数类学生分专业时选择软件方
    6.总结
    学生成绩分析工作中利标准偏移量度量标准Kmeans聚类分析算法够效进行学生成绩分析达具相关特征学生聚集类目实现预设数聚类分析结果标准偏移量Kmeans聚类分析算法适合学生成绩数进行聚类分析操作利标准偏移量K means聚类分忻算法进行学生成绩分析程中利学科值方法进行初始聚类中心选取外探索途径初始聚类中心选取方法学生聚集类代表相关信息分析工作需加强研究探讨方
    参考文献
    [1] 谭庆 基kmeans聚类算法试卷成绩分析研究河南学学报(然科学版)Journal of Henan University (Natural Science)Vol39 No 4Jul2009
    [2]飞翔蓝鲸 聚类分析常算法原理2018年01月01日 105232
    [3] 陈蕾 高校学生成绩信息分析挖掘文章编号 10070079 (2013) 32 021702
    [4] 孙菲张健沛董野福栋涛郭春 基标准偏移量学生成绩
    Kmeans聚类分析算法研究齐齐哈尔学学报Joumal of Qiqihar University VoL31 No2March2015
    [5]容4 利Kmeans聚类分析技术分析学生成绩20181030

    文档香网(httpswwwxiangdangnet)户传

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 4 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    sas与聚类分析

    sas与聚类分析1聚类分析介绍1.1基本概念聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相同聚类中的数据实例彼此相同,处于不同聚...

    2年前   
    443    0

    聚类分析在证券市场分析中的应用

    山东交通学院2013届毕业生毕业论文(设计)题目:聚类分析在证券市场分析中的应用院(系)别 理学院 专 业 信息与计算科学 班 级 ...

    3年前   
    470    0

    中期成绩分析

    时间转眼即逝,不知不觉期中考试已经结束了,在这几天的时间里,一直在反思后面的两个月时间如何进行。有时候会进入教学混沌,拿到一篇课文不知道该如何进教学。

    4年前   
    844    0

    历史成绩分析

    本次考试检测的范围为八年级下册1-3单元,运用问卷星进行在线检测,试卷由50道选择题组成,题型单一,但所选的题目系统地对学生的记忆能力、理解能力、运用知识和解决问题能力进行考察。

    4年前   
    2040    0

    算法设计与分析试卷及答案

    湖南科技学院二○ 年 学期期末考试 信息与计算科学专业 年级《算法设计与分析》 试题题 号一二三四五总分统分人得 分阅卷人复查人考试类型:开卷 试卷类型:C卷 考...

    1年前   
    422    0

    oracle课程设计实验高校学生课程成绩据库设计

    考核拟采用大作业报告形式,将学生的学习成果心得体会以文档的形式提交。请批准。 本次考核要求每个学生完成的内容如下:⑴选定某一主题,创建一个oracle数据库,对其进行日常管理及应用(全部用SQL语句实现):

    4年前   
    705    0

    毕业论文:TIPTOP双档算法设计与分析

    为了进一步完善现有的TIPTOP系统,针对工程部需求对企业设备进行有效登记管理,本人通过编写TIPTOP双档程序cfar222初步完成了对设备仪器的数据采集。在cfar281双档项目实施后,工程...

    5年前   
    1477    0

    算法设计与分析试卷A及答案

     试题纸(A卷) 课程名称: 算法设计与分析 适用专业年级: 2008级计算机、电本 考生学号: ...

    1年前   
    566    0

    数值分析各算法流程图

    数值分析各算法流程图 一、插值 1、 拉格朗日插值流程图:( 相应程序:lagrintp(x,y,xx)) ...

    5年前   
    1737    0

    算法设计与分析复习题目及答案

     一、选择题1、二分搜索算法是利用(   A  )实现的算法。A、分治策略   B、动态规划法   C、贪心法    D、回溯法2、下列不是动态规划算法基本步骤的是( A  )。A、找出最优解...

    3年前   
    833    0

    算法分析期末试题集答案

    《算法分析与设计》期末复习题(一)一、 选择题1.应用Johnson法则的流水作业调度采用的算法是(D)A. 贪心算法 B. 分支限界法 C.分治法 D. 动态规划算法2.H...

    1年前   
    537    0

    某中学中考成绩分析

    XX中学2011年中考成绩分析为了全面准确的掌握学校的教学基本情况,进一步的总结经验,分析教学工作中存在的缺点与不足,为了今后我校能更好的进行教学工作,提高教学质量,现对我校2011年中考成绩...

    1年前   
    272    0

    高一英语期中成绩分析总结

    高一英语期中成绩分析总结  会同三中 向亚萍   一、考试成绩分析  (一)教情分析  本届高一共8个英语班。4位英语任课教师,都是送过几届高三的有经验的老师,大家都积极肯干、上进心强、乐于奉...

    11年前   
    635    0

    英语成绩分析与整改措施

    由于个别学生疫情期间单词量掌握的太少,对单词不能进行认读,以至读不懂句子、短文,造成答错题。主要原因是平时考察的力度不够,学生没有掌握应会的四会单词。

    4年前   
    5084    0

    月考成绩分析3篇

    月考成绩分析3篇篇二一、月考试卷分析总体上说,这次的月考的语文试卷比较容易,题目量适中,都是基础知识。题型都不陌生,都是我们平常训练过的,作文第一单元也写过指导过,但我们班的语文成绩还是不够理...

    4个月前   
    95    0

    首次适应算法最佳适应算法

    姓名:学号:实验名称:进程调度模拟实验 实验目的:了解动态分区存储管理方式中的数据结构和分配算法,加深对动态分区存储管理方式及其实现技术的理解。实验内容:#include<iostream.h...

    3年前   
    1621    0

    自我性格分析在职业生涯规划中的应用研究

    关于自我性格的分析与检验的研究屡见不鲜,而如何在一定程度上作出正确、科学、符合个人特色的自我选择与职业规划则是人生的必由之路。近年来许多学者发现对于自我性格的分析与职业生涯的规划之间有某种密不可分的联系。

    3年前   
    624    0

    粒子群算法(优化算法)毕业设计论文

     毕 业 论 文 题 目 粒子群算法及其参数设置 专 业 信息与计算科学 班 级 ...

    5年前   
    1463    0

    高校学生管理规定

    高校学生管理规定第一章 总 则第一条 为维护普通高等学校正常的教育教学秩序和生活秩序,保障学生身心健康,促进学生德、智、体、美全面发展,依据教育法、高等教育法以及其他有关法律、法规,制定本规定...

    2年前   
    638    0

    092 建筑耗热量稳态算法分析

    稳态计算方法计算建筑耗热量指标中的几个问题清华大学 建筑节能研究中心 燕达、张野、刘烨、李婷、吴如宏摘要 标准[1]上给出的计算建筑耗热量指标的稳态算法,包括通过围护结构的传热耗热量、空气...

    2年前   
    375    0