基于微博的信息热度评价与预测分析


    基微博信息热度评价预测分析


    微博已成时非常热门社交媒体台庞关信息分享话题交流台线社交活动中发挥着代作网络信息鱼龙混杂文通解微博热度机制进研究微博热度预测微博热门程度文研究容监控预测微博舆情重鉴意义
    文新浪微博作研究象首先进行爬取工具选取通分析信息传播特征微博户容传播三方面提炼影响微博热度素提取关键指标建立热度体系评价指标运子分析法建立微博热度评估模型微博信息维度表达式热度计算公式数进行整理分析终结果进行排序发现模型较符合实际情况表明模型具较高准确性
    提出基 PSO优化 BP 神网络话题热门程度预测模型构建出话题热门程度时间序列模型作预测模型输入优化预测模型完成话题热门程度值预测实验结果表明基 PSO 优化 BP 神网络话题热门程度预测模型够模拟话题热门程度变化趋势现实具定指导意义

    关键词:微博子分析热度评价模型BP神网络预测模型
    Abstract
    Weibo has become a very popular social media platform today is a big topic about information sharing and exchange platform in people online play an irreplaceable role in social activities the good and evil people mixed up because of the network information so this article through understanding the heat mechanism and further study of weibo microblogging heat and predict microblogging popularity this article research content for monitoring the microblogging public opinion has important significance
    Based on sina weibo this article crawl tools selection at first then through analyzing the characteristic of information dissemination and spread from weibo users content and three aspects of refining the main factors affecting heat weibo and extract the key indicators to establish the heat system of evaluation index heat weibo evaluation model is established by using factor analysis method get the microblog information dimension expression and heat calculation formula of sorts through the data analysis sorting and finally the results found model more in line with the actual situation show that the model has higher accuracy
    Then a psobased BP neural network optimization model is proposed to predict the degree of hot topics The time series model of topic popularity is constructed as the input of the prediction model According to the optimized prediction model the prediction of topic popularity is completed The experimental results show that the PSO optimized BP neural network model can well simulate the change trend of the hot topic degree which has certain guiding significance to the reality

    Keywords:weibofactor analysisheat evaluation modelBP neural networkprediction model

    目 录
    摘 I
    Abstract 1
    第1章 绪 1
    11 选题背景意义 1
    111 选题背景 1
    112 研究意义 1
    12 国外研究现状 2
    121 热度评价研究现状 2
    122热门话题预测现状分析 3
    13 研究容 3
    14 组织结构 4
    第2章 预备知识 5
    21爬取工具选取 5
    22 热度评价研究 5
    221媒体户关注度 5
    222媒体影响力 6
    223 容丰富程度 6
    224话题时效性 7
    23 热门预测算法 7
    231预测 7
    232 基PSO算法BP神网络 7
    24 章结 8
    第3章 热度评价模型建立 9
    31微博登录信息爬取 9
    32建立热度评价模型 10
    33通热度排序模型进行检验 15
    34章结 16
    第4章 预测模型建立 17
    41 热门微博判断指标 17
    42 结合PSO算法BP 神网络热门预测模型 18
    421 算法原理 18
    422 模型实验环境数获取 19
    423 预测模型参数设置 19
    424 预测结果分析 20
    43 章结 22
    结 23
    参考文献 24

    第1章 绪
    11 选题背景意义
    111 选题背景
    微博简称微型博客2009 年新浪客户端开始发行基关注机制通广播式信息扩散众发表实时信息2018年12月31日微博官方公布2018年第四季度财务审计报告报告说明激烈行业竞争中微博户数然持续飞涨户活跃度进步提升2018年微博客户端线活跃户约增加7000万左右12月总户已达462亿均日活跃户突破2亿显易见微博已成时非常热门社交媒体台庞关信息分享话题交流台户通注册登录完善更新信息台中户参热门话题讨解时发生事件时分享做想中推送次数浏览次数高互动次数微博会推送热门微博微博更注重信息时效性言性传播广泛性户第时间解参时事讨中微博舆情预警政务社会信息传播方面影响力日益增
    微博台中户发布容户发送容发表评转发外年视频信息传播愈发火热图处理技术变更加成熟传播信息鱼龙混杂程度考量解微博热度机制微博热度进行评估预测监控预测微博舆情推动传播真实效信息营造活跃健康社交台具重作
    112 研究意义
    微博信息热度评估中曝光度高阅读数量者互动数较高容信息较容易成热门微博台中包括热搜排行榜热门话题等位户进行推送会根热度热门微博容进行排序文分析影响热门微博传播素拟建立热度评价模型热门微博预测模型通计算热门微博热度热门程度变化趋势话题热度监控预测更加效缩台负面信息虚假信息传播范围众浏览更真实时政信息
    文结合微博信息容户行运子分析法建立微博热度评估模型
    微博热度进行量化处理利 BP 神网络学建立热门微博预测模型判断微博容否成热点微博判断热门程度变化趋势文研究促进真实时政信息传播研究台商品营销推送推动政府舆情监测预警等方面提供鉴理实践
    12 国外研究现状
    121 热度评价研究现状
    关网络信息热度评估研究Xi Maoetal利图形化法模拟新闻源寻找确定热门话题新闻容间相应联系考虑新闻时效性利衰退函数进行次迭代新闻类型设置速率参数终出容热度计算公式[1]少学者基微博传播体角度展开热度研究包括微博运营策略户间联系等方面进行探讨[2]关微博容热度研究TeutleGolder分微博关注机制户间扩散式联系做分析发现微博热度户间互动程度容推送象关[34]郑斐然等研究种万千微博题信息中提炼新闻题容方法原理通提取容中新闻关关键字结合词组出现频率容进行聚类分析挖掘指定话题[56]张鲁民等提出突发事件实现舆情监控种方法通建立情感符号模型通初始聚类扩散群集算法事件进行检测监控[7]Phuvipadawat 等基微博容性质创造推特中突发事件监测容合信息踪等算法[8]Weng等提出 Twitter Rank算法原理基博粉丝数量发博率目标户进行影响力分析基础挖取推特台热门容关干户[9]Pal 等定数基础综合考虑微博转发数点赞数评数提数等衡量容热度[10]
    衡量微博热度研究重心应该放微博容户行两方面中户仅指发布者指该户面粉丝群体台会根部排序机制微博进行排序包括首页热搜指定话题搜索排名等缺点知道排序时热度计算原理热度差距产生原基文运子分析法建立微博热度评估模型出热度计算公式热度进行量化出新排序结果原排序进行
    122热门话题预测现状分析
    类热门话题预测学术界般采取两种预测方法第种指较典型线性预测方法仅仅适合稳曲线进行预测适合预测种类型热门话题第二种指基非线性理建立预测模型该种分析方法更具系统性智性支持量机数进行广义线性分类致实现非线性拟合足处会常陷入局部优法全局优解[1112]Suh等选取话题类型粉丝数等属性基成分分析法提炼影响户互动行素建立精确度较高子图模型户行进行合理预测[1314]刘功申等通定量计算户微博影响已算法进行优化微博发出者户属性预测该微博否会量转发进出舆情预警[15]张敬基话题热度提出微博热度预测算法结合维度数建立回预测模型实现话题热度预测[17]FDSahnehCScoglio根传染模型层网络传播原理建立预测模型预测话题未走详细阐述信息扩散时传播规律信息相互作BP神网络面较错综复杂问题收敛速度慢处理时间长容易收敛局部优值达全局优[18]
    述问题许研究者提出相关改进方法颜文俊等基遗传算法优化 BP 神网络预测模型利光伏输出等原理提高算法收敛速度进提高预测效率精度未改进结果局部优缺陷[19]
    丁硕巫庆辉通种典优化算法渐函数分析改进算法数规模分析效果发现种算法适范围适范围逼效果接良周爱武等通利优样集相关原理改进原始算法缩短算法运行时间迭代次数降低算法身然局限性[20]
    13 研究容
    研究基微博客户端运爬虫软件python中Selenium 爬取工具采集5话题热门微博相关数容户传播三角度运子分析法建立微博热度评估模型验证模型准确性利 BP 神网络研究基PSO算法热门微博预测算法通实例验证热点话题预测结果性
    14 组织结构
    文包括四章面介绍章容:
    第章 绪 章简微博热度评价热门程度预测选题背景研究意义进行简阐述话题热度评价预测国外研究现状课题研究容流程进行概括
    第二章 预备知识 部分阐述研究开始前需解预备知识包括爬取工具选取热度评价热门预测等方面理知识奠定全文理基础
    第三章 热度评价模型建立章基爬取热门微博数运子分析法提取重素建立热度体系评级指标容户传播三角度运子分析法建立微博热度评估模型基该模型容热度进行排序实行热度评估模型验证
    第四章 章建立结合PSO算法基BP神网络热门微博预测模型首先分析热门话题表现形式运算法原理进行预测微博信息作模型输入完成微博热门程度趋势预测终进行实际检验
    第2章 预备知识
    进行实际操作前首先涉基础理知识进行简单介绍
    21爬取工具选取
    微博相较网站涉功较齐全微博页面容进行爬取非易事外反爬虫技术更先进半爬虫工具法快速获取目标信息总说数格式较统综基微博网站运行机制助python中技术手段快捷爬取微博中指定容相关数
    网络爬虫原理基爬虫语句目标网站信息进行获取年反爬虫技术发展迅速获取网站信息变没容易爬取数时会遇种样拦截常见403 Forbidden错误表示服务器已识出爬虫拒绝处理户请求Selenium Python API技术种非常直观方式访问浏览器技术包括定位元素动操作键盘鼠标提交页面表单抓取需信息Selenium爬虫原理先识需爬取容HTML源码通提供方法定位需信息结点位置获取文容文利python中pip工具安装selenium应浏览器驱动便进行续数爬取
    22 热度评价研究
    分析微博热门话题热度前需解影响热度干素:
    221媒体户关注度
    里媒体包括新闻媒体娱乐媒体等首发信息源媒体诸央视新闻新浪媒体等某话题报道信息数量影响媒体关注度关键素发布该话题信息数目越反映媒体话题关注度越高会引起更媒体重视传播范围变广众阅读量会明显增话题成热门话题率增加网络时代前基通报纸期刊杂志电视收音机等方式解热门时事获取时政信息网络时代传统媒体避免淘汰进入新媒体时代转型建立互联网台新媒体时代热门信息报道非全首发程度参考转发余媒体时事报道某话题报道频率越高媒体转发频率越高越说明媒体关注程度越成热门
    户关注度衡量话题热度关键素户关注度中户指类时事报道阅读者条微博信息包括户阅读量转发数评数等数反映户该信息者该话题关注程度间接反映话题户中影响范围程度
    某位户浏览某条信息觉趣者想会转载微信Facebook等社交台该信息会网络台传播外传播时事信息仅通线传播通生活中际关系进行扩散例户A网站W1中阅读篇报道认非常新奇趣分享讲述朋友BB会该条信息讲述朋友述指话题二次传播通种非线性网络式传播某话题众知晓知晓数越点击量会越越话题会较率评热门话题户评转发侧面反映出众某话题兴趣程度利社交台预测进行次传播率进衡量话题热度
    222媒体影响力
    媒体影响力决定微博热度第二素般说媒体指独立普遍信息传播者种类型线方式粉丝户推送时信息推广商品信息事件相关微博容会媒体台进行转发评媒体传播范围影响力相般说微博信息传播呈树状传递加v户微博发出通粉丝阅读互动断扩影响力粉丝数量越传播范围会越广阅读量互动数会越高会较容易成热点话题
    般说媒体指通现代电子手段数特定传递规范性非规范性信息私公普遍独立传播者事件相关微博容会媒体户间复制传播体媒体传播力影响程度
    223 容丰富程度
    微博台户发布信息没限制户发布容较意日常生活记录倾诉悲喜遭遇时事思考评根互联网机调查报告显示4252加V户会发布新锐观点时事评等3747会微博分享日常1369加V户会常发布专业领域知识仅仅转发加评户较少769越表达思想微博户越会引起评转发关注
    224话题时效性
    话题热度衡量类媒体报道数量户关注程度某话题评热门话题该话题必定许关该话题容信息般情况热门话题里面讨事件者时发生事件户者表达立场者发表见解新发布新信息热度前发布信息热度高着描述事件慢慢时事件讨热度会逐渐降
    热点话题收集量已发表信息热点话题收集篇新闻报道热点般说热门话题户描述前事件报告事件
    23 热门预测算法
    231预测
    新浪微博年已成广泛社交媒体台话题形成断传播终成热门话题台条微博信息包括七部分户ID发送时间容(包括图片视频)评数转发数点赞数阅读量微博粉丝发布者互动行(包括观性评转发点赞)反映户该话题兴趣程度互动行预测微博传播趋势重意义衡量某条微博热门程度新浪微博提高户阅读效率户快速获取热门信息定标准热门微博规律进行排序该标准综合考虑微博容信息包括热搜榜热门话题等根否排行榜热搜话题微博分非热门微博热门微博
    显易见判断某条微博否热门分析微博信息特征信息增益原理微博信息特征衡量热门程度预测微博否成热门者判断热门微博变化趋势
    232 基PSO算法BP神网络
    世纪八十年代 McCellandRumelhart提出BP神网络概念该算法拥非线性映射力等优势输入层输入信号隐含层处理输出节点产出输出信号输出信号未达预期期会通转入误差调整权值误差分摊隐含单元时进行参数修正重新计算结果直期输出结果BP神网络求解复杂非线性函数全局优值算法身采局部搜索优化策略缺点算法容易陷入局部优粒子群优化算法(简称PSO)具良局部开采力
    通改变粒子学模式提高迭代速度快速更新粒子位置确立全局优粒子操作简单收敛速度快获取结果效果精度俱佳BP神网络嵌入PSO算法中提升局部搜索力实现BP神算法优势互补终完成BP神网络预测模型构建
    24 章结
    文首先全文涉基础理知识进行简单介绍爬取工具选取文选择运Selenium Python API技术爬取热门微博分析影响话题热门程度素预测方法实现方法做基阐述























    第3章 热度评价模型建立
    31微博登录信息爬取
    通pathon中Selenium 动化工具 Firefox 浏览器通定位审查元素通头模式找户名密码HTML源码调selenium定位钮节点进行登录
    核心代码:>>> # coding utf 8
    from selenium import webdriver
    ……
    # elem_sub driverfind_element_by_xpath(input[@class'W_btn_a btn_34px'])
    elem_subclick()
    print u'登录成功'
    登录微博访问微博搜索页面通面核心代码搜索指定热门微博容研究搜索包括新闻体育娱乐情感学五种热门话题话题爬取2条热门微博相关信息
    核心代码:>>>def Searchweibo (topic):
    driver get( https weibo com)
    ……
    elem_ topic send_ keys( Keys RETURN)
    ……
    print u’ 爬取结束\n’
    找热门微博进行信息爬取数爬取前首先确定获取信息包括户名容发布时间转发量评数点赞数分析微博热门情况户画等根查阅相关文献需正表达式字符串操作获取需字段容核心代码:
    >>>infodriver find_ elements_by_xpath(’div[@ class WB_cardwrap S_bg2 clearfix’])
    ……
    content  value Text

    图31 爬取结果
    爬取结果图31直接获新闻类热门话题第条发布容发布时间转发量评数点赞数等数信息
    32建立热度评价模型
    文基抓取五种类型热门微博数户容传播三角度提炼建立热度评价模型7参考指标根原始数进行相关性分析建立基子分析法热度评价模型出热度值计算公式计算结果进行整理分析类热门微博结果热度值进行排序分析模型准确性
    表31 微博热度评价模型参考指标
    微博热度评价体系
    热度影响素
    考量素
    指标含义
    容热度影响力

    图片充实度
    微博图片数量
    字数充实度
    微博文字数量100相
    发布时长
    发出记录数间时间间隔
    发布者热度影响力
    粉丝数量
    记录数时粉丝数量
    互动数
    30天发布容产生互动行数统计指标
    发博率
    发博数量活跃天数值
    传播热度影响力
    转发数
    某条微博转发数量
    评数
    某条微博评数量
    点赞数
    某条微博点赞数量
    表31文首先围绕容热度影响力发布者热度影响力传播热度影响力三维度结合爬取微博原始数信息提出包括阅读量转发数点赞数评数博粉丝数发博次数发布时长文字图片数量等参考素
    考虑转发数评数点赞数三原始数数值较利数处理分析文拟通互动数重度传播率反映微博传播热度互动数综合考察点赞数转发数评数博文曝光数等信息直接反映发博带网友互动传播情况外重度传播率结合转发评数阅读量数值含义转发评数
    阅读量效考量传播热度
    确立七子指标针容热度选取参考指标文字充实度图片充实度传播时长针发布者热度选取参考指标粉丝数发博率针传播热度选取参考指标重度传播率互动数
    面进行数预处理根获相应微博子数初步建立微博热度评价体系2019年4月21日新浪微博台python分爬取关新闻体育学情感娱乐五热门话题前五条微博参考指标进行处理加工初步形成较完善微博热度体系评级体系32七子指标记录处理结果:
    表32 五种话题类型热门微博指标数
    话题类型
    热门微博
    粉丝数(万)
    传播时长(h)
    文字充实度
    图片充实度
    发博率
    重度传播率
    互动数(万)
    新闻
    1
    8396
    25
    112
    4
    525
    007
    5373
    新闻
    2
    6433
    21
    078
    9
    448
    008
    4106
    新闻
    3
    4554
    23
    096
    3
    385
    007
    2629
    新闻
    4
    5212
    19
    072
    1
    348
    006
    1280
    新闻
    5
    3615
    19
    081
    2
    326
    005
    1005
    体育
    1
    2064
    96
    104
    9
    642
    004
    1194
    体育
    2
    2025
    84
    098
    9
    542
    003
    846
    体育
    3
    1036
    72
    123
    3
    443
    004
    674
    体育
    4
    546
    78
    072
    2
    322
    002
    619
    体育
    5
    315
    52
    089
    1
    217
    002
    539

    1
    1690
    205
    038
    9
    241
    001
    1322

    2
    176
    138
    049
    9
    268
    002
    1154
    续表32 五种话题类型热门微博指标数
    话题类型
    热门微博
    粉丝数(万)
    传播时长(h)
    文字充实度
    图片充实度
    发博率
    重度传播率
    互动数(万)

    3
    146
    148
    051
    9
    205
    001
    923

    4
    142
    89
    014
    9
    146
    000
    1048


    5
    46
    67
    024
    9
    129
    000
    724
    情感
    1
    2916
    182
    063
    3
    253
    004
    2693
    情感
    2
    1145
    197
    028
    1
    256
    002
    2472
    情感
    3
    666
    138
    124
    3
    183
    003
    1884
    情感
    4
    226
    124
    108
    2
    176
    001
    2027
    情感
    5
    124
    154
    044
    1
    217
    001
    1462
    娱乐
    1
    2668
    82
    08
    1
    424
    007
    4639
    娱乐
    2
    732
    73
    035
    4
    386
    005
    3721
    娱乐
    3
    574
    75
    048
    2
    325
    003
    3642
    娱乐
    4
    396
    52
    064
    9
    341
    003
    2473
    娱乐
    5
    217
    43
    096
    9
    285
    002
    1755
    表32计算25条热门微博七子指标具体数五种话题类型五条热门微博出现次序进行计算基七指标详细数开始进行子分析
    进行子分析前首先确定变量间相关性需先进行KMO Bartlett检验中KMO检验统计量通较变量间简单相关系数偏相关系数反映变量间相关性取值越接1越说明变量相关性较强KMO>09时说明表示非常适合进行子分析07<KMO<09说明较适合进行子分析KMO<06说明相关性较弱子分析法失效
    Bartlett球状检验原理判断相关阵中变量独立性变量相互独立法变量中提取公子法利子分析法建立模型数值越伴概率<001时说明数集适合子分析法建立模型
    首先SPSS软件中选择分析工具栏中降维选项进行KMO Bartlett检验检验结果表33

    表33 KMO 巴特利特检验
    KMO 取样适切性量数
    0824
    巴特利特球形度检验
    似卡方
    532972

    21
    显著性
    0003
    SPSS检验结果KMO值0824Bartlett检验统计量观测值532974显示p值<005说明变量间具相关性说明子分析适合建立模型表34方差解释结果图32碎石图:
    表34 方差解释结果
    成分
    初始特征值
    提取载荷方
    总计
    方差百分
    累积
    总计
    方差百分
    累积
    1
    3654
    52203
    52203
    3654
    52203
    52203
    2
    1616
    23079
    75282
    1616
    23079
    75282
    3
    791
    11304
    86586
    791
    11304
    86586
    4
    480
    6852
    93438



    5
    312
    4455
    97893



    6
    094
    1345
    99238



    7
    053
    762
    100000



    提取方法:成分分析法


    图32 碎石图
    文累计方差百分少80特征值少1标准提取3公子表343公子累计解释信息86586子分解释信息522032307911304根碎石图前面三子特征值均1提取三子微博信息维度F1F2F3分代表微博容信息微博博信息微博传播信息
    已三维度权重根维度数通公式计算热度:
    (31)
    公式(31)I表示提取子数量 代表第 i 子相关数代表第i 子占权重
    计算热度指数需根成分分矩阵分析公子成分构成表35成分分系数矩阵结果
    表35 成分分系数矩阵
    成分
    1
    2
    3
    粉丝数(万)
    257
    046
    100
    互动数(万)
    164
    392
    166
    发博率
    087
    443
    738
    文字充实度
    195
    280
    110
    图片充实度
    232
    223
    038
    传播时长(h)
    138
    343
    807
    重度传播率
    250
    146
    134
    提取方法:成分分析法
    表35中通较行相关系数直观出公子指标相关性较高表中展示7指标成分系数分分代表三微博信息维度文中代表第微博信息维度指代博信息包括粉丝数量互动数量发博率代表第二微博信息维度指代微博容信息包括文字图片充实度 代表第三微博信息维度指代微博传播信息包括传播时长重度传播率等微博信息维度计算公式:
    第微博信息维度:
    (32)
    第二微博信息维度:
    (33)
    第三微博信息维度:
    (34)
    根三公子方差贡献率公子指标体系维度表达式根公式(31)微博热度计算公式(35):
    (35)
    33通热度排序模型进行检验
    式(35)条热门微博综合热度结果外文根热度五种类型热门话题5条微博进行重新排名表36
    表36 热门微博热度计算结果重新排名
    话题类型
    热度初始排名
    新排名
    F1
    F2
    F3
    F
    新闻
    1
    1
    432132
    2972
    028
    125678
    新闻
    2
    3
    365407
    3053
    026
    113056

    新闻
    3
    2
    326154
    3147
    052
    114812
    新闻
    4
    4
    240771
    3224
    034
    108136
    新闻
    5
    5
    286482
    3435
    017
    93025
    体育
    1
    1
    218138
    2585
    069
    70689
    体育
    2
    2
    177456
    2674
    101
    65715
    体育
    3
    3
    186138
    1596
    133
    60474
    体育
    4
    5
    144744
    2441
    105
    52171
    体育
    5
    4
    132867
    2852
    124
    53894

    1
    1
    129125
    3863
    057
    27385

    2
    2
    114762
    3712
    061
    24636

    3
    3
    123344
    3845
    042
    24147

    4
    4
    122551
    3556
    058
    19626

    5
    5
    90589
    2378
    065
    18384
    情感
    1
    1
    207189
    2215
    043
    73693
    情感
    2
    2
    167145
    2159
    059
    64677
    情感
    3
    4
    121532
    2175
    066
    47123
    情感
    4
    3
    97171
    1753
    024
    49675
    情感
    5
    5
    81528
    2197
    038
    35188
    娱乐
    1
    1
    377006
    2864
    072
    107556
    娱乐
    2
    2
    296665
    2331
    056
    86419
    娱乐
    3
    3
    277032
    3317
    065
    77522
    娱乐
    4
    4
    146647
    3728
    047
    62457
    娱乐
    5
    5
    177059
    2539
    053
    56395
    表36出文基新浪微博热门序截取五类热门话题热度计算出五类话题热门微博真实热度排序发现截取微博热度排序致相信息维度新闻类娱乐类微博第信息维度F值较博影响力较导致计算出热度值较高实际情况相符新闻类学类娱乐类第二信息维度F值较说明类热门微博容表示较充实总体热度值较结果新闻类>娱乐类>体育类>情感类>学类实际情况基相符出建立模型较准确反映微博真实热度问题
    34章结
    章基爬取热门微博数通分析信息传播特征提炼影响微博热度素提取重素建立热度体系评级指标运子分析法提取重素建立热度体系评级指标容户传播三角度运子分析法建立微博热度评估模型微博信息维度表达式热度计算公式数进行整理分析终结果进行排序发现模型较符合实际情况表明模型具较高准确性

    第4章 预测模型建立
    41 热门微博判断指标
    形成热门话题需户类事件进行量转发评容观点需集中根微博容博特征微博传播特征预测转发数评数点赞数进判否成热门微博
    微博容博特征复杂性微博传播影响非线性确定性 BP 神网络算法拥非线性映射力等优势输入层输入信号隐含层处理输出节点产出输出信号应范围十分广泛拓扑结构包括输入层隐层输出层文拟采典型三层 BP 网络结构图41

    图41 进行预测拓扑结构
    微博点赞行反映户话题关注程度容认程度转发行说明条微博传播范围评行反映户话题参度户行说明条微博热门程度文选取热门微博均讨数量均转发量均评数均点赞数衡量微博热门程度指标通公式进行计算:
    (41)
    中分转发量评数点赞数选取项指标综合构建出反映容热度度量公式公式:
    +++++ + (42)
    根式(42)容热门度量值该度量值根时间先存储时间序列中代表第i 时间间隔热门度量值序列 中前观测值关系诶非线性映射公式(43):
    (43)
    42 结合PSO算法BP 神网络热门预测模型
    BP 神网络算法目求解全局优值BP神网络算法局部进行优化策略调整缺点算法容易陷入局部优PSO算法具良局部开采力通改变粒子学模式提高迭代速度快速更新粒子位置确立全局优粒子效果精度俱佳果BP神网络嵌入PSO算法中提升局部搜索力优化原算法初始权值阈值基训练集BP 神网络实行训练实现BP神算法优势互补完成预测模型构建文结合PSO算法建立BP 神网络热门预测模型
    421 算法原理
    结合PSO算法建立BP 神网络热门预测模型步骤:
    步骤 1:章提微博热度评价指标根公式(45)计算微博热门度量值该度量值根时间先存储时间序列中构建模型数训练集输入层中作输入值作神网络输出值
    步骤 2:粒子位置速度进行初始化时设置函数变量数粒子种群规模迭代次数粒子搜索空间位置信息
    步骤 3:定义适应度函数计算全部粒子适应度值
    步骤 4:判断Vi Xi否超出设定范围
    步骤 5:时更新粒子速度位置达设定迭代次数差值满足界限时输出输出次全局优解果未达条件重复进行步骤4
    步骤 6:粒子找优解中寻找全局优解输出作参考BP 神网络输入层输入权值初始阈值
    步骤 7:基述数训练集建立BP 神网络预测模型计算预测误差通断迭代修正权值直进行输出
    步骤 8:热度序预测阶段预测值Sl+1
    通断调整位置参数次迭代找全局优解获取BP 神网络输入层输入权值初始阈值结合PSO算法构建BP神网络预测模型实现话题热度预测
    422 模型实验环境数获取
    章第三章研究基础基matlab仿真工具建立预测模型根章中通爬虫技术获取五种类型热点话题微博信息时间原种类型前两条微博公式(42)时间序列构建结合PSO算法BP神网络预测模型进行预测分析然热门微博变化趋势变化程度进行分析
    423 预测模型参数设置
    算法通断调整位置参数次迭代找全局优解确定终参数获取输入层输入权值初始阈值文中选取适应度函数时采matlab中Ackley函数该函数时首先进行参数设置粒子种群规模确定20加速常数设定粒子运动速度限制5迭代次数100粒子位置限定图42粒子迭代次数增加适应度值变化:


    图42 粒子适应度值
    图出着迭代次数增加粒子适应度值首先迅速降第十五代时适应度值趋稳定说明迭代次数越高粒子适应度值越性会越
    文BP神网络结构设置粒子学速率设置默认优值精度化原理选择合理训练数集规模BP神网络中隐含层节点数会预测结果产生较影响般说隐含节点数越误差首先会降低达优值误差会节点数增长变实际研究目出发选取预测结果产生误差隐含节点数
    文拟通结合文献验具体实验操作决定隐含层节点数目误差化
    首先进行仿真实验时先隐含层节点数初始值设定成1观测区间设定节点数累次增1观察均误差值变化情况取隐含层节点书进行组独立试验提高实验准确性降低偶然素影响实验结果表明隐含层节点数均相误差波动图43







    图43 隐含层节点数 MSE 值变化图
    根图43隐含层节点数取5时预测结果均相误差
    424 预测结果分析
    文根均相误差(简称MSE)判断预测模型准确性通公式求:
    (44)
    式(44)中代表热度指数预测值热度指数实际值时间关系章第三章中五类话题前两热门微博BP神网络模型模拟话题热度变化预测时间阶段热度指数
    话题推送热门热门程度会保持变会时间增降低时间热门程度指数变化率会存差异相隔时间短变化率会较相隔时间长变化率会越量化两者间联系文引入话题热门程度增长率衡量微博热门程度变化趋势计算公式:
    (45)
    式(45)中值含义预测点前时间间隔热门趋势增长率算数均值
    第时间间隔预测值第时间间隔定程度反映热门微博趋势变化趋势变化程度值正负反映话题热门趋势值0时说明该微博热门指数会升值0时说明该微博热门指数会降通分析数值衡量微博热门程度变化时公式(45)够衡量时间间隔前热门程度值影响程度相隔时间影响程度越相隔时间短影响程度越
    根章热门话题相关信息结合 PSO算法建立BP 神网络热门微博预测模型基该模型文五种话题时间阶段热度变化趋势进行预测计算预测值根公式(45)条微博热门程度增长率分析微博热门指数变化趋势变化程度结合实际情况进行分析出相应结表 41 基预测模型记录热门微博趋势预测数信息
    表41 热门微博趋势预测情况
    热门微博
    热门程度
    变化趋势
    变化强度


    1

    03389
    51793
    4963
    2

    03389
    162482
    159982
    3

    03560
    178374
    16853
    4

    04573
    7765
    767
    5

    01484
    136689
    136624
    6

    01631
    98437
    96871
    7

    00017
    93235
    93317
    8

    02285
    145718
    145262
    9

    03179
    49257
    48568
    10

    02541
    139535
    138355
    表41微博热门指数变化趋势变化程度预测值实际值直观预测值实际值间误差较根热门程度增长率较准确反映出微博热门程度变化趋势变化强度根表41中预测结果分析新闻类话题二条微博热门趋势相反新闻类第二条微博升程度较第条微博降程度更预测新闻类第二条微博时间阶段会成新闻类第条热搜微博时间验证发现实际相符反映文建立预测模型
    较准确预测热门程度变化趋势
    43 章结
    章利PSO 算法较优全局搜索特点提出结合PSO算法BP神网络微博热门预测模型通熟练掌握PSO算法BP神网络算法步骤基matlab仿真工具完成实验参数设置隐含层节点数选取构建时间序列模型确定模型输入值终微博热门指数变化趋势变化程度热门程度指数预测值时间验证发现预测结果实际相符合反映文建立预测模型较准确预测热门程度变化趋势


    文研究容新浪微博背景展开微博成日常生活中必少社交工具已成信息传播台微博热搜中曝光度高阅读数量者互动数较高容信息较容易成热门微博台中包括热搜排行榜热门话题等位户进行推送会根热度热门微博容进行排序文分析影响热门微博传播素拟建立热度评价模型热门微博预测模型通计算热门微博热度热门程度变化趋势话题热度监控预测文成果:
    (1)运爬虫工具爬取五类话题热门微博结合户影响力容影响力传播影响力基子分析法建立微博热度评价模型选择子指标时外增加重度传播率互动数两指标建立较完善符合前微博热度体系评级指标2019年4月21日新浪微博台python分爬取关新闻体育学情感娱乐五热门话题前五条微博参考指标进行处理加工获相应微博子数通SPSS子分析微博信息维度表达式热度计算公式数进行整理分析终结果进行排序表明热度评估模型模型具较高信度
    (2)弥补BO神网路算法容易陷入局部优缺陷提出结合PSO算法BP神网络微博热门预测模型分析热门微博判断指标确定通熟练掌握PSO算法BP神网络算法步骤基matlab仿真工具完成实验参数设置隐含层节点数选取构建时间序列模型确定模型输入值终微博热门指数变化趋势变化程度热门程度指数预测值时间验证发现预测结果实际相符合反映文建立预测模型较准确预测热门程度变化趋势次研究现实情况预判具定指导意义
    参考文献
    [1] Albert R Jeong H Barabasi AL Error and attack tolerance of complex networks[J] Nature 2000 406(6794) 378
    [2] Lerman K Ghosh R Information Contagion an Empirical Study of the Spread of Newson Digg and Twitter Social Networks[J] Computer Science 201552 166176
    [3] Yang Zi Guo Jingyi Cai Keke Understanding retweeting behaviors in social networks[C] Proceedings of the 19th International Conference on Information and Knowledge Management Toronto Canada 2010 16331636
    [4] Zamparas V Kanavos A Makris C Real Time Analytics for Measuring User Influence on Twitter[C] IEEE International Conference on TOOLS with Artificial Intelligence IEEE 2016 591597
    [5] Mei Y Zhong Y Yang J Finding and Analyzing Principal Features for Measuring User Influence on Twitter[C] IEEE First International Conference on Big Data Computing Service and Applications IEEE Computer Society 2015 478486
    [6] Zhu YX Zhang XG Sun GQ etal Influence of Reciprocal Links in Social Networks[J] Plos One 2013 9(7) 103107
    [7] Teutle ARMTwitter Network properties analysis International Conference on Electronics Communications and Computer 2017 415
    [8] Golder S A Yardi S Structural Predictors of Tie Formation in Twitter Transitivity and Mutuality IEEE International Conference on Social Computing 201067
    [9] 付文豪社交网络信息传播实证分析应[D] 南京:南京邮电学硕士文 2017 1027
    [10] 郑斐然 苗夺谦 张志飞 等 种中文微博新闻话题检测方法[J] 计算机科学 201239(1) 138141
    [11] 张鲁民 贾焰 周斌 等 种基情感符号线突发事件检测方法[J] 计算机学报 2013 36(8) 16591667
    [12] 跃 蔡博驰 基子分析法微博热门程度评价模型[J] 统计决策 2016(18) 5254
    [13] 宋蕾 张培晶 基LDA题建模微博舆情分析系统研究[J] 网络安全技术应 2014(4) 5
    6
    [14] Puvipadawat SMurata TBreaking news detectection and tracking in Twitter[C] Proc of the 9th IEEEWICACMIntConf on Web Intelligence and Intelligent Agent Technology (WIIAT'10) New York ACM 2010 120123
    [15] 王长宁 陈维勤 许浩 微博舆情热门程度监测预警指标体系研究[J] 计算机现代化 2013(1) 126129
    [16] 赵晓航 基情感分析题分析微博时代突发事件政府信息公开研究——新浪微博天津爆炸话题例[J] 图书情报工作 2016 60(20) 104111
    [17] 刘功申 孟魁 谢婧 种微博预警算法[J] 计算机科学 2014 41(12) 3337.
    [18] Zhang Zhenhai Li Shining Li Zhigang et alMultilabel featurese lection algorithm based on information entropy [J] Journal of Computer Research and Development 2013 50(6) 11771184.
    [19] Yan Hong Guan Yanping Method to determine quantity of internal nodes of back propagation neural networks and its demonstration[J] Contro Engineering 2009 16(S1) 99103.
    [20] 连芷萱 兰月新 夏雪 刘茉 张双狮 基首发信息微博舆情热度预测模型[J] 情报科学 2018 36(09) 107114
    [21]
    [22] 文档香网(httpswwwxiangdangnet)户传

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 20 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    基于node的微博的设计与实现

    基于node的微博的设计与实现design and implementation of microblog based on node 摘要千禧年后, Twitter开始进...

    10个月前   
    280    0

    微博营销分析工作报告

    微博营销分析工作报告微博热点数据分析· 医疗健康领域上榜情况较少,且留存时间较短· 能够占领热搜的以社会类事件为主,热度降得很快· 热搜话题的平均上升时长为3.5小时,相关账号在上升时间内给出...

    10年前   
    511    0

    基于微信小程序的测试设计与分析

    基于微信小程序的测试设计与分析Testing Design and Analysis Based on WeChat Mini Program日成绩评定 成绩项论文成绩(百分制)折合比例...

    3年前   
    960    0

    基于微博的企业营销创新研究

    基于微博的企业营销创新研究 摘要:近年来微博异军突起,在传递商品信息的过程中发挥着越来越重要的作用,也深刻影响了企业营销模式。在促进人际交流与信息传播的同时,微博作为营销平台的价值也逐步显现...

    10年前   
    8592    0

    我看微博

    我看微博 “微博”,已经不记得具体什么时候听说这个名词了,注册新浪微博是在2011年10月份,当时也不知道“新浪微博”到底是个什么东西,只是看到新闻经常提到它,并预测新浪微博会有多么火,于是...

    10年前   
    9899    0

    微博微语 感悟人生

    微博微语 感悟人生  岁月如同藏在手中的细沙,总是会从指间偷偷的滑落。她悄无声息,却总能留下一些不易觉察的痕迹。也如花开花落,花瓣离落之时,总会有暗香残存!于是不经意间,人们在时间的流动中,各...

    10年前   
    804    0

    微博微信工作汇报

    ***微博微信对外宣传工作 开通“***发布”官方微博、微信对外宣传公共平台以来,我县对外宣传工作也紧跟时代步伐,正式迈入“微”时代。经过半年多的运行和推广,“***发布”官方微博、微信粉...

    5年前   
    1968    0

    基于信息流的流程协调分析

    基于信息流的流程协调分析 摘要:流程的描述和再设计是变化管理的主要内容。通常流程是用活动及其逻辑关系来定义的,流程变化相应地集中在活动关系的调整或管理活动依赖的协调机制的调整。针对协调理论存...

    12年前   
    7386    0

    如何经营你的微博

    如何经营你的微博(2011-09-08 19:10:33)迮钧权的博客针对企业微博有企业微博的经营方法,针对个人微博有经营个人微博的方法。为什么去经营微博,首先,这个时代如果你还没有微博你就真...

    11年前   
    615    0

    如何写好微博

    如何写好微博如何写好微博【1】、要写好一个微博,就如果要做好一件事情,都最好在一开始脑中要有一个规划。明白自己开微博的定位,为什么要开,写微博想要获取什么?在一开始想好了这些,也就是给自己的微...

    12年前   
    636    0

    微博热门话题

    效果:新浪微博热门话题小时榜单前十规则:1.导语,如果要打广告,得上榜后再修改为带广告的导语,上榜前,不能为硬广告2.推荐和置顶的博文,上榜前也不得推荐和置顶,得上榜后,再推荐置顶 3.推荐的...

    12年前   
    1008    0

    微博社区管理规定

    微博社区管理规定第二条新浪微博用户在本平台的活动不得违反现行法律法规。本平台将按照相关法律法规及用户注册协议,配合司法机关维护被侵权人合法权益。第三条站方负责本规定的解释及执行。第二章 基本原...

    2年前   
    693    0

    论微博信息传播的发展创新

    微博是网络社会环境中新出现的一种信息传播形式,它具有即时性、便捷性、交互性强等优势。微博给信息传播和新闻报道注入了新的活力。然而,微博中也存在信息失真等问题,需要完善微博信息审核制度,实行微博用...

    3年前   
    543    0

    各级官方微信、微博、网站管理办法

    第一章 总 则第一条 为加强校园网络阵地的管理和建设,进一步规范学校各级各部门微信、微博、网站的运行与管理,满足广大师生、校友及公众对新媒体

    4年前   
    1256    0

    微博策划方案

    微博策划方案  一、微博定位  做羽毛球产品推广,希望我的微博在被人眼里很有活力,因为是要推广体育用品,要让别人感受到做微博的人活力四射。有人在做同样的行业,但是不多,粉丝也不多。  二、微博...

    9年前   
    657    0

    微博易-产品总监

    产品总监(总裁助理)岗位职责:1、负责网站产品的整体规划、运营、设计和产品生命周期管理(从概念提出到产品上线);2、分析项目、用户需求,分析竞争对手动态和市场动态,规划产品路线图;3、能够领导...

    12年前   
    576    0

    法院微博管理办法

    市中级人民法院微博管理办法(试行) 开通法院官方微博,是网络时代进一步推进司法公开,回应社会关切的积极举措。可以拓展司法宣传渠道,打造信息发布平台,并以此普及法律、宣传法院、汇聚民智、沟通民...

    10年前   
    9883    0

    微博写作与管理技巧

    微博写作与管理技巧专业微博写作十技巧一般将微博分为,个人微博、专家微博、企业微博(官方微博)几类,我突出专业微博,是认为,与专业人士(包括兴趣爱好相同的一群人)交流,更能发挥微博的价值,可以打...

    9年前   
    717    0

    微博写作技巧

    微博写作技巧微博写作技巧首先,要想好自己微博的定位,看自己能不能回答下面这两个问题?为谁写微博?是为亲友写,为自己写,还是为某个特定人群(如旅游爱好者、投资界朋友、科技界朋友)写?写微博主要为...

    9年前   
    683    0

    微博快速涨粉丝

    粉丝墙是目前来说涨粉丝最快的一种涨粉方法!只需要每天关注它的粉丝,自己的微博也会跟着快速涨粉!关注的粉丝一周内不能取消关注,一周后再取消!每小时只能关注一次!这个是我微博涨粉最快的软件!每天要...

    11年前   
    805    0

    文档贡献者

    王***朝

    贡献于2020-09-01

    下载需要 20 香币 [香币充值 ]
    亲,您也可以通过 分享原创文档 来获得香币奖励!
    下载文档

    该用户的其他文档