摘适应环境企业发展条件提供包括企业具确定相运动构件组合等互联网注册名称互联网较重部分成套设备系统控制完整网络台服务构建电子商务寄放台数国重信息源着市民空间三维立体网络化时代验知识快速发展空间立体化发展史越越快步行中全世界区山川气候变化等然环境物产交通居民点等社会济素总情况网络化时代验知识应更加广泛彻底促进企业发展发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称构建电子商务寄放台数利弊通常涉通互联网提供动态易扩展常虚拟化资源台网络数时代作规模数分析流验知识模式基础基础数较时代背景基互联网相关服务增加交互模式通常涉通互联网提供动态易扩展常虚拟化资源台网络数时代优势中国行业网络化时代理系统实际应求相结合实现方性数理特数存储模型Spacti矢量规模数理中Al备检数转换空间三维立体咨询数视化文中提出规模方性数组织化理方法体系关键验知识
关键词:矢量数全世界区山川气候变化等然环境物产交通居民点等社会济素总情况网络化时代系统(GIS)空间三维立体数理Hadoop耕质量等数
Research and Implementation of Large Data Processing Algorithms
AbstractIn the era of big data data has become an important part of national basic strategic resources With the rapid development of 数网络时代 citizen s GPS and other spatial information technology the means of spatial data acquisition are more and more diversified and the application of geographic information technology in all walks is more extensive and thorough which promotes the arrival of the era of 数网络时代 big data The big data is the doubleedged sword The explosive growth of vector data in high precision and breadth provides a good opportunity for national macroscientific decisionmaking social supervision and public service and strengthens the ability of public service W and emergency decisionmaking management But at the same time in order to maximize the effect the effective method of collating and managing largescale vector data has become a reality Difficulties that need to be urgently addressed in applications In recent years cloud computing platform 网络数时代 as one of the mainstream technologies of largescale data analysis has achieved excellent performance in largescale data processing based on distributed storage system HDFS
and parallel computing system MapReduce On this basis under the background of large data 网络数时代 advantage of cloud computing platform is combined with the practical application requirement of Chinese industry information management system and vector large data management is realized Especially in this paper Al index data conversion spatial consultation and data visualization of data storage model in Spacti vector largescale data management are proposed for largescale application The method system and key technology of the organization and management of vector data are verified by experiments At the same time a prototype system of national cultivated land quality database management under cloud environment is designed and implemented The practical significance and application value of the results
keywordVector Large Data Geographic Information System (数网络时代) Spatial Data Management 网络数时代 Cultivated Land Quality and Other Data
目录
第1章引言 1
11课题简介意义 1
12国外研究现状分析 2
第2章矢量数云存储模型研究 6
21全世界区山川气候变化等然环境物产交通居民点等社会济素总情况关系数模型 6
22基互联网相关服务增加交互模式通常涉通互联网提供动态易扩展常虚拟化资源环境 10
第3章矢量数分布式民树备检研究 11
31分布式空间三维立体备检 11
32矢量数划分 13
33 分布式环境矢量数划分策略 13
第4章空间三维立体数行查询 14
41基原理 14
42行务分解 16
第5章结展 17
1)提出矢量数云存储模型 GeoCSV数模型 18
2)提出基空间三维立体编码数划分方法 18
3)设计实现矢量数瓦片金字塔模型行构建算法 18
参考文献 19
第1章引言
11课题简介意义
适应网求提供企业网络址网较重部分成套动力设备中起作机器寄件系统系统控制完整网络台服务台现数发展越越快速领域发生根变化年中国实施数战略实施2015年国家会议促进数开发发行行动台国家数战略实施明确推进数认基战略资源宇宙网络化时代科学领域着国家基测量·制作球观测系统位置网络化时代服务系统社会网络w互联网等空间三维立体数验知识发展发展空间三维立体数取速度显示爆炸性增长目前根中国质调查计划形成基网络化时代数已达定程度北京公交卡适数天4000万次铁天1000万次数常常作手臂样非常重空间三维立体数增加带传统数网络时代产业特基互联网相关服务增加交互模式通常涉通互联网提供动态易扩展常虚拟化资源NOSQL数库新代高性计算验知识开发成熟相关理方法逐渐开始渗透G投资领域实现工业化商业空间三维立体数动处理断路软件基础软件尤档软件目前远程传感数w领域中心形成基云存储离散性计算体系台该台聚集起储存组织化解析视化应关方性数研究需改进方面规模方性数包含诸国家济国防基础设施特殊素享规模方性数非常困难适较少互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台背景规模方性数保存理视化应关键验知识作焦点仅促进中国规模空间三维立体数软件产品开发具重理意义
12国外研究现状分析
科学营研究理发现着计算机科学验知识发展计算模式发展数时代模式种样年描述网络化时代爆炸新时代数顶尖国际学术杂志标志着适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网公司注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建
电子商务寄放台商业部门Google微软IBMAlijibaBaidu等种型跨国公司需完善成熟驱动系统2013年中国成立天然资源基金数研究项目组科学商业然政治全世界开始理解数网络化时代采矿知识发现宝物称规模数研究应然测试场通巨数验知识流动驱动数网络时代进入新时代学者适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务
(1)新思想新反映客观事物般质特征
着时代数仅实现世界数重性触发许产业基变化数较时代般化数网络时代必数网络时代终开发目标追求数网络时代般化通城市中连续取种均匀规模数合解析达解决城市面种问题程研究类空间三维立体行动特性理方法然社会济现象空间三维立体时间分配联系程进行明确ER交通居民点等社会济素总情况空间三维立体网络化时代学处适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台UT通种手段聚集起空间三维立体时间数服务科学验知识提取理门学科综合球种物理目标类活动方法学术者提出数指通航空宇宙卫星航空宇宙卫星面传感器等球观测数许详细描述球环境变化图间相互作数组成研究员时间
时间数定义空间数合巨数质定义HICH实际全世界区山川气候变化等然环境物产交通居民点等社会济素总情况世界空间三维立体构造空间三维立体关系素(现象)量质量特性合计算时间起变化数集讨研究数网络时代适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称学者认数网络时代正面着量数数飞跃通新想法反映客观事物般质特征较研究现规模数时代数网络时代带着某种影响现数网络时代处「数」阶段数网络时代核心命题基参数没数影响根变化需学者完成数网络时代数价值
(2) 数网络时代数具性
数常常称数网络时代重中重部分核心驱动力适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台致数量数图11示根数V特征数网络时代数原点远程感测数基映射数位置数社交网络数数互联网5类李结数网络时代数通常班级间交叉点
1)远程传感验知识开发远程传感数样化空间三维立体传感器区分物辐射量细微变化力传感器灵敏度断提高通包括航空宇宙航空相邻空间三维立体远程感测台取远程感测数量特殊级增加储藏级达高级
2)国土数值图:般说国土全世界区山川气候变化等然环境居民点等社会济素总情况数产业区气候变化等然环境物产交通居民点等社会济素总情况数题测量数等般4 D(DLGDRGDOMDEM)电子产品产土利型数交通网络D生成国家基测量映射日着包括塔城市规划水产业年新测量化验知识高度化测量化方面规模数时代正加速例点云18移动映射滑块测量等快速高效获测量区域空间三维立体分布数
3)位置特数1303940:通常具空间三维立体位置时间标记全世界区山川气候变化等然环境物产交通居民点等社会济素总情况性社会网络化时代数称直接间接关联着相球某点数直接间接关联着相球某点数GPSBeidou定位数智手机生成直接间接关联着相球某点数场数14142中聚集起场交通轨道数143等定位数认识类社会集体活动规律重战略性战略性战略性素成新资源
4)社交媒体数:户Web网页点击包含数空间三维立体位置互联网数QQ等聊天软件等社交媒体生产数吉卜宅生成图形数目前社交媒体数定社会空间围绕中介性社会事件发生然灾害监视环境法施行等领域发挥重作
(3)面机遇挑战
1990年代网络化时代革命网络革命产生全世界区山川气候变化等然环境物产交通等社会济素总情况网络化时代科学191反映客观事物质特征20年里数网络时代数字球数字城市建设中发挥重作天类迈入建设智城市重适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台时数网络时代发展带新机遇挑战
数较时代数网络时代提供更数资源数视数网络时代血赖数时物品基互联网相关服务增加交互模式通常涉通互联网提供动态易扩展常虚拟化资源网络支撑庞适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台泛维动力互联网+网络动化实时化等时代19新特征难认识认知外包发全世界区山川气候变化等然环境物产交通居民点等社会济素总情况网络化时代服务方新时代特征数网络时代注入新活力方面型适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务构建电子商务寄放台数网络时代提供丰富数资源时出现火花等基互联网相关服务增加交互模式通常涉通互联网提供动态易扩展常虚拟化资源台基分布式存储行计算
然基big data+simple method现研究理没继承数网络时代核理解决数网络时代重问题数数网络时代开发
带机会提出数网络时代更高求作空间三维立体数积累理分析视化重工具数网络时代面着许重适应具性质特点事物形成类发展阶段企业者网求提供包括企业具确定相运动构件组合等互联网注册名称互联网识企业具确定相运动构件组合网络址注册成套动力设备中起作机器寄件系统系统控制完整网络台服务继续数网络时代数研究热点数视化角度传统数网络时代数视化表现集中符号化尺度二维三维合研究热点数简单视化外网络化时代提取合成重视化仅仅图形显示功数分析采矿重手段数时代视觉分析法外规模数11时代空间三维立体数安全隐私空间三维立体时间数3标准化标准化等果解决阻碍数网络时代规模数享化应发展
第2章矢量数云存储模型研究
21全世界区山川气候变化等然环境物产交通居民点等社会济素总情况关系数模型
图21示空间三维立体数存储图形文件中
(1)拓扑数结构
拓扑数结构(118具相位关系方性数结构)综合全世界区山川气候变化等然环境物产交通居民点等社会济素总情况编码参考(虎)等数网络时代中参空间三维立体象(元素)间方位关系11具相位数结构方性数确保数质量强化空间三维立体分析功
图2 2示拓扑结构表示方性数包括基素组成电流路径种装置电源中连接三三支路点弧形边形球洞组成电流路径种装置电源中连接三三支路点指三线交叉点:弧简单虚线弧段组成完全封闭空间三维立体连接区域称边形
矢量拓扑数结构中arcs认数结构基单位弧文件呈现序图形出现号码构成分包含弧编号开始组成电流路径种装置电源中连接三三支路点末端组成电流路径种装置电源中连接三三支路点左边形右边形左右左右左右弧前方组成电流路径种装置电源中连接三三支路点文件组成电流路径种装置电源中连接三三支路点记录构成组成电流路径种装置电源中连接三三支路点记录包括组成电流路径种装置电源中连接三三支路点编号组成电流路径种装置电源中连接三三支路点坐标组成电流路径种装置电源中连接三三支路点连接标记号边形文件包含边形识码边形弧识码事物相互间发生牵连影响属性边形记录构成图2 2例表2 1中示出布局数结构询问文件格式
(2)非拓扑数结构
非拓扑矢量数结构包括描述象空间三维立体关系文件点线表面独立优势优化间没连接优化坐标表行线间没坐标点表面间存边缘相位数结构相位数结构相数蓄积存冗余性单纯性具数载荷显示速度优点数网络时代户中受欢迎非拓扑数非注册商标相互运软件包装具空间三维立体数享重性
信封矩形(BOX)边界框值值存储预定序中存储边形环总数NumPoint存储环总分数片段集存储环第点位置备检点集布局中边形备检长度环数目数备检0开始点次存储边形环点长度点数
22基互联网相关服务增加
网络数时代开放源项目)开始2006年发展独立软件全套2008年成Apache顶级项目图2 4示网络数时代生态系统般HDFS分配文件系统分布式数处理模型HDFSMapReduHIVE(分布式列单位数库)库HBase(分布式列单位组组序连续排列起记录)mahout(机械学)等HDFSMapReduce网络数时代生态圈核心验知识广泛
第3章矢量数分布式民树备检研究
31分布式空间三维立体备检
(1)局部备检(Local Index)
分布式系统子数集组组序连续排列起记录备检通常备检存储相应原始数相备检组成电流路径种装置电源中连接三三支路点中备检141组组序连续排列起记录独立备检组组序连续排列起记录间检索独立障性外组组序连续排列起记录更新备检重构贡献着该分布式备检影响备检函数通备检文件滤组组序连续排列起记录中查询条件相关数记录子组成电流路径种装置电源中连接三三支路点数预备处理全局备检架构相够幅度减少子组成电流路径种装置电源中连接三三支路点组成电流路径种装置电源中连接三三支路点间传送数量缩短数集合时间够提高数检索效率关备检建立效率备检必须针子数集合组组序连续排列起记录构筑备检备检结构成高数检索程中备检文件成高够幅度削减数进行滤波记录数
全局备检
够缩短数读出时间提高检索效率然组成电流路径种装置电源中连接三三支路点组组序连续排列起记录全局备检然完整traversal模式面规模数全球备检架构成符合户需求关键瓶颈时数处理必须集中中间组成电流路径种装置电源中连接三三支路点全局备检架构具网络传输量数合理化合备检更新递增方面备检架构难
混合备检
外混合备检称分布双级指数147 11全球备检备检组合混合备检具优点缺点基混合备检数问题中修饰组成电流路径种装置电源中连接三三支路点组组序连续排列起记录全局备检致屏幕化混合备检幅度改善数搜索效率该缺点备检配置效率低
32矢量数划分
空间三维立体数分割1称空间三维立体数分割1根特定数分割规空间三维立体数集合分割成干相独立组组序连续排列起记录子数集合集群组成电流路径种装置
电源中连接三三支路点散乱存储…目空间三维立体数分割空间三维立体数备检分布式存储前提重构成素效数分割战略够幅提高空间三维立体数行处理力
分布式存储环境中数分割研究中方性数分割常问题图3 2(Global National Administration Region Boundary Map)空间三维立体象均匀分布象均匀单纯范围分割等价分割实现良分割结果
33 分布式环境矢量数划分策略
分布式环境中方性数划分三级分解中心战略中空间三维立体分解空间三维立体数分解空间三维立体分解规山脊
数组数分解组组序连续排列起记录分布式存储组成电流路径种装置电源中连接三三支路点处理计算默认日期分解三县行政分界块商店HFS衡组组序连续排列起记录组组序连续排列起记录日期邻接块补丁素日期块化图34(b)基空间三维立体分解日期范围日期
组组序连续排列起记录相邻 铅空间三维立体数线日期严重倾斜着
第4章空间三维立体数行查询
41基原理
空间三维立体查询操作空间三维立体数存储模型空间三维立体备检密切相关定程度作空间三维立体备检数存储反程非备检网络数时代够动态虚拟化资源池中户者种应系统需提供计算力中空间三维立体查询必须横穿空间三维立体网络化时代记录匹配相应查询结果规模空间三维立体数咨询效率非常低图4 6示该章第三章中结合分布式备检框架空间三维立体行查询分割成三阶段全局滤波阶段滤波阶段精密级
(1)全局滤阶段
全局备检中存储容HDFS中空间三维立体数集D组组序连续排列起记录基网络化时代例组组序连续排列起记录ID包长方形MBR组组序连续排列起记录名称数相较少全局滤波级组成电流路径种装置电源中连接三三支路点运行参行运算查询操作必须首先通全局滤阶段全局前导文件通常存组成电流路径种装置电源中连接三三支路点电子计算机中存储信息中
全局滤波阶段功选择输入空间三维立体范围交叉组组序连续排列起记录中相应空间三维立体关系包括交叉点果十字路口话进入滤阶段
(2)滤级
步骤1中获查询范围相交全部组组序连续排列起记录接着滤波级安全组组序连续排列起记录集合组组序连续排列起记录进行备检滤波该组组序连续排列起记录集合阶段开始行查询动作区域343表示备检组组序连续排列起记录数实体存备检文件
存储组组序连续排列起记录标题文件中分布式R树叶组成电流路径种装置电源中连接三三支路点容包括叶节字节偏移备检网络化时代封装长方形MBR
滤波阶段功选择输入空间三维立体范围交叉叶组成电流路径种装置电源中连接三三支路点中相应空间三维立体关系包括交叉点交叉点果十字路口进入精练阶段果包含直接结果文件全叶组成电流路径种装置电源中连接三三支路点写空间三维立体象
(3)精制阶段
通步骤2您获前组组序连续排列起记录中查询范围相交叶组成电流路径种装置电源中连接三三支路点网络化时代精致化阶段候选集合空间三维立体象致果空间三维立体查询范围交叉包含写入查询结果文件否执行操作精细化步骤功通逐确定查询条件候选集元件间关系获终数查询结果
42行务分解
节集中分布式环境空间三维立体数行提问操作空间三维立体询问操作列性分务间列性务列性前者指批量查询者指查询务分解章节中焦点放查询算法部行计算
图4~图7示电子计算机中存储信息中计算HDFS查询条件相关组组序连续排列起记录执行行计算空间三维立体行查询操作程中组组序连续排列起记录处理设独立子务实现组组序连续排列起记录处理间行性区域容组组序连续排列起记录处理包括两方面:滤精炼组组序连续排列起记录处理操作类似备检化数集合常规单组成电流路径种装置电源中连接三三支路点空间三维立体查询操作数存储结构特定操作分布
式rtree备检空间三维立体行查询行程分两阶段第部分组组序连续排列起记录查询阶段第二部分查询结果合阶段
第5章结展
适应具性质特点事物形成类发展阶段企业者网求然成数然「试验场」面方性数数处理分析视化等局面传统数网络时代产业力受限制空间三维立体数理验知识重开发动具重理研究重性应价值
方性数云模型研究引导数存储行处理进研究提供支持基础分布式R 分布式R 木备检空间三维立体数分割行构筑高性空间三维立体数计算强力保证空间三维立体数转换咨询瓷砖金字塔等arallel处理法规模空间三维立体数处理硬件需求中国耕质量数理应紧急必性研究目构筑够动态虚拟化资源池中户者种应系统需提供计算力
量丢失数效组织化积蓄备检处理视化等更完整空间三维立体数理解决方案时结合土网络化时代系统产业进行事例研究
参考文献
[1]孙科林 基核DSP实时图处理台研究[D]电子科技学2012
[2]罗耀华 高性计算高光谱遥感数处理中应研究[D]成理工学2013
[3]韩海雯 MapReduce计算务调度资源配置优化研究[D]华南理工学2013
[4]楼巍 面数高维数挖掘验知识研究[D]海学2013
[5]张常淳 基MapReduce数连接算法设计优化[D]中国科学验知识学2014
[6]张兰廷 数社会价值战略选择[D]中中央校2014
[7]周纬 矢量数高性计算模型关键验知识研究[D]浙江学2016
[8]宋亚奇 云台电力设备监测数存储优化行处理验知识研究[D]华北电力学(北京)2016
[9]姚晓闯 矢量数理关键验知识研究[D]中国农业学2017
[10]宋杰孙宗哲毛克明鲍玉斌戈 MapReduce数处理台算法研究进展[J] 软件学报201728(03)514543
[11]樊变霞 面数加密方法研究[D]湖北师范学2016
[12]唐云 基Spark规模分布式矩阵运算算法研究实现[D]南京学2016
[13]魏姁妲 基数处理验知识专家机器研究[D]长春工业学2016
[14]王婷 基网络数时代台电信企业客户应数分析系统研究实现[D]北京邮电学2018
文档香网(httpswwwxiangdangnet)户传
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档