MapReduce在Hadoop中的性能分析


    MapReduceHadoop中性分析
    第1章      Hadoop台研究
    31  Hadoop思想源:Google
    Google服务非常包括Google搜索引擎Gmail安卓AppspotGoogleMapsGoogle earth Google学术Google翻译Google+等产品体系中重Google引擎Google核心历史悠久服务Hadoop思想Google搜索引擎中技术
    Google爬虫全世界数服务器爬会抓回网页网页天说百万千万级少亿网页级传统企业想法买存储里面成千万硬盘网页全部放存储里面购买存储成较高特性非常卓越存储价格性曲线指数级升Google说会考虑种昂贵设备般说会网页分散PC服务器里面进行存储实际Google服务器没硬盘网页资讯全部存存里面加快检索速度Google思想面Hadoop带影响Google核心算法pageRank网页价值评分Google垃圾中找黄金关键算法算法成天Google根链接关系判断页面价值果页面指更该页面较重页面网站价值样果pageRank较高网站指pagerank较低网站指价值样Hadoop中MapReduce思想计算pageRank算法
     
    32 hadoop源起
    HadoopDoug Cutting开创种开源软件hadoop早源头Lucene软件开源java书写代码实现Google类似全文搜索功提供全文检索引擎结构包括完整查询引擎索引引擎Lucene软件早发Doug Cutting网站SourceForge开源网站里面2001年年底成apache软件基金会jakarta子项目
    Lucene目软件开发员提供简单易工具包便目标系统中实现全文检索功者基础建立完整全文检索引擎
    Lucene身种搜索引擎数量时候Google样会面样困难说量网页需样存放搜索效率更高样网页价值进行计算样做倒排索引等等问题问题迫Doug Cutting学模范Google解决问题办法
    20032004
    年时候Google公开部分GFSMapReduce思想细节基础Doug Cutting等2年业余时间实现DFSMapReduce机制Nutch性飙升Hadoop2005年秋天作Lucene子项目Nutch部分正式引入Apache基金会2006年3月份MapReduceNutch Distributed File System(NDFS)分纳入成Hadoop项目中Hadoop名字源Doug Cutting子玩具象
    33 hadoop目前达高度
    发展天haddop7年时间hadoop已长远发展逐渐走成熟目前hadoop底达什样高度呢?
    (1)      实现云计算事实标准开源软件做云存储做MapReduce计算时候云计算实现般首选hadoop基没竞争手厂商争着hadoop方争先恐形容方面会hadoop开源代码做改善作产品推出EMChadoopOraclehadoop解决方案方面厂商会产品hadoop连接工具说Oracle数连接器部件部件Oraclehadoop里面数文件作外部表
     
    (2)      包含数十具强生命力子项目
    Hadoop目前止已项目家族里面十子项目子项目强生命力说hadoop发展前景非常光明
    (3)      Hadoop构造型集群集群节点达数千节点处理数量排序时间断破世界纪录达PB级
     
    33  hadoop子项目家族
     
    面层hadoop核心代码核心代码实现两项关键功hadoopMapReducehadoop分布式文件系统HDFS两功hadoop两支柱两支柱子项目Pig般hadoop写MapReduce程序流方法java假设hadoop户java程序员需东西方便户基目Pig诞生Pig种轻量级语言类似show命令方式输入数处理者数分析命令系统会动命令转变成MapReduce程序进行MapReduce工作结果返回户Pig作相户MapReduce中间转换器
    子项目Hive相sql语言MapReduce间映射器传统数库工程师娴熟sql语言果sql语言进行数查询者数分析困难Hive面数库工程师需命令提示符输入sqlHive会动sql转变成MapReduce然转变成分布式务节点中运行运行结果返回户某种意义说
    Hive理解成关系型数库Hive功相简单支持sql语句复杂连接者子查询支持起较困难
    子项目Hbase非关系型数库列式数库列式存储Hbase面数分析数行存放样做处:提高响应速度减少IO量Hbase身做成分布式集群
    ZooKeeper负责服务器节点进程间通信通讯协调工具Chukwa相数集成工具说数源数源生产线服务器产生日志信息Chukwa安排数源定时java取hadoop中进行数分析
    整hadoop项目中子项目动物做Logo说hadoop象Hive蜜蜂Chukwa乌龟通讯协调软件ZooKeeper动物园理员
    34  hadoop架构
     
    该图机房机柜样子画长方形代表台物理服务器(节点)物理节点通网线连接交换机交换机连接中心交换机通出口机房外面户客户端通互联网访问图片JobTrackerNamenodeTaskTrackeerDataNodehadoop台进程Oracle台进程样
    进程中重Namenode(名称节点)NamenodeHDFS守护程序作总控分布式文件系统会纪录文件分割成数块数块存储节点会存IO进行集中理户整hadoop集群连接时首先会访问Namenode获文件分布信息查出找文件节点然访问数节点取出文件hadoop直Namenode作单点旦发生障集群崩溃
    Secondary Namenode(辅助名称节点)监控HDFS状态辅助台程序NameNode中元数信息重新保存份副Namenode会动Secondary Namenode进行通讯定期保存HDFS元数快Namenode障作备Namenode DataNode(数节点)运行子节点中负责HDFS数块读写文件系统
    JobTracker(作业踪器)运行节点MapReduce体系进行总调度处理户提交作业决定文件参处理然切割task分配数节点中Hadoop原运行程序数节点中外JobTracker会监控task果发现崩溃task会task重启然释放占资源集群唯JobTracker
    TaskTracker(务踪器)位slave节点理节点task节点tasktrackertasktracker启动JVM行执行mapreduce务
     
     

    文香网httpwwwxiangdangnet

    《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
    该内容是文档的文本内容,更好的格式请下载文档

    下载文档到电脑,查找使用更方便

    文档的实际排版效果,会与网站的显示效果略有不同!!

    需要 1 香币 [ 分享文档获得香币 ]

    下载文档

    相关文档

    实验3MapReduce编程初级实践

    实验3 MapReduce编程初级实践1. 实验目的1.通过实验掌握基本的MapReduce编程方法;2.掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等...

    1年前   
    816    0

    通信原理课程设计PAM调制与解调系统的MATLAB实现及性能分析

    PAM的调制与解调目录摘要 引言 1.1 课程设计目的 1.2 课程设计内容 2.1 PAM调制信号的频谱 2.2 PAM调制过程的波形和频谱图 3.1正弦波矩形抽样 3.2矩形波调制 ...

    1年前   
    382    0

    各类给水管材的性能比较分析

    各类给水管材的性能比较分析

    4年前   
    705    0

    Q345钢板焊接性能分析解读

    Q345钢板焊接性能分析摘 要:本文进行了Q345钢板焊接性能分析。首先根据板材制定了埋弧焊对接试验,然后用卧式显微镜对焊接接头进行宏观和微观分析,并用维氏硬度测试仪检测焊接接头的维氏硬度,同...

    2年前   
    540    0

    性能测试方案模板

    XXXX系统性能测试方案撰写人:周莉芳创建日期:2016.09.19审核人:审核日期:文档类型正式稿有效期限文 档 历 史日期负责人操作类型版本号说明2016/9/19周莉芳新建V1.0新建目 录1.

    10年前   
    557    0

    动力性能工程师职责职责

    动力性能工程师职责职责1.制作零部件设计方案。2.零部件设计开发。___项目组内直辖市及供应商、客户之间的有效沟通。动力性能工程师职责21.活塞、连杆、活塞销、活塞环组设计。2.发动机平衡振动...

    2年前   
    399    0

    住宅性能认定协议

    住宅性能认定协议  委托单位:_________________________  项目名称:_________________________  认定等级:_________________...

    10年前   
    521    0

    常用钢材型号、性能特性

    45——优质碳素结构钢,是最常用中碳调质钢。主要特征: 最常用中碳调质钢,综合力学性能良好,淬透性低,水淬时易生裂纹。小型件宜采用调质处理,大型件宜采用正火处理。应用举例: 主要用于制造强度高...

    11个月前   
    298    0

    高聚物的介电性能

    高聚物的介电性能介电性是指高聚物在电场作用下,表现出对静电能的储存和损耗的性质,通常用介电常数和介电损耗来表示。(1)介电极化绝大多数高聚物是优良的电绝缘体,有高的电阻率,低介电损耗、高的耐高...

    2年前   
    667    0

    Hadoop运维工程师岗位职责简洁版

    Hadoop运维工程师岗位职责简洁版1.负责Hadoop相关项目日常运行维护、故障排查工作;2.负责Hadoop集群的监控和配置调优工作;3.负责Hadoop平台的用户管理、权限分配、资源分配...

    2年前   
    461    0

    中青班党性分析报告

    在一个多月的中青班学习培训中,通过系统学习政治理论知识,我思想教育很大,内心感触很深。按照县委党校中青年干部培训班学习要求,我认真学习了党的作风建设的有关文件精神,联系自己的思想和工作实际,深刻...

    1年前   
    343    0

    中青班党性分析报告

     自在党校参加中青班学习以来,通过认真聆听教师讲课、与学员开展交流谈心活动,思想教育很大,内心感慨很深,进一步增强了发挥党员作用、干好本职工作的信心和决心。对照机关党员先进性标准和要求,结合自身...

    10个月前   
    378    0

    中青班党性分析报告

      在这两个月的时间里,我有幸参加了中青班的学习。无论思想信念还是理论水平等方面都有了一定程度的提高。但与革命前辈及各位老师、同学相比,还存在着很多不足和需要学习、改进的地方。现联系自己的实际情...

    10个月前   
    210    0

    中青班党性分析报告

     时光荏苒,参加区直机关工委党校第20期中青年干部培训班的学习已近尾声。在这里听名师授课、学时政精化,充实而又紧张的学习生活不时鞭策着我多思、多想,容不得一丝杂念;前沿且先进的理论导向时刻推动着...

    1年前   
    338    0

    建筑工程钢筋力学性能及工艺性能试验报告

    建筑工程钢筋力学性能及工艺性能试验报告委托单编号: 试验记录编号: 试验报告编号: 委托日期: 年 ...

    1年前   
    294    0

    2017年高性能聚羧酸混凝土减缩材料的性能测试

    高性能聚羧酸混凝土减缩材料的性能测试  一般认为,用于结构上的水泥混凝土要求具有良好的工作性能、较高的强度和优异的耐久性能。为了满足这些要求,水泥混凝土往往采用提高水泥用量和细度、大量使用矿物...

    6年前   
    472    0

    高性能混凝土的配制与应用

    高性能混凝土的配制与应用 目  录                    一、高性能混凝土的基本概念……………………………………………………1     (一)出现背景………………………...

    5年前   
    1178    0

    工程材料学 铸铁的组织与性能

    工程材料学 铸铁的组织与性能实验一  铸铁的组织与性能一、实验目的1、观察灰口铸铁中不同类型石墨的形貌及基体组织。2、观察灰口铸铁中磷共晶的形态及分布。二、实验原理铸铁是含碳量大于2.14%或...

    11年前   
    616    0

    高性能环保塑料管道项目

    商 业 计 划 书项目名称: 高性能环保塑料管道项目 项目单位: XXXXXXXXXXXXXXXXXXXXX 地 址: ...

    11年前   
    717    0

    恒温水浴的组装及其性能测试

    恒温水浴的组装及其性能测试    实验者:�器  调压变压器  恒温水浴的组装及其性能测试  实验者  周进 陈小辉   实验时间  2000.5.15  室温 ℃  22.6  大气压pa ...

    11年前   
    596    0