作者介绍
Khaled Tannirhas从1980年开始从事计算机相关工作。他是微软认证的开发人员(MCSD),他在领导软件解决方案的开发和实施以及技术演说方面,拥有20多年技术经验。如今,他是一名独立IT咨询师,并在法国、加拿大的许多大公司担任基础设施工程师、高级研发工程师、企业/解决方案架构师等职务。
他在Microsoft .NET、Microsoft服务器系统、Oracle Java技术等领域拥有丰富的经验,并且熟练驾驭在线和离线应用系统设计、系统转换以及多语言的互联网/桌面应用程序开发。
Khaled Tnnirhas总是热衷于探索和学习新的技术,并基于这些技术在法国、北美、中东等地区寻求商机。他现在拥有一个IT电子实验室,实验室中配备了很多服务器、监控器、开源电子板(如Arduino、Netduino、RaspBerry Pi和.Net Gadgeteer),还有一些装有Windows Phone、Android和iOS操作系统的智能设备。
2012年,他协助组织并出席了法国波尔多大学的复杂数据挖掘国际论坛——EGC 2012。
他还是《RavenDB 2.x Beginner’s Guide》一书的作者。
译者简介
范欢动 信息技术领域的一名老兵。1994年获得电力系统及其自动化专业学士学位。1997年获得信号与信息处理专业硕士学位。兴趣广泛,涉及技术领域和非技术领域,但大多浅尝辄止。参与过航天、通信、电子出版和金融领域的信息处理、软件架构与开发,以第一作者或合作者身份拥有三项实用新型专利,并获得第十八届北京市优秀青年工程师称号。曾在佳讯飞鸿电气股份有限公司、英国雅讯(xarios)北京代表处、博云科技等公司担任产品技术总监。目前,终于把全部的兴趣聚焦到了数据分析,尤其是大数据分析上,主要目标是利用数据分析手段发现模式,从而降低决策风险、改善产业价值链。冀望在大数据时代与读者一起学习并分享大数据相关技术,共同发掘大数据带来的价值。
发表于2024-12-19
Hadoop MapReduce性能优化 2024 pdf epub mobi 电子书
图书标签: Hadoop 编程 程序设计 性能优化 性能 大数据 MapReduce
大数据时代,MapReduce的重要性不言而喻。Hadoop作为MapReduce框架的一个实现,受到业界广泛的认同,并被广泛部署和应用。尽管Hadoop为数据开发工程师入门和编程提供了极大便利,但构造一个真正满足性能要求的MapReduce程序并不简单。数据量巨大是大数据工作的现实问题,而对低响应时间的要求则时常困扰着数据开发工程师。
本书采用原理与实践相结合的方式,通过原理讲解影响MapReduce性能的因素,透过实例一步步地教读者如何发现性能瓶颈并消除瓶颈,如何识别系统薄弱环节并改善薄弱环节,讲解过程中融合了作者在优化实践过程中积累的丰富经验,具有很强的针对性。读完本书,能让读者对Hadoop具有更强的驾驭能力,从而构造出性能最优的MapReduce程序。
Hadoop性能问题既是程序层面的问题,也是系统层面的问题。本书既覆盖了系统层面的优化又覆盖了程序层面的优化,非常适合Hadoop管理员和有经验的数据开发工程师阅读。对于初学者,本书第1章也作了必要的技术铺垫,避免对后面章节的理解产生梯度。
虽然是讲的Hadoop1,不过仍旧给我一些启发。从mapreduce的每个阶段去分析和优化是一个很好的方法
评分一本只有90页小册子,能获得一些启发。
评分错误:P67第二行 应该是 Map output records P53 图5-3 percent拼错 P54 表5-1 tasktracker拼错 p62 表5-3 reducer数这列26.25≈26
评分错误:P67第二行 应该是 Map output records P53 图5-3 percent拼错 P54 表5-1 tasktracker拼错 p62 表5-3 reducer数这列26.25≈26
评分虽然是讲的Hadoop1,不过仍旧给我一些启发。从mapreduce的每个阶段去分析和优化是一个很好的方法
Hadoop MapReduce性能优化 2024 pdf epub mobi 电子书