大数据时代应用机器学习方法解决数据挖掘问题的实用指南。
洞察隐匿于大数据中的结构模式,有效指导数据挖掘实践和商业应用。
weka系统的主要开发者将丰富的研发、商业应用和教学实践的经验和技术融会贯通。
广泛覆盖在数据挖掘实践中采用的算法和机器学习技术,着眼于解决实际问题
避免过分要求理论基础和数学知识,重点在于告诉读者“如何去做”,同时包括许多算法、代码以及具体实例的实现。
将所有的概念都建立在具体实例的基础之上,促使读者首先考虑使用简单的技术。如果简单的技术不足以解决问题,再考虑提升到更为复杂的高级技术。
新版增加了大量近年来最新涌现的数据挖掘算法和诸如Web数据挖掘等新领域的介绍,所介绍的weka系统增加了50%的算法及大量新内容。
本书是机器学习和数据挖掘领域的经典畅销教材,被众多国外名校选为教材。书中详细介绍用于数据挖掘领域的机器学习技术和工具以及实践方法,并且提供了一个公开的数据挖掘工作平台Weka。本书主要内容包括:数据输入/输出、知识表示、数据挖掘技术(决策树、关联规则、基于实例的学习、线性模型、聚类、多实例学习等)以及在实践中的运用。本版对上一版内容进行了全面更新,以反映自第2版出版以来数据挖掘领域的技术变革和新方法,包括数据转换、集成学习、大规模数据集、多实例学习等,以及新版的Weka机器学习软件。
Ian H.Witten 新西兰怀卡托大学计算机科学系教授,ACM Fellow和新西兰皇家学会Fellow,曾荣获2004年国际信息处理研究协会(IFIP)颁发的Namur奖项。他的研究兴趣包括语言学习、信息检索和机器学习。
Eibe Frank 新西兰怀卡托大学计算机科学系副教授,《Machine Learning Journal》和《Journal of Artificial Intelligence Research》编委。
Mark A.Hall 新西兰怀卡托大学名誉副研究员,曾获得2005年ACM SIGKDD服务奖。
断断续续做了8年股市,从爬数据,到做数据挖掘框架,趴了好多书。 一晃8年,从20多岁的青葱年代到不敢多念想的奔四岁月。 时间从挥霍到点滴的珍惜,不知道还能坚持多久。 最近结合weka搭建一个自适应的机器学习引擎。 希望能有所突破。自己选择没有后悔, 只有孤注一掷的往...
评分这本书虽然标题是Data Mining,但是核心内容还是机器学习。我理解“数据挖掘”主要指的还是KDD,即基于数据库的知识发现。在这个领域,基本的方法是聚类和关联规则发现;而在机器学习领域,主要研究的是分类。 这本书的内容主要是分类,也有一部分聚类的内容,关联规则发现基...
评分这本dm的书啃完了,觉得有点这个书有点“偏见”,怎么理解呢 前面的东西不错哦,可是后半部分的Weka平台我个人觉得翻翻就行了,要学还不如看看spss的书呢,前面关于机器模型的建立的数学基础要求的不是很高,所以很适合一般没有学过随机过程的人看看,要是数学很牛的人,可以看...
评分这种书的翻译都是一个导师,找多个研究生每人分俩章节,对这金山词霸翻译的,能好到哪里。所以要读还是读原版。
评分这本书虽然标题是Data Mining,但是核心内容还是机器学习。我理解“数据挖掘”主要指的还是KDD,即基于数据库的知识发现。在这个领域,基本的方法是聚类和关联规则发现;而在机器学习领域,主要研究的是分类。 这本书的内容主要是分类,也有一部分聚类的内容,关联规则发现基...
这本书的魅力还在于它对各种主流算法的包容性和批判性思维的培养。它不像某些书籍那样,只推崇某一种“银弹”式的万能模型。相反,作者非常客观地分析了决策树、支持向量机、神经网络等不同家族算法的优缺点、适用场景以及内在的局限性。阅读过程中,我明显感觉到自己的思维开阔了许多,不再是只会套用那个自己最熟悉的模型。比如,书中对“过拟合”和“欠拟合”的阐述,不仅告诉你这是什么,更重要的是,它提供了多维度的解决方案,并对比了每种方案的优劣权衡。这种鼓励读者独立思考、避免盲目跟风的态度,比单纯的技术介绍更有价值,它教会的,是成为一个“思考者”,而不仅仅是一个“执行者”。
评分从装帧和排版来看,这本书也体现了出版方对读者的尊重。虽然内容专业且篇幅巨大,但纸张的质量和印刷的清晰度都非常出色,长时间阅读眼睛也不会感到特别疲劳。更重要的是,那些复杂的图表——无论是混淆矩阵的可视化,还是模型复杂度与误差率的曲线图——都处理得干净利落,关键信息一目了然。要知道,在数据挖掘领域,好的可视化往往是理解复杂概念的关键。对于一本需要经常翻阅查阅的工具书而言,这种对细节的打磨是至关重要的。它不光是一本可以快速学习的教材,更是一本可以长期放在案头,随时翻阅参考的“工具箱”,体现了出版上对专业读者的诚意。
评分我个人非常欣赏作者在组织内容时所体现出来的逻辑性和层次感。这本书的结构设计得极为精妙,它并非简单地堆砌知识点,而是遵循着一个完整的数据挖掘流程来展开叙述的。从初始的数据探索和清理,到模型选择和训练,再到最后的性能评估和模型部署,每一步都衔接得天衣无缝。这种结构化的叙述方式,极大地降低了学习的认知负荷。我感觉自己不是在“啃”书,而是在跟着一个项目流程走。即便是那些相对晦涩的统计学基础,也被巧妙地融入到需要这些基础的算法讲解之前,确保读者在需要知识点时,恰好能回顾到或者学到它。对于想要系统构建知识框架的读者来说,这种循序渐进的编排简直是福音。
评分这本厚厚的书简直就是数据科学的“武功秘籍”,内容详实得让人惊叹。我记得刚拿到手的时候,光是翻目录就花了半个小时,密密麻麻的章节标题,从最基础的数据预处理到高深的集成学习,简直是把整个领域的知识体系都给勾勒出来了。书中对每一个算法的讲解都深入浅出,不像有些教科书那样只停留在数学公式上,它会告诉你这个算法背后的直觉是什么,什么时候该用,什么时候可能效果不佳。特别是关于特征工程那几章,作者简直是手把手地教你如何把原始数据这块顽石雕琢成能发光的金子,各种实战技巧的分享,让我这个刚入行的新人茅塞顿开。读完后感觉自己像是从一个只会用工具箱里几个榔头的学徒,变成了能用上全套精密仪器的工匠,对数据背后隐藏的故事有了更深刻的洞察力。光是那几个关于文本挖掘的案例分析,就足够我回去反复琢磨好一阵子了。
评分说实话,这本书的实战性是让我最佩服的一点。很多理论性的书籍读完后,你还是不知道该怎么上手去解决一个实际问题,但这本书不一样。它似乎非常清楚读者在实际工作中会遇到哪些“坑”,然后提前给你铺设好避雷区。书里大量的代码示例和配套的练习题,都不是那种为了展示算法而写的玩具代码,而是贴近真实业务场景的片段。我记得有一次我在处理一个电商的用户流失预测问题时,陷入了瓶颈,是书中提到的一种处理高度不平衡数据集的方法给了我灵感,让我成功优化了模型的AUC值。这种“学完就能用”的感觉,在技术书籍里是非常难得的。它不像一本冰冷的说明书,更像一位经验丰富的前辈,在你迷茫时,递过来一张清晰的路线图,告诉你:“试试这条路,成功率比较高。”
评分进阶版数据与机器学习
评分密集文本加上翻译导致阅读体验较差 后面很大部分在介绍一个叫weka的数据挖掘平台 对程序员来说用处不大
评分密集文本加上翻译导致阅读体验较差 后面很大部分在介绍一个叫weka的数据挖掘平台 对程序员来说用处不大
评分进阶版数据与机器学习
评分进阶版数据与机器学习
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2026 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有