更新时间:2023-02-11 20:00
《最简数据挖掘》是2020年3月电子工业出版社出版的图书,作者是周涛,袁飞,庄旭。
本书是数据挖掘精髓的浓缩。第1章用通俗易懂的语言回答五个基本问题,包括什么是数据,什么是大数据,什么是数据挖掘,以及数据挖掘能挖掘出哪些东西和会产生什么价值。然后用6章的篇幅介绍k-均值、k-近邻、朴素贝叶斯、决策树、回归分析和关联规则挖掘等6种方法。第8章介绍一些实际的应用,演示简单的数据挖掘方法如何产生巨大的价值。本书可供高校的数据科学与大数据、智能科学与技术、人工智能、计算机科学与技术和统计类、应用数学等相关专业的学生作为教材使用,也可供高校的商科大数据、金融等专业的学生、优秀的中学生、科技企业的管理者和相关行业的投资人学习参考。
目 录
第1章 概述1
1.1 什么是数据1
1.2 什么是大数据3
1.3 什么是数据挖掘6
1.4 能挖掘出什么8
1.5 会产生什么价值10
第2章 k-均值12
2.1 基本算法13
2.2 k-均值示例15
2.3 k-均值算法的局限性21
练习赛21
第3章 k-近邻24
3.1 k-近邻基本算法25
3.2 评价分类效果的常见指标26
3.3 影响算法精确度的若干问题28
3.4 k-近邻算法示例31
练习赛35
第4章 朴素贝叶斯36
4.1 贝叶斯定理36
4.2 贝叶斯基本算法39
4.3 贝叶斯算法案例41
4.4 处理连续特征45
练习赛46
第5章 回归47
5.1 线性回归的最简示例47
5.2 线性回归的一般形式53
5.3 逻辑回归的最简示例55
5.4 逻辑回归的一般形式59
5.5 小结和讨论60
练习赛62
第6章 决策树63
6.1 构建决策树63
6.2 经典决策树:ID3、C4.5和CART66
6.3 连续值、缺失值和剪枝70
6.4 小结和讨论75
练习赛77
第7章 关联规则挖掘78
7.1 基本算法思想78
7.2 Apriori算法示例80
7.3 小结和讨论85
练习赛86
第8章 数据挖掘应用创新案例87
8.1 提升生产制造过程的良品率87
8.2 刻画全球化对碳排放的影响89
8.3 捕捉电商评论中的用户情感91
8.4 实时发现微博中的热点事件94
推荐阅读材料96