数据挖掘与应用

更新时间:2024-08-31 08:54

《数据挖掘与应用》是2009年6月北京大学出版社出版的图书,作者是张俊妮。本书全面地介绍了数据挖掘的相关主题,包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。

内容简介

《数据挖掘与应用》全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用:同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。

《数据挖掘与应用》实例丰富,并附有相应SAS程序,以便于学生尽快理解相关内容并用以解决实际问题。

《数据挖掘与应用》配有教辅,可以免费提供给任课教师使用。如需要,欢迎填写书后的“教师反馈及课件申请表’索取。

作者简介

张俊妮,美国哈佛大学统计学博士,现为北京大学光华管理学院商务统计及经济计量系副教授。研究领域包括因果推断、贝叶斯分析、蒙特卡洛方法、数据挖掘。

图书目录

第一章 数据挖掘概述

1.1 什么是数据挖掘

1.2 数据挖掘的应用

1.3 数据挖掘方法论

第二章 数据理解和数据准备

2.1 数据理解

2.2 数据准备

3使用SAS进行数据理解和数据准备:

FNBA信用卡数据

第三章 关联规则挖掘

3.1 关联规则的实际意义

3.2 关联规则的基本概念及Apriori算法

3.3 负关联规则

3.4 序列关联规则

3.5 使用SAS进行关联规则挖掘

第四章 多元统计中的降维方法

4.1 拦成分分析

4.2 探索性因子分析

4.3 多维标度分析

第五章 聚类分析

5.1 距离与相似度的度量

5.2 A均值聚类法

5.3 层次聚类

第六章 预测性建模的一些基本方法

6.1 判别分析

6.2 朴素贝叶斯分类算法

6.3 K近邻法

6.4.线性模型与广义线性模型

第七章 神经网络

7.1 神经网络架构及基本组成

7.2 误差函数

7.3 神经网络训练算法

7.4 提高神经网络模型的可推广性

7.5 数据预处理

7.6 使用SAS建立神经网络模型

7.7 自组织图

第八章 决策树

8.1 决策树简介

8.2 决策树的生长与修剪

8.3 对缺失数据的处理

8.4 变量选择

8.5 决策树的优缺点

第九章 模型评估

9.1 因变量为二分变量的情形

9.2 因变量为多分变量的情形

9.3 因变量为连续变量的情形

9.4 使用SAS评估模型

第十章 模型组合与两阶段模型

10.1 模型组合

10.2 随机森林

10.3 两阶段模型

参考文献

……

丛书信息

北京大学光华管理学院教材 (共3册), 这套丛书还有 《固定收益证券》,《应用商务统计分析》。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}