数据挖掘技术与应用案例教程(双色)(含微课)

收藏
简介 目录 样张 更多
  • ISBN:978-7-313-32189-3
  • 作者:李华风、郑瑞银、魏星
  • 出版社:上海交大
  • 适用层次:通用
  • 出版/修订日期:2025-01-01

本书采用项目式编写形式,通过合理的内容安排、丰富实用的典型案例、学练结合的讲解方式和通俗易懂的语言,全面系统、循序渐进地介绍了数据挖掘的相关技术和实际应用。全书共分为8个项目,内容包括数据挖掘基础、数据探索与预处理、分类、回归分析、聚类、关联规则挖掘、人工神经网络与深度学习、综合案例——某地二手房数据挖掘。

本书可作为各类院校大数据技术、计算机科学与技术、数据科学与大数据技术、人工智能等专业学生的专用教材,也可供数据挖掘技术爱好者自学使用。

项目1  数据挖掘基础

项目导读

项目目标

项目分析

项目准备

1.1  认识数据挖掘

1.1.1  数据挖掘的概念

1.1.2  数据挖掘的流程

1.1.3  数据挖掘的应用领域

1.2  数据挖掘常用算法

1.3  数据挖掘常用工具

1.3.1  常用工具

1.3.2  Python数据挖掘常用库

案例实施——搭建数据挖掘基础环境

项目实训

项目总结

项目考核

项目评价

 

项目2  数据探索与预处理

项目导读

项目目标

项目分析

项目准备

2.1  数据探索

2.1.1  数据质量分析

2.1.2  数据特征分析

案例实施1——体测成绩数据探索

2.2  数据清洗

2.2.1  缺失值处理

2.2.2  异常值处理

2.2.3  重复值处理

2.3  数据集成

2.3.1  实体识别问题处理

2.3.2  属性冗余处理

2.3.3  元组重复处理

2.3.4  属性值冲突处理

2.3.5  数据合并

2.4  数据变换

2.4.1  简单函数变换

2.4.2  数据规范化

2.4.3  数据离散化

2.4.4  数据编码

2.5  数据归约

2.5.1  维度归约

2.5.2  数量归约

2.5.3  数据压缩

案例实施2——体测成绩数据预处理

项目实训

项目总结

项目考核

项目评价

 

项目3  分类

项目导读

项目目标

项目分析

项目准备

3.1  分类概述

3.1.1  分类的概念及过程

3.1.2  分类模型的评价指标

3.1.3  过拟合与欠拟合

3.2  K近邻分类

3.2.1  K近邻算法原理

3.2.2  K近邻算法实现

案例实施1——使用K近邻算法对鸢尾花进行分类

3.3  决策树分类

3.3.1  决策树的工作原理

3.3.2  ID3决策树

3.3.3  C4.5决策树

3.3.4  CART决策树

3.3.5  决策树算法实现

案例实施2——使用CART决策树对鸢尾花进行分类

3.4  贝叶斯分类

3.4.1  贝叶斯定理

3.4.2  朴素贝叶斯

案例实施3——使用朴素贝叶斯对鸢尾花进行分类

3.5  支持向量机分类

3.5.1  支持向量机概述

3.5.2  线性支持向量机

3.5.3  非线性支持向量机

案例实施4——使用线性支持向量机对鸢尾花进行分类

项目实训

项目总结

项目考核

项目评价

 

项目4  回归分析

项目导读

项目目标

项目分析

项目准备

4.1  回归分析概述

4.1.1  回归分析的概念及过程

4.1.2  回归分析的分类

4.1.3  回归模型的评价指标

4.2  一元线性回归

4.2.1  一元线性回归模型

4.2.2  一元线性回归模型实现

案例实施1——使用一元线性回归模型预测员工薪资

4.3  多元线性回归

4.3.1  多元线性回归模型

4.3.2  多元线性回归模型实现

案例实施2——使用多元线性回归模型预测体测成绩

4.4  逻辑回归

4.4.1  逻辑回归模型

4.4.2  逻辑回归模型实现

案例实施3——使用逻辑回归模型预测肿瘤类型

项目实训

项目总结

项目考核

项目评价

 

项目5  聚类

项目导读

项目目标

项目分析

项目准备

5.1  聚类概述

5.1.1  聚类的概念

5.1.2  聚类的分类

5.1.3  聚类效果的评价指标

5.2  划分聚类

5.2.1  划分聚类概述

5.2.2  K-Means算法原理

5.2.3  K-Means算法实现

案例实施1——使用K-Means算法分析用户消费习惯

5.3  层次聚类

5.3.1  层次聚类概述

5.3.2  AGNES算法原理

5.3.3  AGNES算法实现

案例实施2——使用AGNES算法分析用户消费习惯

5.4  密度聚类

5.4.1  密度聚类概述

5.4.2  DBSCAN算法原理

5.4.3  DBSCAN算法实现

案例实施3——使用DBSCAN算法分析用户消费习惯

项目实训

项目总结

项目考核

项目评价

 

项目6  关联规则挖掘

项目导读

项目目标

项目分析

项目准备

6.1  关联规则挖掘概述

6.1.1  关联规则挖掘的基本概念

6.1.2  关联规则挖掘的过程

6.2  Apriori算法

6.2.1  频繁项集的产生

6.2.2  关联规则的产生

6.2.3  Apriori算法实现

案例实施1——使用Apriori算法进行超市购物篮分析

6.3  FP增长算法

6.3.1  FP树的构建

6.3.2  FP树的挖掘

6.3.3  FP增长算法实现

案例实施2——使用FP增长算法进行超市购物篮分析

项目实训

项目总结

项目考核

项目评价

 

项目7  人工神经网络与深度学习

项目导读

项目目标

项目分析

项目准备

7.1  人工神经网络

7.1.1  人工神经网络的基本概念

7.1.2  感知器

案例实施1——使用感知器对鸢尾花进行分类

7.2  深度学习

7.2.1  深度学习概述

7.2.2  卷积神经网络

案例实施2——使用卷积神经网络识别手写数字

项目实训

项目总结

项目考核

项目评价

 

项目8  综合案例——某地二手房

数据挖掘

项目导读

项目目标

项目分析

8.1  需求分析

8.2  某地二手房数据预处理

8.2.1  缺失值处理

8.2.2  异常值处理

8.2.3  重复值处理

8.2.4  数据编码

8.3  某地二手房数据探索

8.3.1  二手房面积和房龄分布分析

8.3.2  二手房数量分布分析

8.3.3  二手房平均单价分析

8.3.4  二手房总价分析

8.4  某地二手房房价预测

8.4.1  构建多元线性回归模型

8.4.2  使用多元线性回归模型预测房价

8.5  某地二手房房源分析

8.5.1  准备数据

8.5.2  构建聚类模型并分析房源

 

参考文献

微课 教材练习 资料下载 ....
立即下载
价格:¥58.00
加入购物车立即购买