主页 详情

《大数据分析 数据挖掘必备算法示例详解》_张重生编著_14152258_9787111555469

【书名】:《大数据分析 数据挖掘必备算法示例详解》
【作者】:张重生编著
【出版社】:北京:机械工业出版社
【时间】:2017
【页数】:246
【ISBN】:9787111555469
【SS码】:14152258

最新查询

内容简介

第1章 数据分析绪论

1.1 理解数据中字段的类型是数据分析的重要前提

1.2 进行数据分析时数据的表示形式

1.3 数据分类——数据类别的自动识别

1.4 数据分类问题与回归问题的区别与联系

1.5 数据分析算法简介

1.6 交叉验证

1.7 一个最简单的分类器-K近邻分类器

1.8 后续章节组织

参考文献

第2章 SVM算法

2.1 算法原理

2.2 工具包简介

2.2.1 LibSVM的安装

2.2.2 LibSVM的使用

2.3 实例详解

参考文献

第3章 决策树算法

3.1 信息熵值

3.2 决策树的构建目标

3.3 ID3决策树算法

3.4 C4.5决策树算法

3.5 CART决策树算法

3.6 ID3、C4.5、CART算法的终止条件

3.7 C4.5算法的参数介绍

3.8 实例详解

参考文献

第4章 随机森林算法

4.1 算法原理

4.2 工具包介绍

4.3 实例详解

参考文献

第5章 梯度提升决策树算法

5.1 算法原理

5.2 工具包介绍

5.3 实例详解

参考文献

第6章 AdaBoost算法

6.1 算法原理

6.2 工具包介绍

6.3 实例详解

参考文献

第7章 朴素贝叶斯分类器

7.1 朴素贝叶斯分类的问题定义

7.2 朴素贝叶斯算法原理

7.3 一种常见的朴素贝叶斯模型的错误计算方法

7.4 朴素贝叶斯算法对连续型属性的处理

参考文献

第8章 极限学习机器算法

8.1 算法原理

8.2 算法参数介绍

8.3 实例详解

参考文献

第9章 逻辑回归算法

9.1 Logistic Regression算法流程

9.1.1 Logistic Regression模型的训练

9.1.2 Logistic Regression模型的预测

9.2 Logistic Regression算法原理推导

参考文献

第10章 稀疏表示分类算法

10.1 算法原理

10.2 SRC工具包及算法参数介绍

10.3 SRC算法实例详解

参考文献

第11章 不同数据分类算法性能的大规模实验对比分析

11.1 为什么要比较不同数据分类算法的性能?

11.2 不同数据分类算法性能比较的相关工作

11.3 最新数据分类算法性能的大规模实验对比分析结果

11.3.1 实验数据集及调参细节

11.3.2 实验结果

11.4 结论

参考文献

第12章 从二分类到多分类——OVA

12.1 OVA聚合规则的核心思想

12.2 MAX聚合规则

12.3 DOO聚合规则

12.4 调用示例

参考文献

第13章 从二分类到多分类——OVO

13.1 OVO聚合规则的核心思想

13.2 WV聚合规则

13.3 VOTE聚合规则

13.4 PC聚合规则

13.5 PE聚合规则

13.6 LVPC聚合规则

13.7 调用示例

参考文献

第14章 从二分类到多分类——ECOC

14.1 ECOC的核心思想

14.2 ECOC编码

14.2.1 ECOC OVA算法的编码步骤

14.2.2 ECOC OVO算法的原理和源码赏析

14.2.3 Sparse Dense Random算法的原理和源码赏析

14.2.4 DECOC算法的原理和源码赏析

14.2.5 Forest-ECOC算法的原理和源码赏析

14.3 ECOC译码

14.3.1 HD算法的原理和源码赏析

14.3.2 LAP算法的原理和源码赏析

14.4 ECOC多类分类调用示例

参考文献

第15章 三种从二分类到多分类聚合策略的实验对比分析

15.1 OVA策略的实验结果

15.2 OVO策略的实验结果

15.3 ECOC策略的实验结果

参考文献

第16章 多个分类算法的集成方法研究

16.1 差异性(Diversity)的原理与技术

16.2 集成学习方法

16.2.1 简单加权投票集成方法

16.2.2 随机爬山算法

16.2.3 集成前序算法和集成后序算法

16.2.4 循环集成方法

16.2.5 其他集成学习方法

16.3 本章小结

参考文献

第17章 属性选择算法

17.1 fspackage和LibSVM的使用

17.1.1 程序包fspackage的使用方法

17.1.2 分类器LibSV M的使用方法

17.1.3 分类器LibSVM的调用实例

17.2 信息增益算法

17.2.1 算法原理

17.2.2 代码讲解

17.2.3 案例详解

17.3 卡方分布算法

17.3.1 卡方分布算法的原理

17.3.2 卡方分布算法的使用

17.3.3 案例详解

17.4 基于Fisher Score的属性选择算法

17.4.1 Fisher Score的原理

17.4.2 代码讲解

17.4.3 案例详解

17.5 基于基厄系数的属性选择算法

17.5.1 基厄系数的原理

17.5.2 代码讲解

17.5.3 案例详解

17.6 基于T检验的属性选择算法

17.6.1 T检验的原理

17.6.2 代码讲解

17.6.3 案例详解

参考文献

第18章 高级属性选择算法

18.1 线性前向选择算法

18.1.1 算法原理

18.1.2 代码讲解

18.1.3 案例详解

18.2 顺序前向选择算法

18.2.1 算法原理

18.2.2 代码讲解

18.2.3 案例详解

18.3 基于稀疏多项式逻辑回归的属性选择算法

18.3.1 算法原理

18.3.2 代码讲解

18.3.3 案例详解

18.4 Our——多个属性选择算法的集成策略

18.4.1 算法原理

18.4.2 代码讲解

18.4.3 案例详解

18.4.4 our算法的优势

18.5 属性选择算法的大规模实验对比分析

18.5.1 实验数据

18.5.2 属性选择算法结合LibSVM的测试

18.5.3 属性选择算法结合C4.5的测试

18.5.4 实验小结

参考文献

第19章 数据选择算法

19.1 衡量不均衡数据分类质量的常用方法

19.1.1 方法介绍

19.1.2 代码讲解

19.1.3 案例详解

19.2 RUS算法

19.2.1 算法原理

19.2.2 代码讲解

19.2.3 案例详解

19.3 CNN算法

19.3.1 算法原理

19.3.2 代码讲解

19.3.3 案例详解

19.4 SMOTE算法

19.4.1 算法原理

19.4.2 代码讲解

19.4.3 案例详解

19.5 ADASYN算法

19.5.1 算法原理

19.5.2 代码讲解

19.5.3 案例详解

19.6 OSS算法

19.6.1 算法原理

19.6.2 代码讲解

19.6.3 案例详解

19.7 本章小结

参考文献

第20章 不均衡数据分类算法及大规模实验分析

20.1 C4.5CS算法

20.1.1 算法原理

20.1.2 代码讲解

20.1.3 案例详解

20.2 使用Random Forests和GBDT进行不均衡数据分类

20.2.1 Random Forests

20.2.2 GBDT

20.3 BalanceCascade不均衡数据分类算法

20.4 其他不均衡数据分类算法及不均衡分类器的集成算法

20.5 结合属性选择和数据选择的不均衡数据分类实验

20.5.1 实验内容

20.5.2 实验数据

20.5.3 实验结果分析

参考文献

第21章 大数据分析

21.1 Spark平台简介

21.2 基于Ambari的Spark及Spark集群的安装与配置

21.3 Ambari集群扩展

21.4 基于Spark平台的分布式编程示例

21.5 MLlib——Spark平台上的机器学习库

21.5.1 Random Forest的MLlib实现

21.5.2 Decision tree的MLlib实现

参考文献

后记


书查询(www.shuchaxun.com)本网页唯一编码:
b9bc5f66a0070156a6bac3af1c45edf5#78cfc5e47d50fc37fbca1ebd56f08b64#49266999#14152258.zip