内容简介
第1部分 本书焦点
第1章 数据挖掘概述
1.什么是数据挖掘?
2.数据挖掘能做什么?
分类
估计
预测
组合或关联法则
聚类
描述与可视化
3.商业领域的数据挖掘
作为研究工具的数据挖掘
改进生产过程的数据挖掘
市场营销中的数据挖掘
客户关系管理中的数据挖掘
4.技术层面的数据挖掘
数据挖掘与机器学习
数据挖掘与统计学
数据挖掘与决策支持
数据挖掘与计算机技术
5.数据挖掘的社会背景
第2章 为什么要精通数据挖掘这门艺术
1.数据挖掘的四种方法
购买评分
购买软件
聘请编外专家
培养企业内部骨干
本章小结
第3章 数据挖掘方法论:互动循环系统
1.数据挖掘的两种类型
有监督的数据挖掘
无监督的数据挖掘
2.数据挖掘的互动循环过程
3.正确识别业务问题
实施数据挖掘是否必要?
是否存在最让人感兴趣的客户子群或客户细分?
相应的行业规范有哪些?
关于数据
印证业内专家的观点
4.将数据转换成可操作的决策
确认和获取数据
生成有效数据、探索数据以及清洁数据
将数据转换成具有合适的粒度的数据
加入衍生变量
准备建模数据集
选择建模技术和训练模型
检测模型的执行效率
5.将结果生成决策
6.评测模型的有效性
7.成功建立预测模型的要点
预测模型的时间范围
模型的使用有效期
假定1:过去是将来的预言家
假定2:数据是可以获得的
假定3:数据中应包括我们的预期目标
本章小结
第4章 客户和他们的生命周期
1.谁是企业的客户
消费者
企业客户
客户市场细分
2.客户的生命周期
客户生命周期的不同阶段
客户生命周期中的重要事件
客户生命周期中不同的时段所产生的资料
3.客户的生理生命周期
4.选择最佳时机,锁定最佳客户
预算最优化
促销活动最优化
客户最优化
本章小结
第2部分 数据挖掘的三大支柱
第5章 数据挖掘技术与算法
1.不同的目标要求不同的技术
不同的数据类型要求不同的方法
2.三种数据挖掘技术
3.自动类别侦测
K—均值类别侦测的工作原理
选择聚类所产生的后果
4.决策树
决策树的工作原理
决策树的建立过程
选择决策树所产生的后果
5.神经网络
神经网络的训练
选择神经网络所产生的后果
本章小结
第6章 无所不在的数据
1.数据结构
行
列
数据挖掘中列的作用
数据挖掘中的数据
2.数据看起来究竟像什么?
数据从哪里来
粒度的合适水平
度量数据取值的不同方法
3.多少数据才足够呢?
4.衍生变量
使用衍生变量时应该注意的问题
离群点的处理
列变量的组合
分类汇总
从某一列中提取信息
时间序列
5.案例:客户行为的界定
6.受污染的数据
缺失数据
定义模糊
谬误值
本章小结
第7章 建立有效的预测模型
1.建立好的预测模型
预测模型的建立过程
对模型效果的衡量
模型稳定性
保持模型稳定性所面临的挑战
2.对模型集进行处理
分割与掌握:训练集、测试集与评价集
模型集规模对模型效果的影响
模型集密度对模型效果的影响
抽样
何谓过抽样?
利用时间相关资料来建立模型
模型输入和模型输出
执行时间:考虑模型的建立时间
时间和遗漏数据
建立时间上易于转换的模型
字段命名
3.使用多个模型
多个模型的表决
将输入分段
对模型进行组合的其他原因
4.做试验!
模型集
不同类型的模型以及模型参数
时间范围
本章小结
第8章 实施控制:建立数据挖掘环境
1.起步
何谓数据挖掘环境?
四个案例研究
数据挖掘环境得以成功的要素
2.案例1:建造公司内部核心竞争力
保险行业的数据挖掘
开端
3.案例2:创造新的商机
向网上发展
环境
潜在客户的数据仓库
下一个步骤
4.案例3:在数据仓库工作中培养数据挖掘技能
特殊类型的数据仓库
数据挖掘的计划
信息技术部门内部的数据挖掘
5.案例4:利用特斯拉快速建模环境法(RME)进行数据挖掘
建立高级数据挖掘环境所需的条件
什么是RME?
RME如何运作?
RME如何协助数据准备
RME如何支持抽样
RME如何协助建立模型
RME如何协助模型评估和管理
本章小结
第3部分 案例研究
第9章 数据挖掘在目录直销业中的应用——有谁会需要香油袋和长裤拉伸器?
1.佛蒙特乡村小店
VCS的发家史
预测模型
2.商业问题
3.数据
4.技术路线
数据挖掘软件的选择
RFM与细分的基础
挑战者——神经网络、决策树和回归分析
决定可能已经发生的事
计算投资回报率
5.未来
期望收益
本章小结
第10章 数据挖掘在在线银行业中的应用——顾客垂青的下一个产品是什么?
1.获取利润
2.商业问题
3.数据
从账户到客户
推出产品
4.解决问题的方法
标准分数
如果走起来像只鸭
这个方法的陷阱
5.建模
决策树模型
建立其他模型
得到交叉销售模型
6.更完美的世界
本章小结
第11章 数据挖掘在无线通信业中的应用——客人,您慢些走!
1.无线通信业
一个快速成熟的行业
与其他行业的区别
2.商业问题
项目背景
无线通信市场的特点
何为流失?
为什么建立流失模型有用?
三个目标
建立流失模型的方法
项目简介
3.实际应用——寻找流失模型
建模工具的选取
对模型进行分类
最终的四个模型
选择建模算法
模型集的大小和密度
潜伏期的影响(或考虑实际应用)
及时更新模型
4.数据
基本客户模型
从通电话到数据
顾客历史流失率
客户及账单层次的数据
服务端数据
付费历史资料
变量剔除
衍生变量
5.建立客户流失模型的经验
寻找最显著的变量
听取用户意见
听取数据的声音
包含历史流失率
构造模型集
为流失管理应用建立模型
由数据决定模型参数
理解算法和工具
本章小结
第12章 数据挖掘在电信业中的应用——以客户为中心
1.数据流程
什么是数据流程?
基础操作
并行环境下的数据流程
数据流程为何有效率?
2.业务问题
项目背景
重要的市场营销问题
3.数据
通话明细数据
客户数据
辅助文件
4.发现之旅
在通话记录中能发现什么?
每日时段通话分析
通话的市场细分
国际长途模式
什么时候使用者在家?
因特网服务的提供者
专用网络
同时发生的通话
本章小结
第13章 谁正在买什么?——超市内的数据挖掘应用
1.行业发展趋势
超市作为信息中介商
将重心从商品转换到客户
2.三个案例
3.分析不同人种的购买模式
商业背景
数据
可视化工具的成功
一个失败的方法
恰好与事实相符
4.谁在超市购买酸奶?
商业背景
数据
从杂货到客户
寻找顾客聚类
将聚类结果应用到业务中
5.谁在健康食品店购买肉?
购物篮分析用的关联规则
人比杂货店更令人感兴趣
本章小结
第14章 不浪费、不短缺:改善生产流程
1.唐纳利父子公司用以降低成本的数据挖掘技术
技术问题
商业问题
数据
归纳滚筒条纹惯例
印刷厂的改变
长期影响
2.时代公司减少纸张损耗的努办
商业问题
数据
解决问题的方法
浪费的种类
可避免的浪费
可避免浪费的归纳规则
数据转换
数据的特性描述和概要
决策树
关联规则
综合
本章小结
第15章 社会议题:数据挖掘与隐私权
1.隐私棱镜
2.数据挖掘是一种威胁吗?
3.对隐私的期望
隐私的重要性
4.现实世界中的信息
5.电子世界中的信息
分辨客户
综合
6.数据挖掘的希望
索引