主页 详情

《支持推测并行化的多核事务存储体系结构研究》_王耀彬编著_13684310_9787030422255

【书名】:《支持推测并行化的多核事务存储体系结构研究》
【作者】:王耀彬编著
【出版社】:北京:科学出版社
【时间】:2014
【页数】:175
【ISBN】:9787030422255
【SS码】:13684310

最新查询

内容简介

第1章 绪论

1.1 引言

1.1.1 研究意义

1.1.2 传统方法的局限性

1.2 推测并行技术简介

1.2.1 TLS技术简介

1.2.2 TM技术简介

1.2.3 两种技术的结合

第2章 相关研究工作

2.1 事务存储技术

2.1.1 软件事务存储方案

2.1.2 硬件事务存储方案

2.1.3 代表性方案LogTM

2.2 线程级推测技术

2.2.1 软件线程级推测方案

2.2.2 硬件线程级推测方案

2.2.3 软硬结合式线程级推测

2.2.4 代表性方案Hydra

2.3 TLS与TM的结合

2.3.1 TLS与TM结合的方式

2.3.2 代表性方案TCC

2.4 程序剖析技术

2.4.1 剖析简介

2.4.2 JRPM方案

2.4.3 SPT方案

2.4.4 Mitosis方案

2.5 小结

第3章 线程级推测并行性研究机制

3.1 推测模型

3.1.1 循环级推测模型

3.1.2 子程序级推测模型

3.2 分析方法

3.2.1 判定准则

3.2.2 依赖分析方法

3.3 剖析指导的线程划分机制

3.4 剖析应用分类

3.5 小结

第4章 OpenPro剖析工具集

4.1 剖析方案

4.2 剖析机制实现

4.2.1 核心数据结构设计

4.2.2 剖析流程

4.2.3 线程调用跟踪

4.2.4 访存剖析机制

4.2.5 计算生产距离与消费距离

4.2.6 链表压缩设计

4.3 设计说明

4.4 实验方案说明

4.5 小结

第5章 桌面应用的推测并行性分析

5.1 桌面应用简介

5.2 桌面应用循环级并行性剖析

5.3 桌面应用子程序级并行性剖析

5.4 小结

第6章 多媒体应用的推测并行性分析

6.1 多媒体应用简介

6.2 多媒体应用循环级并行性剖析

6.3 多媒体应用子程序级并行性剖析

6.4 小结

第7章 高性能计算应用的推测并行性分析

7.1 高性能计算应用简介

7.2 高性能计算应用循环级并行性剖析

7.3 高性能计算应用子程序级并行性剖析

7.4 小结

第8章 总线式推测多核结构体系结构设计

8.1 结构模型

8.1.1 一级数据Cache设计

8.1.2 推测控制器设计

8.1.3 总线设计

8.1.4 二级Cache设计和存储管理

8.1.5 执行核设计

8.2 线程执行模型

8.2.1 推测线程初始化

8.2.2 推测线程启动

8.2.3 推测访存操作的跟踪和记录

8.2.4 推测线程提交

8.2.5 推测线程冲突检测和错误恢复

8.2.6 推测循环结束

8.3 编程模型

8.3.1 推测封装函数

8.3.2 变量声明调整

8.3.3 推测库函数

8.3.4 补充和评价

8.4 小结

第9章 总线式推测多核模拟器实现

9.1 功能级验证工具设计

9.1.1 实现环境Pin

9.1.2 主要功能

9.1.3 设计方法

9.2 性能级多核模拟器设计

9.2.1 SimpleScalar简介与改进分析

9.2.2 流水线设计

9.2.3 访存设计

9.2.4 多核模拟方式

9.2.5 私有一级Cache的推测支持

9.2.6 总线支持

9.3 小结

第10章 SPoTM模型评测

10.1 评测方案

10.1.1 测试程序集

10.1.2 模拟器配置

10.2 基本评测结果

10.2.1 推测加速比

10.2.2 单核性能分析

10.2.3 推测线程性能分析

10.2.4 存储系统性能分析

10.3 小结

第11章 PTT设计优化

11.1 简介

11.1.1 思路

11.1.2 优化方案

11.2 硬件结构模型

11.2.1 硬件体系结构

11.2.2 推测执行机制

11.2.3 按序提交机制

11.3 编程模型

11.3.1 循环封装

11.3.2 变量声明调整

11.3.3 运行时库支持

11.3.4 编译支持

11.4 线程执行模型

11.4.1 简介

11.4.2 推测线程初始化

11.4.3 推测线程启动

11.4.4 推测线程执行

11.4.5 推测线程提交

11.5 PTT模拟器实现

11.5.1 GEMS模拟器简介

11.5.2 实现说明

11.6 小结

第12章 PTT基本性能评测

12.1 实验方案

12.1.1 方案简介

12.1.2 测试程序说明

12.1.3 实验配置

12.2 基本性能评测

12.2.1 加速比分析

12.2.2 回退率分析

12.2.3 IPC分析

12.2.4 缓存缺失率分析

12.2.5 链路延迟分析

12.3 小结

第13章 PTT性能影响因素评测

13.1 互连拓扑分析

13.2 令牌传递开销分析

13.3 L2 Cache组织方式分析

13.4 线程启动策略分析

13.5 线程重试策略分析

13.6 小结

第14章 在线剖析指导机制

14.1 性能分析原理

14.2 剖析指导模型

14.3 性能评测

14.3.1 线程启动策略分析

14.3.2 线程重试策略分析

14.4 小结

第15章 连续两阶段剖析指导性能优化

15.1 优化原理

15.2 技术框架

15.2.1 初始剖析

15.2.2 预先优化

15.3 优化框架的扩展和限制

15.3.1 优化扩展

15.3.2 优化限制

15.4 性能评测

15.5 小结

参考文献


书查询(www.shuchaxun.com)本网页唯一编码:
f64a0033656b602172208c018c18486d#d2c331f2b18bd1c94ffe5f5f95e24d88#22709631#13684310.zip