序一
序二
前言
第一篇 MIC基礎篇
第1章 MIC高性能計算
1.1 多核、眾核計算的發展
1.2 MIC技術簡介
1.3 為什麼要選擇MIC
1.3.1 SMP
1.3.2 集群(cluster)
1.3.3 GPGPU
第2章 MIC硬件及軟件架構
2.1 MIC硬件架構
2.1.1 術語解析
2.1.2 MIC硬件架構概覽
2.1.3 MIC Core
2.1.4 環形互聯總綫Ring
2.1.5 CLOCK
2.1.6 頁錶(Page Tables)
2.1.7 係統接口
2.1.8 性能監控單元和事件管理器
2.1.9 電源管理
2.2 MIC軟件架構
2.2.1 概述
2.2.2 Bootstrap
2.2.3 Linux加載器
2.2.4 微操作係統(OS)
2.2.5 對稱通信接口(SCIF)
2.2.6 主機驅動
2.2.7 sysfs節點
2.2.8 MPI應用的MIC軟件棧
2.2.9 應用編程接口(API)
第3章 MIC安裝、環境配置
3.1 MIC環境配置
3.1.1 前期準備
3.1.2 安裝Host端的Linux操作係統
3.1.3 安裝MIC驅動
3.1.4 安裝在MIC上編譯C/C++的編譯器
3.2 SDK示例運行
第4章 第一個MIC實例——計算PI
第5章 OpenMP和MPI編程基礎
5.1 OpenMP基礎
5.1.1 OpenMP簡介
5.1.2 OpenMP編程模型
5.1.3 OpenMP語法簡要介紹
5.2 MPI基礎
5.2.1 啓動和終止MPI庫
5.2.2 獲取信息
5.2.3 發送和接收消息
第6章 MIC編程
6.1 MIC編程模型
6.2 應用模式
6.2.1 CPU原生模式
6.2.2 CPU為主MIC為輔模式
6.2.3 CPU與MIC對等模式
6.2.4 MIC為主CPU為輔模式
6.2.5 MIC原生模式
6.3 MIC基本語法
6.3.1 offload
6.3.2 變量和函數聲明
6.3.3 頭文件
6.3.4 環境變量
6.3.5 編譯選項
6.3.6 其他問題
6.4 MIC上的MPI
6.4.1 MIC上的MPI限製
6.4.2 MIC上MPI編程模型
6.4.3 MIC上的MPI環境配置
6.4.4 編譯及使用
6.4.5 MIC上的MPI示例
6.5 SCIF編程
6.5.1 什麼是SCIF
6.5.2 SCIF的基本概念介紹
6.5.3 SCIF基本通信過程
6.5.4 SCIF用到的API函數
第7章 MIC軟件調試與性能分析工具
7.1 Intel軟件工具鏈對MIC的支持
7.2 MIC軟件調試工具IDB
7.2.1 IDB簡介
7.2.2 IDB的操作界麵
7.2.3 IDB對MIC架構的支持與要求
7.2.4 使用IDB調試MIC程序
7.3 MIC性能分析工具VTune
第8章 Intel MIC MKL庫使用方法
8.1 Intel MKL核心函數庫介紹
8.2 在MIC卡上使用Intel MKL
8.2.1 編譯器輔助offload方式
8.2.2 自動offload方式
8.3 FFT在MIC上的使用
8.3.1 FFT簡介
8.3.2 FFT在MIC上的使用方法一
8.3.3 FFT在MIC上的使用方法二
8.4 BLAS在MIC上的使用
8.4.1 BLAS簡介
8.4.2 在MIC上調用BLAS庫方法
第二篇 性能優化篇第9章 MIC性能優化
9.1 MIC性能優化策略
9.2 MIC優化方法
9.2.1 並行度優化
9.2.2 內存管理優化
9.2.3 數據傳輸優化
9.2.4 存儲器訪問優化
9.2.5 嚮量化優化
9.2.6 負載均衡優化
9.2.7 MIC綫程擴展性優化
第10章 MIC優化示例:矩陣乘法
10.1 矩陣乘法串行算法
10.2 OpenMP多綫程矩陣乘法
10.3 MIC多綫程矩陣乘法
10.3.1 基本版本
10.3.2 嚮量化優化
10.3.3 SIMD指令優化
10.3.4 矩陣分塊乘法
第三篇 工程開發篇
第11章 基於MIC的HPC應用開發過程
11.1 熱點測試
11.1.1 準備工作
11.1.2 熱點測試及定位
11.2 程序分析
11.2.1 程序移植模式分析
11.2.2 計算規模分析
11.2.3 特點分析
11.2.4 熱點並行性分析
11.2.5 嚮量化分析
11.2.6 MIC內存分析
11.2.7 程序分析總結
11.3 MIC程序開發過程
11.3.1 基於CPU的OpenMP並行
11.3.2 基於MIC的綫程擴展
11.3.3 單節點CPU+MIC協同並行
11.3.4 MIC集群並行
第12章 基於MIC的HPC應用實例
12.1 基於單節點CPU+MIC協同計算電子斷層三維重構並行算法
12.1.1 電子斷層三維重構技術及SIRT算法介紹
12.1.2 SIRT串行程序分析
12.1.3 基於OpenMP的SIRT並行程序開發
12.1.4 基於MIC平颱的SIRT並行程序開發
12.1.5 單節點多卡及CPU+MIC異構協同計算架構設計
12.2 基於多節點CPU+MIC協同計算大渦模擬並行算法
12.2.1 格子-Boltzmann大渦模擬算法介紹
12.2.2 大渦模擬串行程序分析
12.2.3 基於OpenMP的大渦模擬並行算法
12.2.4 基於MIC的大渦模擬並行算法
12.2.5 基於多節點CPU+MIC協同計算平颱的大渦模擬並行算法
參考文獻
· · · · · · (
收起)