大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
☆☆☆☆☆
簡體網頁||
繁體網頁
大規模並行處理器編程實戰 pdf epub mobi 著者簡介
大規模並行處理器編程實戰 pdf epub mobi 圖書描述
《大規模並行處理器編程實戰》介紹瞭學生和專業人員都適閤的並行編程與gpu體係結構的基本概念,詳細剖析瞭編寫並行程序所需的各種技術,用案例研究說明瞭並行程序設計的整個開發過程,即從計算思想開始,直到最終實現高效可行的並行程序。《大規模並行處理器編程實戰》特色:介紹瞭計算思想,可以使讀者能夠在實現高性能並行計算的基礎上來考慮和解決問題。如何使用cuda(統一計算設備架構),cuda是nvidia公司專門為大規模並行環境創建的軟件開發工具。如何使用cuda編程模型和opencl同時實現高性能和高可靠性。
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
大規模並行處理器編程實戰 pdf epub mobi 圖書目錄
第1章 引言 1
1.1 gpu與並行計算機 2
1.2 現代gpu的體係結構 7
1.3 為什麼需要更高的速度和並行化 8
1.4 並行編程語言與模型 11
1.5 綜閤目標 12
1.6 本書的組織結構 13
第2章 gpu計算的發展曆程 17
2.1 圖形流水綫的發展 18
2.1.1 固定功能的圖形流水綫時代 18
2.1.2 可編程實時圖形流水綫的發展 21
2.1.3 圖形與計算結閤的處理器 23
2.1.4 gpu:一個中間步驟 25
2.2 gpu計算 26
2.2.1 可擴展的gpu 27
2.2.2 發展近況 27
2.3 未來發展趨勢 28
第3章 cuda簡介 31
3.1 數據並行性 32
3.2 cuda的程序結構 33
.3.3 矩陣乘法示例 34
3.4 設備存儲器與數據傳輸 37
3.5 kernel函數與綫程 41
3.6 小結 45
3.6.1 函數聲明 45
3.6.2 啓動kernel函數 46
3.6.3 預定義變量 46
3.6.4 運行時api 46
第4章 cuda綫程 49
4.1 cuda綫程組織結構 50
4.2 使用blockidx和threadidx 54
4.3 同步與透明可擴展性 58
4.4 綫程分配 59
4.5 綫程調度和容許延時 60
4.6 小結 62
4.7 習題 63
第5章 cuda存儲器模型 65
5.1 存儲器訪問效率的重要性 66
5.2 cuda設備存儲器的類型 67
5.3 減少全局存儲器流量的策略 70
5.4 存儲器——限製並行性的一個因素 76
5.5 小結 77
5.6 習題 78
第6章 性能優化 79
6.1 更多關於綫程執行的問題 80
6.2 全局存儲器的帶寬 86
6.3 sm資源的動態劃分 93
6.4 數據預取 95
6.5 指令混閤 97
6.6 綫程粒度 98
6.7 可度量的性能和小結 99
6.8 習題 100
第7章 浮點運算 105
7.1 浮點格式 106
7.1.1 m的規範化錶示 106
7.1.2 e的餘碼錶示 107
7.2 能錶示的數 109
7.3 特殊的位模式與精度 113
7.4 算術運算的準確度和捨入 114
7.5 算法的優化 114
7.6 小結 115
7.7 習題 116
第8章 應用案例研究:高級mri重構 117
8.1 應用背景 118
8.2 迭代重構 120
8.3 計算fhd 123
8.4 最終評估 139
8.5 習題 142
第9章 應用案例研究:分子可視化和分析 143
9.1 應用背景 144
9.2 kernel函數簡單的實現方案 145
9.3 指令執行效率 149
9.4 存儲器閤並 151
9.5 附加性能比較 154
9.6 采用多gpu 156
9.7 習題 157
第10章 並行編程和計算思想 159
10.1 並行編程的目標 160
10.2 問題分解 161
10.3 算法選擇 163
10.4 計算思想 168
10.5 習題 169
第11章 opencl簡介 171
11.1 背景 172
11.2 數據並行性模型 173
11.3 設備的體係結構 175
11.4 kernel函數 176
11.5 設備管理和啓動kernel 177
11.6 opencl中的靜電勢圖譜 179
11.7 小結 183
11.8 習題 184
第12章 結論與展望 185
12.1 重申目標 186
12.2 存儲器體係結構的演變 187
12.2.1 大型虛擬和物理地址空間 187
12.2.2 統一的設備存儲空間 188
12.2.3 可配置的緩存和暫時存儲器 188
12.2.4 提高原子操作的速度 189
12.2.5 提高全局存儲器的訪問速度 189
12.3 kernel函數執行控製過程的演變 190
12.3.1 kernel函數內部的函數調用 190
12.3.2 kernel函數中的異常處理 190
12.3.3 多個kernel函數的同步執行 191
12.3.4 可中斷的kernel函數 191
12.4 內核的性能 191
12.4.1 雙精度的速度 191
12.4.2 提高控製流的效率 192
12.5 編程環境 192
12.6 美好前景 193
附錄a 矩陣乘法主機版的源代碼 195
附錄b gpu的計算能力 207
· · · · · · (
收起)
下載链接在页面底部
點擊這裡下載
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!
發表於2024-11-27
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
喜欢 大規模並行處理器編程實戰 電子書 的读者还喜欢
大規模並行處理器編程實戰 pdf epub mobi 讀後感
評分
☆☆☆☆☆
這本書初看不知所雲,感覺沒什麼實質性內容。 後來配上在coursera上的視頻,發現書中的見解相當精闢、簡潔。 裏麵對於綫程的講解還有一些並行計算的方式都談得很到位,作者實屬苦口婆心將其原理一一道來。 看書還是講求一個思維角度的問題。角度不對,則完全不能理解其中深...
評分
☆☆☆☆☆
這本書非常羅嗦,既不很通俗也不很深入。更要命的是,翻譯得過於粗糙瞭。圖7-9整個給翻譯丟瞭不說,好多地方都是錯字,還有些根本讀不下來啊。 比如,7.3節,“通過設置最重要的尾數位來錶示”。哪位是“最重要的尾數位”啊?most significant mantissa bit是尾數的最高有效位...
評分
☆☆☆☆☆
適閤初中級讀者。 比較喜歡書的整體結構和安排,比較注重並行處理思想的貫穿。 在每章節都有一些核心思想的深入,比如延遲隱藏技術,內存使用方麵 有詳細的講解。 不足之處是設計內容比較廣泛,因此基本每章的內存都是點到為止,沒有具體的深入分析。 後麵的幾個實例還是...
評分
☆☆☆☆☆
適閤初中級讀者。 比較喜歡書的整體結構和安排,比較注重並行處理思想的貫穿。 在每章節都有一些核心思想的深入,比如延遲隱藏技術,內存使用方麵 有詳細的講解。 不足之處是設計內容比較廣泛,因此基本每章的內存都是點到為止,沒有具體的深入分析。 後麵的幾個實例還是...
評分
☆☆☆☆☆
類似圖書 點擊查看全場最低價
出版者:清華大學齣版社
作者:科剋(David B. Kirk)
出品人:
頁數:211
譯者:陳曙暉
出版時間:2010-9
價格:39.00元
裝幀:平裝
isbn號碼:9787302237006
叢書系列:
圖書標籤:
CUDA
並行計算
並行程序設計
計算機
CUDA&GPGPU
2010
計算機科學
程序設計
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載
大規模並行處理器編程實戰 pdf epub mobi 用戶評價
評分
☆☆☆☆☆
@2018-05-20 23:00:09
評分
☆☆☆☆☆
@2018-05-20 23:00:09
評分
☆☆☆☆☆
對GPU並行編程的玩法有瞭初步瞭解,通曉瞭kernel函數、塊、綫程等這些概念,對GPU的體係結構和存儲模型也基本瞭解(device、SM、SP、全局存儲器、共享存儲器等),對編程優化也給瞭一些基本方法(並行分解、優化全局存儲訪問、塊劃分等),跳過很多細節,不得不佩服搞並行算法優化的人,真的太牛瞭。
評分
☆☆☆☆☆
可以看齣DirectX是深深的影響瞭GPU的設計。
評分
☆☆☆☆☆
對GPU並行編程的玩法有瞭初步瞭解,通曉瞭kernel函數、塊、綫程等這些概念,對GPU的體係結構和存儲模型也基本瞭解(device、SM、SP、全局存儲器、共享存儲器等),對編程優化也給瞭一些基本方法(並行分解、優化全局存儲訪問、塊劃分等),跳過很多細節,不得不佩服搞並行算法優化的人,真的太牛瞭。
大規模並行處理器編程實戰 2024 pdf epub mobi 電子書 下載