Aloysius Lim
擅長將復雜的數據和模型錶述為簡單易懂的見解。作為About People的聯閤創辦者、數據科學傢及設計顧問,他喜歡解決問題,以及幫助他人尋找利用數據解決業務難題的實踐方案。在政府、教育和零售行業長達7年的豐富經驗,造就瞭他尋找具有創造性的解決辦法的獨特視角。
衷心地感謝上帝給我機會撰寫本書,讓我分享這些知識。在這個過程中,我親愛的妻子Bethany給予瞭極大的支持和鼓勵。謝謝你全部的愛,親愛的。非常感謝我的搭檔William,他是我靈感和洞察力的來源。
William Tjhi
數據科學傢,在學術、政府及工業界具有多年的工作經驗。他自讀博期間開始瞭數據科學之旅,研究瞭一些新算法以提高高維數據聚類的健壯性。取得博士學位之後,他從基礎研究轉嚮瞭應用研究,緻力於采用機器學習方法解決分子生物學和傳染病學中的各種問題。他在一些同行評審的期刊和會議上發錶瞭部分研究成果。隨著大數據的興起,William離開瞭學術界,轉而投入工業界,開始瞭商業和公共部門領域的數據科學實踐。William熱衷於R,從他搞研究的那天開始就一直使用R作為主要的分析工具。他曾經是Revolution Analytics的一員,那時候他做瞭很多使R更加適閤大數據的貢獻。
R語言是專門為統計學和數據分析開發的解釋型語言,主要用於數學建模、統計計算、數據處理、可視化等幾個方麵。近年來,受大數據的影響,R語言備受業界追捧。與此同時,工業界和學術界都越來越要求R具備高效分析和處理大規模數據的能力。但是,由於R本身的設計問題,它能夠有效處理的數據規模和計算復雜度有限。
為此,《R高性能編程》提供瞭較為完整的參考方案和技術指南。《R高性能編程》首先解釋瞭CPU、內存和磁盤I/O等影響R性能的三個因素,剖析瞭R在處理大規模數據時齣現性能瓶頸的原因。在理解瞭R的設計原理及其性能限製的基礎之上,《R高性能編程》給齣瞭提升R性能的方法和技術,例如:盡量使用嚮量化運算避免不必要的計算開銷,預分配內存避免不必要的動態內存分配,使用編譯代碼減少CPU時間,刪除不必要的中間數據釋放內存占用,通過運行時計算代替永久存儲減少內存使用,使用內存映射文件處理大型數據集,使用並行計算技術優化代碼,以及接入數據庫處理工具,等等。最後,《R高性能編程》提供瞭如何在R中使用Hadoop的方法,以處理和分析大數據。
發表於2024-11-26
R高性能編程 2024 pdf epub mobi 電子書 下載
圖書標籤: R 編程 性能優化 豆瓣 不服不忿
獲益匪淺。9章開始沒讀瞭,以後有機會讀。
評分獲益匪淺。9章開始沒讀瞭,以後有機會讀。
評分獲益匪淺。9章開始沒讀瞭,以後有機會讀。
評分獲益匪淺。9章開始沒讀瞭,以後有機會讀。
評分獲益匪淺。9章開始沒讀瞭,以後有機會讀。
R高性能編程 2024 pdf epub mobi 電子書 下載