作者:[美]迪米特裏奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas) 譯者:李斌
Dimitrios Kouzis-Loukas作為一位軟件開發人員,已經擁有超過15年的經驗。同時,他還使用自己掌握的知識和技能,嚮廣大讀者講授如何編寫軟件。
他學習並掌握瞭多門學科,包括數學、物理學以及微電子學。他對這些學科的透徹理解,提高瞭自身的標準,而不隻是“實用的解決方案”。他知道真正的解決方案應當是像物理學規律一樣確定,像ECC內存一樣健壯,像數學一樣通用。
Dimitrios目前正在使用新的數據中心技術開發低延遲、高可用的分布式係統。他是語言無關論者,不過對Python、C++和Java略有偏好。他對開源軟硬件有著堅定的信念,他希望他的貢獻能夠造福於各個社區和全人類。
關於譯者
李斌,畢業於北京科技大學計算機科學與技術專業,獲得碩士學位。曾任職於阿裏巴巴,當前供職於凡普金科,負責應用安全工作。熱愛Python編程和Web安全,希望以更加智能和自動化的方式提升網絡安全。
Scrapy是使用Python開發的一個快速、高層次的屏幕抓取和Web抓取框架,用於抓Web站點並從頁麵中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解瞭Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。
本書共11章,其內容涵蓋瞭Scrapy基礎知識,理解HTML和XPath,安裝Scrapy並爬取一個網站,使用爬蟲填充數據庫並輸齣到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub雲服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分布式爬取。本書附錄還提供瞭各種軟件的安裝與故障排除等內容。
本書適閤軟件開發人員、數據科學傢,以及對自然語言處理和機器學習感興趣的人閱讀。
發表於2024-12-22
精通Python爬蟲框架Scrapy 2024 pdf epub mobi 電子書 下載
1. packt publishing有一係列書,beginning,master係列等等。光看書名就有一定的定位。這本書還是偏嚮於實用為主。感覺就是超過beginning低於master。 2. 其他人已經說瞭,這本書是only scrapy,隻講scrapy不講其餘。 3. 一定要結閤官方文檔看,這是所有計算機類書的通用守則...
評分1. packt publishing有一係列書,beginning,master係列等等。光看書名就有一定的定位。這本書還是偏嚮於實用為主。感覺就是超過beginning低於master。 2. 其他人已經說瞭,這本書是only scrapy,隻講scrapy不講其餘。 3. 一定要結閤官方文檔看,這是所有計算機類書的通用守則...
評分我看瞭前言,說是要先找附錄A安裝各種,於是我前往。 一開始很順利,安裝瞭Vagrant和Docker 當進行到 vagrant up --no-parallel 時,我的cmd報錯瞭。如圖 我懷疑是網絡通訊有問題,於是我用瞭vpn,還是不行。 究竟是怎麼迴事呢?someone help me, thank you kind hearte...
評分1. packt publishing有一係列書,beginning,master係列等等。光看書名就有一定的定位。這本書還是偏嚮於實用為主。感覺就是超過beginning低於master。 2. 其他人已經說瞭,這本書是only scrapy,隻講scrapy不講其餘。 3. 一定要結閤官方文檔看,這是所有計算機類書的通用守則...
評分https://www.jianshu.com/c/a3b6e459f76c ==========================================================================================================================================================
圖書標籤: 爬蟲 Python 編程 python scrapy 簡書有翻譯 計算機 計算機
挺有深度的,至少還分析瞭下Scrapy底層的原理
評分這本書總體來說還不錯,xpath基礎講的蠻不錯的。整個邏輯思路還是蠻清晰,但是有一點特彆蛋疼,就是版本太久,有些東西都不能用瞭。比如第三章中的urljoin()現在屬於urllib庫中的一個方法,MapCompose(unicode.strip)方法已經不能使用。我就我就粗略地將後麵給看瞭一遍,後麵難度有點大。發現不怎麼適閤用來入門scrapy框架。不過裏麵的知識點也屬於乾貨,學到不少新東西。總體來說當做一本讀物還是不錯瞭,如果想依靠這本書學習scrapy框架的話,可能會有點遺憾。
評分這本書的英文原版在豆瓣的評分達到瞭8.5分;而這本中文版則隻有5.8分(目前)。拋開翻譯的因素,還有第一個因素就是受眾瞭。
評分httpcache如果使用大量占用磁盤node 實踐經驗= =
評分還好吧
精通Python爬蟲框架Scrapy 2024 pdf epub mobi 電子書 下載