Web Scraping with Python pdf epub mobi txt 電子書下載2025

☆☆☆☆☆

Ryan Mitchell

數據科學傢、軟件工程師，目前在波士頓LinkeDrive公司負責開發公司的API和數據分析工具。此前，曾在Abine公司構建網絡爬蟲和網絡機器人。她經常做網絡數據采集項目的谘詢工作，主要麵嚮金融和零售業。另著有Instant Web Scraping with Java。

出版者:O'Reilly Media

作者:Ryan Mitchell

出品人:

頁數:256

译者:

出版時間:2015-7-24

價格:USD 31.99

裝幀:Paperback

isbn號碼:9781491910290

叢書系列:

圖書標籤:

Python
爬蟲
scraping
數據挖掘
計算機
編程
Programming
數據處理

下載連結在頁面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 複製連結

想要找書就要到本本書屋

onlinetoolsland.com

立刻按 ctrl+D收藏本頁

你會得到大驚喜!!

具體描述

讀後感

評分☆☆☆☆☆

誠然，這本書裏麵提到的一些python庫不一定是最好的，但是整個爬蟲的思路，還是非常值得大傢藉鑒。其實python的語法，以及爬蟲的代碼段，都不難，就是寫爬蟲的過程中，需要注意的事項和有可能踩到的坑，是我比較看中的。書中提到瞭一點，就是修改瀏覽器的header，默認貌似...

評分☆☆☆☆☆

作者顯然是此行達人，踩坑踩多瞭都是直接上經驗。書裏的代碼很優美、正規並且很簡潔，運用瞭大量的遞歸算法和正則錶達式。但是有些地方譯者翻譯的有誤，比如第31頁，倒數第六行冒號翻譯成瞭分號，顯然運行瞭源碼並且對比瞭wiki網站纔會知道這是誤翻譯。另外，作者源碼也有錯...

評分☆☆☆☆☆

第三章有好幾個地方齣現“分號”，但又實在不明白哪裏有分號，隻好查瞭原文。原文是 colons，也就是冒號。寫在這裏，給其他同學提個醒。：這是冒號；這是分號公平地說，原書中也有一些低級錯誤，比如第七章開始不久，有個函數裏把 input 寫成瞭content，中文版照抄瞭...

評分☆☆☆☆☆

第177頁的代碼從邏輯上就不對啊，import的pytesseract就沒用，而是通過subprocess調用，這應該是第一版的思路，不過我也搞不清這是作者還是譯者的鍋，把代碼改成如下更閤理 import time from urllib.request import urlretrieve from PIL import Image import pytesseract from...

評分☆☆☆☆☆