《Python3网络爬虫开发实战(第二版)》上市了!!!!
“?
閱讀本文大概需要 5 分鐘。
?”告訴大家一個好消息:我的好朋友崔慶才老師的《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)(第二版)》現(xiàn)在正式上市了!!!!
沒錯,就是這本:
就是那個《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)》第一版的作者寫的,現(xiàn)在他出了第二版了。
崔慶才,如果你對爬蟲有所涉獵的話想必可能聽過他的名字,他目前在微軟就職,之前他的那本《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)》第一版算是廣大爬蟲愛好者的入門書籍了,銷量近 100000 冊。
后來,由于一些技術(shù)更迭,他開始策劃編寫本書的第二版。
2021 年11月,這第二版本書歷經(jīng)各種反復(fù)修改、審稿等階段,到今天終于上市了!
第二版更新內(nèi)容
大家第一個問題可能就會問,第二版比第一版更新了哪些內(nèi)容?
因為技術(shù)總是在不斷發(fā)展和進(jìn)步的,爬蟲技術(shù)也是一樣,它在爬蟲和反爬蟲不斷斗爭的過程中也在不斷演進(jìn)。比如現(xiàn)在越來越多的網(wǎng)頁采取了各種防護(hù)措施,比如前端代碼的壓縮和混淆、API 的參數(shù)加密、WebDriver 的檢測,要做到高效的數(shù)據(jù)爬取,我們就需要懂得一些 JavaScript 逆向分析相關(guān)技術(shù)。App 也是一樣,App 的抓包防護(hù)、加殼保護(hù)、Native 化、風(fēng)控檢測使得越來越多的 App 數(shù)據(jù)難以爬取,所以我們也不得不了解一些逆向相關(guān)技術(shù),如 Xposed、Frida、IDA Pro 等工具的使用。除此之外,近幾年深度學(xué)習(xí)和人工智能發(fā)展得也是如火如荼,所以爬蟲也可以和人工智能結(jié)合起來,比如基于深度學(xué)習(xí)的驗證碼識別、網(wǎng)頁內(nèi)容的智能化解析和提取等技術(shù)我們也可以進(jìn)行學(xué)習(xí)和了解。另外,一些大規(guī)模爬蟲的管理和運維技術(shù)也在不斷發(fā)展,當(dāng)前 Kubernetes、Docker、Prometheus 等云原生技術(shù)也非常火爆,基于 Kubernetes 等云原生技術(shù)的爬蟲管理和運維解決方案也已經(jīng)很受青睞。然而,之前第一版書對以上提到的這些新興技術(shù)幾乎沒有提及。
除此之外,第一版書在講解數(shù)據(jù)爬取的過程中引用了很多案例和服務(wù),比如貓眼電影網(wǎng)站、淘寶網(wǎng)站、代理服務(wù)網(wǎng)站,然而幾年過去了,有些案例網(wǎng)站和服務(wù)早已經(jīng)改版或者停止維護(hù),這就導(dǎo)致第一版書中的很多案例已經(jīng)不能正常運行了。這其實是一個很大的問題,因為程序運行不通會大大降低學(xué)習(xí)的積極性和成就感,而且會浪費不少時間。另外,即使案例對應(yīng)的爬蟲代碼及時更新了,那我們也不知道這些案例網(wǎng)站和服務(wù)什么時候會再次改版,因為這都是不可控的。所以,為了徹底解決這個問題,作者花費了近半年的時間構(gòu)建了一個爬蟲案例平臺(https://scrape.center),平臺包含了幾十個爬蟲案例,包括服務(wù)端渲染(SSR)網(wǎng)站、單頁面應(yīng)用(SPA)網(wǎng)站、各類反爬網(wǎng)站、驗證碼網(wǎng)站、模擬登錄網(wǎng)站、各類 App 等,覆蓋了現(xiàn)在爬蟲和反爬蟲相關(guān)的大多數(shù)技術(shù),整個平臺都是我來維護(hù)的,書中幾乎所有案例都是從案例平臺來的,從而解決了頁面改版的問題。
所以,本書相比第一版來說,更新的內(nèi)容主要如下:
絕大多數(shù)都遷移到了自建的案例平臺,以后再也不用擔(dān)心案例有過期或改版問題。
替換了原本第一章環(huán)境安裝的章節(jié),將環(huán)境配置的部分全部匯總并遷移到案例平臺(https://setup.scrape.center)并在書中以外鏈的形式附上,以確保環(huán)境的配置和安裝說明能夠被及時更新。
增加了一些新的請求庫、解析庫、存儲庫等的介紹,如 httpx、parsel、Elasticsearch 等庫的介紹。
增加了異步爬蟲的介紹,如協(xié)程的基本原理、aiohttp 的使用和爬取實戰(zhàn)介紹。
增加了一些新興自動化工具的介紹,如 Pyppeteer、Playwright 的介紹。
增加了深度學(xué)習(xí)相關(guān)內(nèi)容,如圖形驗證碼、滑動驗證碼的識別方案。
豐富了模擬登錄章節(jié)的內(nèi)容,如增加了 JWT 模擬登錄的介紹和實戰(zhàn)、大規(guī)模賬號池的優(yōu)化。
增加了 JavaScript 逆向的章節(jié),包括網(wǎng)站加密和混淆技術(shù)、JavaScript 逆向調(diào)試技巧、JavaScript 的各種模擬執(zhí)行方式、AST 還原混淆代碼、WebAssembly 等相關(guān)技術(shù)的介紹。
豐富了 App 自動化爬取技術(shù)的章節(jié),如新興框架 Airtest 的介紹、手機(jī)群控和云手機(jī)技術(shù)的介紹。
增加了 Android 逆向章節(jié),如反編譯、反匯編、Hook、脫殼、so 文件分析和模擬執(zhí)行等技術(shù)的介紹。
增加了網(wǎng)頁智能化解析章節(jié),包括列表頁、詳情頁內(nèi)容提取算法和分類算法。
豐富了 Scrapy 相關(guān)章節(jié)的介紹,如 Pyppeteer 的對接、RabbitMQ 的對接、Prometheus 的對接等。
增加了基于 Kubernetes、Docker、Prometheus、Grafana 等云原生技術(shù)爬蟲管理和運維解決方案的介紹。
以上就是第二版的主要更新內(nèi)容,更多詳情可以看《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)(第二版)》內(nèi)容介紹
章節(jié)介紹
為了讓大家更直接地了解到全書的內(nèi)容,這里就直接放目錄了:
整體來說,新增了很多很多爬蟲知識點,更新了全書爬蟲案例并解決了案例過期的問題。
另外通過目錄可以看到,全書一共 900 多頁,(量了下有 4.3 厘米厚),定價是 139.8 元。
可以直接看第二版嗎?
當(dāng)然,有朋友也會擔(dān)心,我需不需要先學(xué)習(xí)第一版,然后才能學(xué)第二版呢?
答案是:可以直接學(xué)第二版,第二版書爬蟲的內(nèi)容知識體系是完整的,一些舊的技術(shù)已經(jīng)在第一版中移除,第二版的書籍是對所有爬蟲知識體系的全新升級。
沒有基礎(chǔ)可以學(xué)嗎?
有朋友也可能會問,沒有爬蟲或者 Python 基礎(chǔ)可以學(xué)嗎?
答案是:可以。本書就是專為零爬蟲基礎(chǔ)的朋友準(zhǔn)備的,本書從最基礎(chǔ)的環(huán)境配置、基礎(chǔ)知識的講解開始,循序漸進(jìn)地對爬蟲的各個知識點進(jìn)行介紹,所以完全不用擔(dān)心沒有爬蟲基礎(chǔ)學(xué)不會的問題。如果沒有 Python 基礎(chǔ),那也沒關(guān)系(當(dāng)然有會更好),書中也會提及 Python 環(huán)境的配置并附上一些 Python 入門學(xué)習(xí)資料和鏈接,同時也會通過各個 Python 代碼片段來進(jìn)行講解,很多案例也很簡單易懂,學(xué)爬蟲的時候 Python 也就會逐漸掌握了。
大咖推薦
這本書同時還獲得了 Python 之父的推薦(沒錯就是 Python 的創(chuàng)始人,Guido van Rossum)
另外還獲得了微軟亞洲互聯(lián)網(wǎng)工程院副院長曾文峰、知名爬蟲專家梁斌penny、中國人民大學(xué)高瓴人工智能學(xué)院長聘副教授宋睿華的推薦。
下面是推薦語的內(nèi)容:
宣傳彩頁
另外編輯還為本書制作了幾張宣傳彩頁,是對整本書的一個宣傳介紹,大家可以看下:
有沒有電子版?
看到這里,大家可能也會問了,有沒有電子版呢?可能有的朋友習(xí)慣看電子版的書本來學(xué)習(xí),有的朋友可能在海外也不方便購買,所以想要電子版。
但還是很遺憾地說:沒有電子版。
因為大家知道的,如果出了電子版,那么馬上就會有各種盜版襲來,網(wǎng)上也會造成各種惡意傳播。
所以,為了保護(hù)版權(quán),這本書是沒有上電子版的,還請各位讀者諒解,謝謝。
購買鏈接
是的,最后就是大家最關(guān)心的部分了,到哪里能夠買到呢?
上架之前,作者與編輯經(jīng)過各種溝通,原本是想給廣大讀者和粉絲們有個專屬優(yōu)惠的,但是這個比較難操作,所以最終決定,整本書現(xiàn)在全網(wǎng)統(tǒng)一 7 折銷售了!
也就是說,原價 139.8 元,現(xiàn)在只需要 97.9 元就能買到了。
不過這個也是限時的,7 折優(yōu)惠只到周五,也就是 12 月 3 日,之后會恢復(fù) 84 折銷售,也就是 117 元。
另外還有一個消息,前幾天作者簽名了 1000 本書。所以,現(xiàn)在這個階段,賣的全都是簽名版(只在京東),一共 1000 本,賣完即止,先到先得。
大家拿到書之后,扉頁就會有作者的簽名,是這樣子的:
如果不想要簽名版的朋友可以再等等,等簽名版的賣完了就是非簽名版的了。
下面是京東商品的截圖,可以看到寫著 1000 冊簽名版先到先得。
好了,廢話不多說了,上購買鏈接:
https://item.jd.com/13527222.html
為了方便購買,我把這個鏈接轉(zhuǎn)成了二維碼,大家可以直接掃碼購買:
星球送書活動
為了慶祝新書上市,作者也送福利給各位讀者啦。
之前作者崔慶才建立了一個知識星球,用于給星球的各位朋友解答問題,同時崔慶才也會在星球分享一些想法、干貨等內(nèi)容,星球售價是 149?元,具體的詳情大家可以看這篇文章我創(chuàng)辦了一個知識星球。
現(xiàn)在有一個好消息,之前加入星球的和以后加入星球的,統(tǒng)統(tǒng)都送一本《Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)(第二版)》的簽名書,目前無限期有效(如果有特殊變動會在星球公布)。
所以說,這個方式就是一個穩(wěn)定有效的獲取簽名書的方式。
也就是說現(xiàn)在 149 元(以后可能會漲價)加入星球,現(xiàn)在能獲取原價 139.8 的書,還能有一年的星球服務(wù)。
這是星球的鏈接,大家感興趣可以掃碼加入:
好了,以上就是本篇文章的全部內(nèi)容了!愿各位讀者都可以如愿得到想要的書籍~
好文和朋友一起看
總結(jié)
以上是生活随笔為你收集整理的《Python3网络爬虫开发实战(第二版)》上市了!!!!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【机器学习】逻辑回归代码练习
- 下一篇: 安卓端/iOS端如何播放4K分辨率的RT