网络爬虫--之爬起校招信息代码
生活随笔
收集整理的這篇文章主要介紹了
网络爬虫--之爬起校招信息代码
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
記得去年10月份那會兒,正是校招高峰期,北郵人和水木上的校招信息特別多,各種企業(yè)都在瘋狂地刷屏。?
??
于是每天我都要經(jīng)常打開北郵人和水木的招聘信息版塊,一頁一頁地篩選我所關(guān)注的公司和職位的校招信息,卻仍然會漏掉一些重要的校招信息。?
??
重復(fù)的事情做久了,就有了自動化的想法。?
??
于是當(dāng)時我寫了一個小爬蟲給自己用,選擇爬取北郵人和水木的招聘信息版塊,爬蟲會根據(jù)自定義關(guān)鍵字(如“應(yīng)屆”、“校招”、“Google”)先對校招信息進(jìn)行過濾,然后存儲到本機(jī)redis中。本機(jī)若搭有l(wèi)amp環(huán)境,那么直接從redis讀取信息到web頁面上即可。?
??
這個小爬蟲的目的,就是把各路校招信息聚合在一起并且過濾出自己感興趣的校招信息如Google的校招、百度的校招等等。?
??
此外,這個小玩意還幫了我大忙,13屆阿里補(bǔ)招的時候讓我在單位時間內(nèi)看到了補(bǔ)招信息,火速投出簡歷并最終抓住了機(jī)會。?
??
據(jù)我所知,后來投遞的應(yīng)屆生簡歷都已經(jīng)晚了。?
??
天下武功,唯快不破。?
??
這個小爬蟲在我的機(jī)器上跑了快一年了,雖然對它挺有感情,但如今對我來說也沒有什么用了。新的一輪校招快到了,我決定把它分享出來,有需要的童鞋直接拿去就可以用,有興趣的同學(xué)也可以很容易地擴(kuò)展它,滿足自己的個性化需求。?
??
初步介紹可以見博文
??
Talk is cheap, show you the code.?
??
感謝@mmoonzhu的patch。?
??
PS:已增加手機(jī)短信通知功能,利用了139郵箱短信通知的原理,移動聯(lián)通電信都可以用。?
??
Enjoy it. ?
??
于是每天我都要經(jīng)常打開北郵人和水木的招聘信息版塊,一頁一頁地篩選我所關(guān)注的公司和職位的校招信息,卻仍然會漏掉一些重要的校招信息。?
??
重復(fù)的事情做久了,就有了自動化的想法。?
??
于是當(dāng)時我寫了一個小爬蟲給自己用,選擇爬取北郵人和水木的招聘信息版塊,爬蟲會根據(jù)自定義關(guān)鍵字(如“應(yīng)屆”、“校招”、“Google”)先對校招信息進(jìn)行過濾,然后存儲到本機(jī)redis中。本機(jī)若搭有l(wèi)amp環(huán)境,那么直接從redis讀取信息到web頁面上即可。?
??
這個小爬蟲的目的,就是把各路校招信息聚合在一起并且過濾出自己感興趣的校招信息如Google的校招、百度的校招等等。?
??
此外,這個小玩意還幫了我大忙,13屆阿里補(bǔ)招的時候讓我在單位時間內(nèi)看到了補(bǔ)招信息,火速投出簡歷并最終抓住了機(jī)會。?
??
據(jù)我所知,后來投遞的應(yīng)屆生簡歷都已經(jīng)晚了。?
??
天下武功,唯快不破。?
??
這個小爬蟲在我的機(jī)器上跑了快一年了,雖然對它挺有感情,但如今對我來說也沒有什么用了。新的一輪校招快到了,我決定把它分享出來,有需要的童鞋直接拿去就可以用,有興趣的同學(xué)也可以很容易地擴(kuò)展它,滿足自己的個性化需求。?
??
初步介紹可以見博文
抓取北郵人論壇和水木社區(qū)校招信息的爬蟲程序, 直接運(yùn)行main.py即可在本機(jī)(http://127.0.0.1:8888)訪問,非常簡潔,可以擴(kuò)展。
此外,已經(jīng)增加手機(jī)短信通知功能,移動、聯(lián)通、電信都可以用。
Talk is cheap, show you the code:https://github.com/lizherui/spider_python.
Enjoy it.
??
Talk is cheap, show you the code.?
??
代碼托管在github:https://github.com/lizherui/spider_python?
下載地址:http://download.csdn.net/detail/gshengod/5999879
??感謝@mmoonzhu的patch。?
??
PS:已增加手機(jī)短信通知功能,利用了139郵箱短信通知的原理,移動聯(lián)通電信都可以用。?
??
Enjoy it. ?
總結(jié)
以上是生活随笔為你收集整理的网络爬虫--之爬起校招信息代码的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一步一步打造Geek风格的技术博客
- 下一篇: 如何上传应用到百度应用(图解攻略)