python seo 采集内容_SEO如何处理采集内容(4)–转自{GoGo闯}
兩個問題
在準備采集前找詞的時候,有個蛋疼的問題:
無論任何一種找詞渠道,固定搜索詞(如阿拉巴巴招聘)和個性搜索詞(如阿里巴巴工程師級別怎么劃分)總是雜糅到一塊的,對于同一詞根下的擴展詞,如何將這兩類詞分開?
固定搜索詞往往可以根據固定詞綴的出現次數來預估關鍵詞的流量,畢竟同一個詞綴出現次數高,流量也會相對高。但個性化搜索詞流量和競爭度怎么判斷?
為什么非要把兩類詞找出來呢?因為這兩類詞的
如何將固定搜索詞和個性化搜索詞分開
因為固定搜索詞都包含通用的詞綴,比如:
php工程師工資、java程序員工資、學php有前途嗎、
1
php工程師工資、java程序員工資、學php有前途嗎、...
這里面“工資”就是通用詞綴,前面可以跟任何關于職位的變量。
程序搞定?
所以可以通過程序分詞,把包含連續出現多次詞綴的關鍵詞單獨提出來,這點可以通過
然而實際中,由于jieba默認詞典的限制,導致在不同行業內分詞不理想的情況,比如沒有把通用詞綴單獨切出來,致使后面聚類的效果也不理想的情況。
要達到理想情況,就要不斷優化jieba分詞詞典和聚類算法。
但本渣渣是偽技術,只會裝逼。即便能搞定也得花挺長時間。
人肉搞定?
人肉搞定思路就很簡單了
首先把全行業所有的固定搜索行為全部找出來,比如這是招聘行業的固定搜索行為,即便不全也可以覆蓋大部分:
當把固定搜索行為找出后,就知道這個行業都有哪些通用詞綴,剩下的事簡單了,還是照常跑詞,把跑出來的詞包含通用詞綴的全部拎出來,剩下的就都是個性化搜索詞了。這完全是個力氣活,拼體力。
全行業固定搜索詞怎么找?之前本渣渣寫過,詳見:【SEO】關鍵詞數據分析
個性化搜索詞流量怎么判斷
簡單的就是跑指數了,愛站和戰神軟件都有這功能。但如果大部分都沒有指數怎么辦?
相對精準的搜索量本渣渣也不知道該怎么判斷,但是可以從關鍵詞來源渠道來評個優先級。
比如移動端跑出來的詞一定比從pc端的優先級高。
百度相關搜索的詞一定比鳳巢的優先級高(鳳巢的詞都被做爛了,小站沒機會)
如果要上的內容類型是問答類的,那百度知道相關搜索詞一定比百度新聞相關搜索詞優先級高
…
個性化搜索詞競爭度怎么判斷
本渣渣就粗暴的看百度搜索結果
搜索結果數越低,競爭度越低,而且title放別人做的少的詞被收錄的概率也會大
前10搜索結果中,關鍵詞飄紅的次數,次數越低,競爭度越低
{word} site:(domain1 | domain2 | domain3) ,看一下幾個大網站有沒有做,尤其是58趕集、1688這種流氓,因為這些超大型站點做的詞,大中型站點也跟著做,超大中型站點都搶的詞,就沒小站什么事了
總結
以上是生活随笔為你收集整理的python seo 采集内容_SEO如何处理采集内容(4)–转自{GoGo闯}的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 基于STM32F103将采集的温度-湿度
- 下一篇: Google企业邮箱申请
