當前位置：首頁 > 编程语言 > python >内容正文

python

python seo 采集内容_SEO如何处理采集内容（4）–转自{GoGo闯}

發布時間：2023/12/16 python 25 豆豆

生活随笔收集整理的這篇文章主要介紹了 python seo 采集内容_SEO如何处理采集内容（4）–转自{GoGo闯} 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

兩個問題

在準備采集前找詞的時候，有個蛋疼的問題：

無論任何一種找詞渠道，固定搜索詞(如阿拉巴巴招聘)和個性搜索詞(如阿里巴巴工程師級別怎么劃分)總是雜糅到一塊的，對于同一詞根下的擴展詞，如何將這兩類詞分開？

固定搜索詞往往可以根據固定詞綴的出現次數來預估關鍵詞的流量，畢竟同一個詞綴出現次數高，流量也會相對高。但個性化搜索詞流量和競爭度怎么判斷？

為什么非要把兩類詞找出來呢？因為這兩類詞的

如何將固定搜索詞和個性化搜索詞分開

因為固定搜索詞都包含通用的詞綴，比如：

php工程師工資、java程序員工資、學php有前途嗎、

php工程師工資、java程序員工資、學php有前途嗎、...

這里面“工資”就是通用詞綴，前面可以跟任何關于職位的變量。

程序搞定？

所以可以通過程序分詞，把包含連續出現多次詞綴的關鍵詞單獨提出來，這點可以通過

然而實際中，由于jieba默認詞典的限制，導致在不同行業內分詞不理想的情況，比如沒有把通用詞綴單獨切出來，致使后面聚類的效果也不理想的情況。

要達到理想情況，就要不斷優化jieba分詞詞典和聚類算法。

但本渣渣是偽技術，只會裝逼。即便能搞定也得花挺長時間。

人肉搞定？

人肉搞定思路就很簡單了

首先把全行業所有的固定搜索行為全部找出來，比如這是招聘行業的固定搜索行為，即便不全也可以覆蓋大部分：

當把固定搜索行為找出后，就知道這個行業都有哪些通用詞綴，剩下的事簡單了，還是照常跑詞，把跑出來的詞包含通用詞綴的全部拎出來，剩下的就都是個性化搜索詞了。這完全是個力氣活，拼體力。

全行業固定搜索詞怎么找？之前本渣渣寫過，詳見：【SEO】關鍵詞數據分析

個性化搜索詞流量怎么判斷

簡單的就是跑指數了，愛站和戰神軟件都有這功能。但如果大部分都沒有指數怎么辦？

相對精準的搜索量本渣渣也不知道該怎么判斷，但是可以從關鍵詞來源渠道來評個優先級。

比如移動端跑出來的詞一定比從pc端的優先級高。

百度相關搜索的詞一定比鳳巢的優先級高(鳳巢的詞都被做爛了，小站沒機會)

如果要上的內容類型是問答類的，那百度知道相關搜索詞一定比百度新聞相關搜索詞優先級高

…

個性化搜索詞競爭度怎么判斷

本渣渣就粗暴的看百度搜索結果

搜索結果數越低，競爭度越低，而且title放別人做的少的詞被收錄的概率也會大

前10搜索結果中，關鍵詞飄紅的次數，次數越低，競爭度越低

{word} site:(domain1 | domain2 | domain3) ,看一下幾個大網站有沒有做，尤其是58趕集、1688這種流氓，因為這些超大型站點做的詞，大中型站點也跟著做，超大中型站點都搶的詞，就沒小站什么事了

以上是生活随笔為你收集整理的python seo 采集内容_SEO如何处理采集内容（4）–转自{GoGo闯}的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。