个人博客 SEO 优化(2):站内优化
對(duì)于搜索引擎原理不清楚的可以看第一篇文章:個(gè)人博客 SEO 優(yōu)化(1):搜索引擎原理介紹
SEO 優(yōu)化可以分為站內(nèi)優(yōu)化和站外優(yōu)化,而站內(nèi)優(yōu)化又分為:網(wǎng)站結(jié)構(gòu)優(yōu)化和網(wǎng)站頁(yè)面優(yōu)化。從 SEO 角度來(lái)看,做網(wǎng)站結(jié)構(gòu)優(yōu)化的目的在于:
- 提高用戶體驗(yàn)
- 提高收錄
- 更好的權(quán)重分配
- 優(yōu)化錨文字分布
網(wǎng)站結(jié)構(gòu)優(yōu)化簡(jiǎn)單概括有下面幾個(gè)要素:
- 物理及鏈接結(jié)構(gòu)
- 清晰的導(dǎo)航
- 分配好子域名和目錄
- 禁止收錄機(jī)制
- nofollow 使用
- URL 靜態(tài)化
- URL 設(shè)計(jì)
- 網(wǎng)址規(guī)范化
- 復(fù)制內(nèi)容
- 網(wǎng)站地圖 sitemap
- 內(nèi)部鏈接及權(quán)重分配
- 404 頁(yè)面
網(wǎng)站結(jié)構(gòu)優(yōu)化
物理及鏈接結(jié)構(gòu)
物理結(jié)構(gòu)指的就是網(wǎng)站真實(shí)目錄及文件所在的位置決定的結(jié)構(gòu)。一般來(lái)說(shuō),比較合理的兩種物理結(jié)構(gòu)是扁平式和樹(shù)形結(jié)構(gòu)。扁平式就是所有的頁(yè)面都放在一級(jí),一般來(lái)說(shuō),這種方式只適合頁(yè)面數(shù)量少的網(wǎng)站。更多的都是采用樹(shù)形結(jié)構(gòu)的方式。比如利用 hexo 構(gòu)建的博客就是采用樹(shù)形結(jié)構(gòu):
鏈接結(jié)構(gòu)指的是網(wǎng)站內(nèi)部頁(yè)面的鏈接所形成的結(jié)構(gòu)。鏈接結(jié)構(gòu)通常也是樹(shù)形結(jié)構(gòu):
H 代表著網(wǎng)站首頁(yè)。C1 和 C2 代表著網(wǎng)站的分類(lèi)首頁(yè)。P1~4 則是具體的每個(gè)頁(yè)面。這只是演示的結(jié)構(gòu),實(shí)際的結(jié)構(gòu)會(huì)比這個(gè)更加復(fù)雜。
對(duì)于搜索引擎來(lái)說(shuō),鏈接結(jié)構(gòu)會(huì)比物理結(jié)構(gòu)來(lái)得更有意義。在上一篇 個(gè)人博客 SEO 優(yōu)化(1):搜索引擎原理介紹 中有介紹到,與首頁(yè)點(diǎn)擊距離越近的頁(yè)面被 spider 爬行的概率也大,即權(quán)重越高。這里的點(diǎn)擊距離指的就是鏈接結(jié)構(gòu)的距離。比如同樣是屬于第三層級(jí)的 P3 頁(yè)面,由于被首頁(yè)直接鏈接指向,它的首頁(yè)點(diǎn)擊距離比其他頁(yè)面來(lái)得短,因此會(huì)有更高的權(quán)重。
設(shè)置合理的網(wǎng)站的鏈接結(jié)構(gòu)有利于頁(yè)面權(quán)重的分配。
清晰的導(dǎo)航
清晰的導(dǎo)航系統(tǒng)是網(wǎng)站設(shè)計(jì)的重要目標(biāo)。畢竟你肯定不想你的用戶進(jìn)入你的網(wǎng)站首頁(yè)后,面對(duì)混亂的導(dǎo)航,難以找到想到的頁(yè)面。對(duì)于搜索引擎的 spider 也是如此,混亂的導(dǎo)航會(huì)降低 spider 爬行概率。
在設(shè)置網(wǎng)站導(dǎo)航應(yīng)該注意下面幾點(diǎn):
- 文字導(dǎo)航。盡量使用 HTML 靜態(tài)文字作為導(dǎo)航,不要使用 JavaScript 生成的動(dòng)態(tài)導(dǎo)航。這樣對(duì) spider 來(lái)說(shuō),爬行阻力最小。導(dǎo)航系統(tǒng)鏈接是整個(gè)網(wǎng)站收錄最重要的內(nèi)部鏈接
- 點(diǎn)擊距離及扁平化。導(dǎo)航的一個(gè)目標(biāo)就是讓所有的頁(yè)面與首頁(yè)點(diǎn)擊距離越短越好。像權(quán)重普通的網(wǎng)站,內(nèi)頁(yè)一般不要超過(guò)首頁(yè) 4、5 次點(diǎn)擊。所以要盡量在鏈接結(jié)構(gòu)上做到扁平化。
- 錨文字中包含關(guān)鍵詞。導(dǎo)航關(guān)鍵詞盡量使用目標(biāo)關(guān)鍵詞。
- 面包屑導(dǎo)航。對(duì)于中大型網(wǎng)站,面包屑是必不可少。它是幫助用戶和搜索引擎建立頁(yè)面在網(wǎng)站整個(gè)結(jié)構(gòu)中的位置最好的方法。
- 避免頁(yè)腳堆積。近年來(lái)對(duì)于頁(yè)腳堆積關(guān)鍵詞的做法似乎不受搜索引擎歡迎了,盡量避免這種做法。
子域名和目錄
搜索引擎通常會(huì)把子域名當(dāng)成獨(dú)立的站點(diǎn)。而目錄就是該域名名下的一部分。比如http://api.chenhuichao.com 只是 http://www.chenhuichao.com 的一個(gè)子域名。
http://www.chenhuichao.com/tags 就是一個(gè)目錄。
因此對(duì)主域名所做的優(yōu)化,對(duì)于子域名的網(wǎng)站而言,同樣需要再做一遍。一般的網(wǎng)站和博客不需要子域名。只有大型的網(wǎng)站才會(huì)需要。
禁止收錄機(jī)制
你如果你不想某些具體的頁(yè)面不被收錄,可以通過(guò) robots 文件或者 Meta Robots 標(biāo)簽來(lái)指定,確保頁(yè)面不會(huì)被搜索引擎收錄。
robots 文件
該文件是搜索引擎爬行網(wǎng)站第一個(gè)訪問(wèn)的,用于告訴搜索引擎那些內(nèi)容可以爬取,哪些內(nèi)容禁止爬取。如果沒(méi)有寫(xiě)規(guī)則或者沒(méi)有 robots 文件的話,就是默認(rèn)全部沒(méi)有都可以爬取。
但是由于有的網(wǎng)站服務(wù)器設(shè)置問(wèn)題,如果不存在 robots.txt 文件的時(shí)候,會(huì)返回 200 狀態(tài)碼及一些錯(cuò)誤信息。可能會(huì)導(dǎo)致 spider 錯(cuò)誤解讀信息。所以建議,至少也要放一個(gè)空的 robots.txt 文件在網(wǎng)站根目錄下。
robots 的格式如下:
上面的文件代表禁止所有搜索引擎爬取所有內(nèi)容。User-agent: * 表示運(yùn)行所有的搜索引擎。我們知道,不同的搜索引擎的 spider 名稱也不同。在 User-agent 上你也可以設(shè)置名稱,只允許特定的搜索引擎爬取。如 User-agent: Googlebot
Disallow 不添加任何路徑就表示運(yùn)行爬取任何內(nèi)容。需要注意的是:如果要 Disallow 多個(gè)文件夾或者文件,需要寫(xiě)成多行。每一行 Disallow 只能寫(xiě)一個(gè)。
meta robots 標(biāo)簽
通過(guò) <meta name="robots" content="noindex,nofollow"> 也可以設(shè)置禁止搜索引擎索引本頁(yè)的內(nèi)容,禁止跟蹤本頁(yè)的鏈接。其中 content 的參數(shù)有:
- noindex: 不索引本頁(yè)內(nèi)容
- nofollow:不追蹤本頁(yè)鏈接
- nosnippet:不要在搜索結(jié)果中顯示說(shuō)明文字
- noarchive:不要顯示快照
- noodp:不要使用開(kāi)放目錄中的標(biāo)題和說(shuō)明
每個(gè)參數(shù)中間需要已逗號(hào)隔開(kāi)。
nofollow
格式如下:
<a href="" rel="nofollow">nofollow</follow>nofollow 標(biāo)簽是由 Google 領(lǐng)頭創(chuàng)新的一個(gè)“反垃圾鏈接”的標(biāo)簽,并被市場(chǎng)上其他主流搜索引擎廣泛支持。nofollow 是 a 標(biāo)簽的一個(gè)屬性值。用于告訴搜索引擎不要追蹤此鏈接,因?yàn)檫@個(gè)鏈接不是作者所信任的。這里的 nofollow 與上面說(shuō)的 meta 標(biāo)簽上的 nofollow 區(qū)別在于:a 標(biāo)簽上的 nofollow 是指單個(gè)鏈接,而 meta 上的 nofollow 是指整個(gè)頁(yè)面所有的鏈接。
nofollow 通常用于博客評(píng)論、論壇帖子、社交網(wǎng)站、留言板等地方。因?yàn)檫@些地方的內(nèi)容都是用戶可以自由留下鏈接,站長(zhǎng)并不知道這些鏈接是否可信。經(jīng)過(guò)測(cè)試發(fā)現(xiàn),你在 segmentfault 或者掘金發(fā)表文章時(shí),文章的外部鏈接都會(huì)加上 rel="nofollow"。
同時(shí)對(duì)于網(wǎng)站內(nèi)部一些重復(fù)內(nèi)容的頁(yè)面或者是一些無(wú)需被收錄的鏈接都可以加上該標(biāo)簽,可以防止網(wǎng)站權(quán)重浪費(fèi)。比如像聯(lián)系我們、隱私政策等頁(yè)面,就可以使用 nofollow 標(biāo)簽了。
URL 靜態(tài)化
我們都知道,對(duì)于動(dòng)態(tài)頁(yè)面對(duì)應(yīng) spider 爬取是不友好的。因此需要將 URL 靜態(tài)化才能更好的讓 spider 爬取。
這點(diǎn)對(duì)于 hexo 博客來(lái)說(shuō)不成問(wèn)題。畢竟本身都是靜態(tài)博客,所有的頁(yè)面都是 HTML 頁(yè)面。
網(wǎng)址規(guī)范化問(wèn)題
網(wǎng)址規(guī)范指的是盡量使用唯一的 URL,而不要使用多個(gè) URL。比如下面的 url 雖然訪問(wèn)都是同樣的內(nèi)容,但是搜索引擎會(huì)把他們當(dāng)做不同的頁(yè)面
- http://www.chenhuichao.com
- http://www.chenhuichao.com/in...
- http://chenhuichao.com/index....
復(fù)制內(nèi)容
復(fù)制內(nèi)容也稱重復(fù)內(nèi)容,指的是多個(gè) URL 的內(nèi)容相同或者非常相似。復(fù)制內(nèi)容既可能發(fā)生在同一網(wǎng)站內(nèi),也可能發(fā)生在不同網(wǎng)站上。
如果一個(gè)網(wǎng)站的復(fù)制內(nèi)容過(guò)多的話,會(huì)帶來(lái)害處。一是有可能使搜索引擎對(duì)網(wǎng)站的質(zhì)量產(chǎn)生懷疑,導(dǎo)致懲罰。另外一種情況就是,同一個(gè)站內(nèi)的復(fù)制內(nèi)容過(guò)多的話,會(huì)分散權(quán)重。
那么該如何消除復(fù)制內(nèi)容?
- 確保 URL 的唯一性。每個(gè)頁(yè)面只有一個(gè) URL。
- 對(duì)于某些確實(shí)需要多個(gè) URL 頁(yè)面可以使用 301 跳轉(zhuǎn)
- 使用 cannoical 標(biāo)簽
網(wǎng)站地圖
無(wú)論站點(diǎn)的多少,網(wǎng)站地圖都是需要的。網(wǎng)站地圖有 HTML 和 XML 兩種版本。
HTML 版本的網(wǎng)站地圖就是一個(gè)頁(yè)面列出網(wǎng)站的結(jié)構(gòu)。而 XML 版本則是通過(guò)在根目錄添加 sitemap.xml 文件。
一個(gè) XML 版本的網(wǎng)站地圖是上面那樣。其中的標(biāo)簽含義如下:
- url,必須的,是網(wǎng)址的母標(biāo)簽
- loc,必須的,頁(yè)面完整 URL
- lastmod,可選的,頁(yè)面最后一次更新時(shí)間
-
changefreg,可選的,頁(yè)面更新頻率
- always
- hourly
- daily
- weekly
- monthly
- yearly
- never
- priority 可選 頁(yè)面權(quán)重
除了 url 和 loc 是必須之外,其他的標(biāo)簽都為可選,只是主動(dòng)告訴搜索引擎頁(yè)面的一些信息,具體還是得根據(jù)搜索引擎自己的判斷。
制作好網(wǎng)站地圖后,需要主動(dòng)告訴搜索引擎。有兩種方式:主動(dòng)在站長(zhǎng)工具提交 sitemap、robots.txt 文件指明位置
比如 針對(duì) Google 搜索引擎可以在 Google 網(wǎng)站站長(zhǎng) 上提交。
另外一種方式是在 robots.txt 文件中指出 sitemap.xml 的位置也能讓搜索引擎知道網(wǎng)站地圖的位置。
Sitemap: http://www.chenhuichao.com/sitemap.xml內(nèi)部鏈接及權(quán)限分配
一個(gè)網(wǎng)站的首頁(yè)權(quán)重是最高的,接著是二級(jí)分類(lèi)頁(yè)面,與我們前面提到的鏈接結(jié)構(gòu)一樣,也是成一個(gè)樹(shù)結(jié)構(gòu)。內(nèi)部權(quán)限分配有幾個(gè)原則:
- 重點(diǎn)內(nèi)頁(yè)可以通過(guò)直接鏈接到首頁(yè)提高權(quán)重
- 非必要頁(yè)面設(shè)置 nofollow 不分散權(quán)重
錨文字對(duì)于內(nèi)部權(quán)限分配也是非常重要的一個(gè)手段。這方面 維基百科絕對(duì)是做得最好的。
404 頁(yè)面
當(dāng)訪問(wèn)的頁(yè)面不存在時(shí),需要一個(gè)專門(mén)的 404 頁(yè)面。404 頁(yè)面的設(shè)計(jì)需要注意幾點(diǎn):
- 保持與網(wǎng)站統(tǒng)一的風(fēng)格
- 應(yīng)該在醒目的位置顯示錯(cuò)誤信息,明確提示用戶,訪問(wèn)的頁(yè)面不存在。
- 錯(cuò)誤頁(yè)面還可以提供幾種跳轉(zhuǎn):比如回到首頁(yè)和其他你引導(dǎo)讓用戶訪問(wèn)的鏈接
404 頁(yè)面與外鏈的一個(gè)小技巧
由于搜索引擎并不會(huì)無(wú)緣無(wú)故得爬行一些不存在的原因的。肯定是有外部鏈接指向這些地址,比如別人的博客頁(yè)面引用等,而原文可能你已經(jīng)刪除或者更換 url 了。所以我們可以通過(guò) Google 網(wǎng)站站長(zhǎng)工具發(fā)現(xiàn)我們網(wǎng)站存在的錯(cuò)誤鏈接,將錯(cuò)誤地址做 301 跳轉(zhuǎn)到正確的頁(yè)面或者直接在本來(lái)不存在的 URL 上新建一個(gè)頁(yè)面,接收這些外部鏈接的權(quán)重。
頁(yè)面優(yōu)化
網(wǎng)址頁(yè)面優(yōu)化可以從下面幾個(gè)角度進(jìn)行:
- 頁(yè)面標(biāo)題
- description meta 標(biāo)簽
- keyword meta 標(biāo)簽
- 正文中的關(guān)鍵詞
- H 標(biāo)簽
- 圖片 ALT 文字
- 內(nèi)部鏈接及錨文字
- 外部鏈接及錨文字
- 頁(yè)面更新
頁(yè)面標(biāo)題
頁(yè)面標(biāo)題是頁(yè)面優(yōu)化最重要的因素。格式如下:
<title>個(gè)人博客 SEO</title>在優(yōu)化標(biāo)題的時(shí)候需要注意:
- 每個(gè)標(biāo)題應(yīng)該是根據(jù)當(dāng)前內(nèi)容設(shè)置的獨(dú)特不重復(fù)的。
- 字?jǐn)?shù)限制。不能太長(zhǎng),要不然搜索引擎結(jié)果列表會(huì)顯示不全。最好不超過(guò) 25 個(gè)中文字。最好是在 10~20 之間。
- 切勿堆砌關(guān)鍵詞。這是很多人常犯的錯(cuò)誤
- 關(guān)鍵詞最好出現(xiàn)在最前面
- 標(biāo)題有吸引力。畢竟有吸引力的標(biāo)題才能讓用戶點(diǎn)擊
- 連詞符的使用。可以使用 |->
- 不要使用沒(méi)有意義的句子
description 標(biāo)簽
Description 標(biāo)簽用于說(shuō)明網(wǎng)頁(yè)的主體內(nèi)容。格式如下:
<meta name="description" conent="seo學(xué)習(xí)筆記,通過(guò)學(xué)習(xí)seo對(duì)個(gè)人博客進(jìn)行seo優(yōu)化,以提高搜索引擎排名"Description 標(biāo)簽的重要性要比標(biāo)題低很多。用戶在頁(yè)面中并不會(huì)看到描述文字,只會(huì)在源文件和搜索結(jié)構(gòu)列表中才能看到。但是搜索引擎并不是只會(huì)提交描述標(biāo)簽文字顯示在搜索結(jié)果列表的。有時(shí)候搜索引擎也會(huì)根據(jù)文章內(nèi)容動(dòng)態(tài)提取說(shuō)明文字。
對(duì)于個(gè)人站點(diǎn)而言,描述標(biāo)簽最好是一句通順的句子,如果不能的話,則寧可不要。
keyword 標(biāo)簽
目前 keyword 標(biāo)簽對(duì) seo 已經(jīng)沒(méi)有任何影響了。
正文中的關(guān)鍵詞
正文中的關(guān)鍵詞涉及到兩個(gè)概念:
- 詞頻:關(guān)鍵詞出現(xiàn)的次數(shù)
- 密度:關(guān)鍵詞出現(xiàn)的次數(shù)除以頁(yè)面可見(jiàn)文字總詞數(shù)
由于現(xiàn)在詞頻和密度對(duì)于 SEO 影響不大,所以只要保持你的正文中出現(xiàn) 4~6 次關(guān)鍵詞就可以了。千萬(wàn)不能堆砌關(guān)鍵詞。
H 標(biāo)簽
H 標(biāo)簽的重要性可能是僅次與頁(yè)面標(biāo)簽。H1->H6 的重要性依次降低。
所以建議在頁(yè)面的 H1 和 H2 標(biāo)簽中混入關(guān)鍵詞
圖片 ALT 文字
對(duì)于前端攻城獅而言,這是個(gè)常規(guī)操作了。畢竟圖片都是需要添加 ALT 文字的,用于在圖片不顯示的情況下顯示 ALT 文字。圖片 ALT 文字出現(xiàn)的關(guān)鍵詞對(duì)頁(yè)面相關(guān)性也有一定的影響。同樣的,也不要在 ALT 上堆砌關(guān)鍵詞。
內(nèi)部鏈接及錨文字
內(nèi)部鏈接對(duì)于爬行和收錄具有很重要的意義。內(nèi)部鏈接對(duì)頁(yè)面關(guān)鍵詞相關(guān)性也有影響,最主要的就是在內(nèi)部鏈接中使用錨文字。
錨文字是告訴搜索引擎被鏈接頁(yè)面主題內(nèi)容的最重要依據(jù)之一。我們有時(shí)候可能無(wú)法控制外部鏈接的錨文字,但是對(duì)于站內(nèi)的內(nèi)部鏈接錨文字我們可以控制。不過(guò)有幾點(diǎn)需要注意:
- 適當(dāng)出現(xiàn)匹配關(guān)鍵詞的錨文字
- 錨文字不能集中導(dǎo)航或者頁(yè)尾,要分散在正文中
- 不要過(guò)度優(yōu)化錨文字,要不然有可能會(huì)被搜索引擎懲罰
導(dǎo)出鏈接及錨文字
導(dǎo)出鏈接有可能會(huì)有兩種情況:
- 導(dǎo)出的鏈接頁(yè)面內(nèi)容與錨文字不符合,會(huì)對(duì)網(wǎng)站頁(yè)面的相關(guān)性有一定影響
- 如果導(dǎo)到一個(gè)權(quán)威的網(wǎng)站,頁(yè)面本身相關(guān)性也會(huì)提高
頁(yè)面更新
毋庸置疑,保持更新能提高排名。畢竟頁(yè)面更新率也是吸引 spider 返回抓取的因素之一。
通過(guò)上面的一些介紹,基本上把站內(nèi)優(yōu)化的基本要素覆蓋了。雖然對(duì)于網(wǎng)站 SEO 而言,站外鏈接的優(yōu)化意義要遠(yuǎn)遠(yuǎn)重要于站內(nèi)優(yōu)化,但是這并不意味著你不需要站內(nèi)優(yōu)化。只有把一些基本的站內(nèi)優(yōu)化細(xì)節(jié)做好,保持高質(zhì)量的內(nèi)容更新,才能吸引更多的用戶。
所以下一篇文章就要介紹如何針對(duì) hexo 主題進(jìn)行 SEO 改造。
總結(jié)
以上是生活随笔為你收集整理的个人博客 SEO 优化(2):站内优化的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: leaflets + heatmap 加
- 下一篇: Mysql视图权限设置的踩坑经历