nofollow的定義及如何正確使用nofollow?
- 威海網站結構優化 威海nofollow
- 1938
什么是nofollow:
在html標簽中,< a > 標簽的rel 屬性被用于說明當前文檔與被鏈接文檔的關系。而nofollow則是其中的一種屬性值,其用法示例為:
< a href="..." rel="nofollow" >...< /a >
其另一種使用方法,也是最原始的使用方法,是用于網頁的元標簽中,告訴搜索引擎不要抓取那個網頁上的所有導出鏈接。其書寫方式為:
< meta name="robots" content="nofollow" / >
關于meta robots的常見屬性值還有noindex與noarchive等,此文不延伸出去了。
除此之外,可以達到類似效果的,還有常見的robots.txt,以及被Google所支持的X-Robots標簽。
一般更常用的是第一種,因為它具有最大的靈活性。本文主要以< a >標簽中的nofollow展開討論。
nofollow的原意:
最初nofollow屬性值誕生的時候,是為了改善spam的情況的。它告訴搜索引擎不要給所鏈接向的頁面傳遞權值,這樣被鏈接的頁面理論上就不會得到任何好處。因此,nofollow多數情況下被使用在博客留言等地方,這也是多數人對于nofollow的主要認識。
但因為nofollow的這種作用,有人在友情鏈接上面使用nofollow從而企圖控制PR,其實這樣的想法是完全錯誤的,PageRank不存在流失一說。雖然基于原始PR公式,網頁上的導出鏈接過多并不會好,但Google更是大力推崇連向好的網站的。
也有人會選擇去掉博客評論上面的nofollow,這也是不明智的,因為博客留言中往往會有著各式不相關的網站鏈接出現,這會導致網站主題漂移的情況。但因為不屬于本文的范圍,不再展開。
因為很多人濫用了nofollow,所以Google一般的建議是,只對于不可控制的回復鏈接以及付費的廣告鏈接使用nofollow。這也就是其最原始的本意。
由于后文涉及一些具體情況,先描述下主要的兩個搜索引擎對于nofollow的不同態度。
Google對nofollow的處理:
根據Google網站站長工具幫助里面所提,Google 不會傳遞nofollow鏈接的PR或定位文字(即錨文本),它會選擇完全放棄對于這些鏈接的追蹤。但是另外需要注意的是,如果有其他未使用nofollow的鏈接連向某些頁面時,那些頁面依然會被置入索引。
百度對nofollow的處理:
根據Lee所說的,百度對其處理方式有些值得玩味,直接貼出原文:
< meta name="robots" content="nofollow" > 不追蹤鏈接,不傳遞權重。
< a rel="nofollow" href="#" >123< /a >只起到發現鏈接的作用,但不傳遞權重。
從站長的角度,應該看不到任何不同。。。
言下之意就是,< a >標簽的nofollow依然是會發現鏈接的,既代表著會抓取。而“權重”在這里是廣義權重(涉及PR、錨文本等等),還是比較狹義的權重(僅僅是PR之類)呢?Lee沒有提及。
根據個人的實驗,用了一個nofollow的鏈接指向了Google,過了一段時間,加上引號搜索那個鏈接的錨文本,Google排在了第一位。可以料到的是,很有可能百度上面的nofollow不傳遞的只是基于鏈接的狹義權重。但也不能完全排除的可能性是,百度根本不支持nofollow(或不支持external nofollow)。
External nofollow的含義:
external這個前綴只是在html語義上的差別,對于SEO沒有半點影響。它的本意是,屏蔽的是外部鏈接。盡管external nofollow和nofollow看上去略有區別,但搜索引擎應當是完全相同的去看待它們的。百度唯獨不支持前者的可能性較小。但萬一是的話,只能說百度這點上做得非常不足。
nofollow對于輔佐爬蟲抓取的運用:
我們知道的是,搜索引擎判斷網頁的重要性之中,占了很大比例的一點是網頁被引用的數量。當一個頁面被鏈接的更多,通常它就顯得更重要,隨之爬蟲也會經常去抓取這些頁面——盡管往往是不需要的,因為很多頁面是無價值頁面,比如很多網站都有的“聯系我們”等等。
這樣來說,網站上面往往就有一些無價值頁面被頻繁抓取,總而降低了真正有價值的頁面被抓取并置入索引的幾率。所以對于網站上的無價值頁面采取nofollow的手段,是對于提升收錄量有著很大的積極意義的。
PR Sculpting:
這是基于一般的nofollow用法所進化出來的極端優化方法,屬于黑帽范疇。它大幅度的屏蔽鏈接——無論頁面是否有價值。它利用的是PageRank算法的弊端,通過減少各個頁面上的鏈接數量,從而在短時間內把網站中個別頁面的PR提升到一個很高的數值。因為這種黑帽nofollow技巧的濫用,于是Google做出了動作。
Google的nofollow權值分配方法變更:
因為PR Scupting嚴重影響了搜索引擎結果的公正性,Google對此做出了變動。舉最簡單的例子:
最早什么都沒有的時候,一個頁面上有10個鏈接,假設該頁面有10分,就各送1分給那10個被鏈接的頁面。 nofollow剛出現的時候,其他假設依舊,但是nofollow了其中5個鏈接,那么被屏蔽的頁面不會得到任何分值,沒屏蔽的每個可以得到2分。 nofollow權值分配方法改變后,只要頁面上有10個鏈接,不管幾個被nofollow,每個頁面都最多得到1分,當然被屏蔽的依舊是0。 因為此時PR Sculpting在國外十分盛行,很多網站上或多或少會些其影子,于是Google此舉引起了很大反應。
使用nofollow做主題歸類:
如果稍微研究過一些算法就會知道,基于鏈接的算法存在著主題漂移這一難題,尤其是HITS算法,一旦搜索引擎把握不好,就沒法正確判斷網頁的主題為何,防止主題漂移的一個簡單的方法就是利用nofollow。
搜索引擎是一向強調主題歸類的,比如百度SEO指南里面提到的,網站的內頁應該連向其上級欄目頁(不包含其他不相關欄目)等等,所以用nofollow做主題歸類完全是屬于白帽的,是幫助搜索引擎更好的理解網站的內容。
其做法就是當某頁面上連向不相關的頁面時,使用nofollow,更形象的比喻,主題歸類就是像在整理抽屜一樣,把相關的東西盡量放到一塊,整齊明了。
但也不能為了主題歸類,將不相關的鏈接全部分隔開來,畢竟搜索引擎還是需要一些其他的鏈接來發現內容的。
nofollow與robots的區別:
很多時候nofollow和robots一并被人提起,因為一般看來都有一個效果——讓搜索引擎不要抓取某個頁面。這里因為多種搜索引擎的不同處理方式是有不同情況的:
百度:按照上文所述,百度爬蟲極有可能會爬行nofollow鏈接,所以試圖用nofollow來屏蔽某個頁面不被抓取是不妥當的,必須輔以robots文件。而robots文件已經屏蔽的頁面,按照Lee的暗示,是不會獲得權重的。
Google:Google爬蟲不會爬行nofollow鏈接,但是只要頁面有一個dofollow鏈接,依然是有可能被抓取的,想要屏蔽頁面最妥當的方式還是采用robots文件。而根據有人的vgsa測試,僅僅robots屏蔽的頁面依然會在Google上面獲得PageRank。
因為不同搜索引擎對待這兩個東西的方式不盡相同,所以當需要屏蔽頁面的時候,應當把這兩個都用上。
Nofollow表現是一個用于指示站內某些超鏈接不是經過站長推薦的,這個鏈接不是一個信任票,不應影響搜索引擎索鏈接投票的HTML屬性值。搜索引擎看到這個標簽就會減少或取消此外鏈的投票權重。目的是盡量減少無用鏈接對網站在搜索引擎中的影響。
百度官方已明確表示:“百度現在支持nofollow標簽。帶nofollow標簽的鏈接,我們會忽略掉它絕大部分的作用。”肯定了百度與谷歌兩大主流搜索引擎都支持nofollow標簽。nofollow標簽的作用大家現在都知道了,那么我們平常網站建設中,如何正確使用nofollow標簽呢?
1、交互功能
如:博客評論、網站留言板等所有訪客留下的鏈接,這些鏈接不是作為網站管理員的你愿意添加的,是不受控制的鏈接,不代表站長贊同的導出鏈接,這個時候我們把這些鏈接都標記nofollow屬性。根據谷歌pr值投票理論,假設每個頁面的pr是一定的,每一個鏈接都代表一個投票,當你的導出鏈接越多,你站內網頁的pr等級和網頁權重被稀釋的也就多。加上nofollow屬性標簽后,百度,Google會忽略掉這個鏈接的投票作用,挽回網站權重被稀釋的影響。
2、廣告鏈接
廣告鏈接的作用是為了在本站宣傳產品,目的是讓我們網站的用戶瀏覽廣告進入對方網站,但鏈接權重的傳遞并不是管理員愿意的。很多新手站長不理解理解nofollow表現的作用,把廣告鏈接寫在js里或者iframe調用,大家都知道過多的JS與iframe嵌套,對搜索引擎是非常不友好的表現,很多網頁木馬升序都是iframe嵌套在網頁中,百度甚至是討厭這樣的代碼,這就完全背離seo的原理和網站優化的初衷。最簡單的做法就是在鏈接上加上nofollow標簽。
大家可以見一個例子,站長工具首頁導出鏈接多達100多個,但是為什么它的網頁PR值是4,而且搜索引擎權重絲毫沒有降低呢?通過查看源文件,所有廣告鏈接全部都有nofollow屬性標簽,所以沒有稀釋網頁本身的權重。
3、內頁鏈接控制權重傳遞
這一點很容易被管理員所忽略。同一個網站的每一個頁面的作用和權重都是不一樣的,通常首頁權重最高。首頁上的鏈接往往都是最多的,但是有一些類似“注冊”“登陸”等等鏈接,這些鏈接必須出現,但對整個網站的seo沒有任何作用,那么這樣的鏈接我們就可以加上nofollow標簽,使整個網站的權重將不會傳遞到這種無用的頁面上。譬如,我們的很多關鍵詞都體現在各個頻道中或者文章頁面,更高的權重將會傳遞到這些頁面上。
seo是一個方方面面都要照顧到的系統工作,不要忽略每一個提高權重的細節。大家以后交換友情鏈接的時候,也要注意一下對方是不是存在加Nofollow屬性的鏈接欺騙行為。今天補習了一下“如何正確使用nofollow標簽”,希望能給大家帶來幫助!
寫在最后:
nofollow是一個對于SEO很有作用的屬性值,但是也同樣是比較容易被濫用的。而如何真正用好它發揮應有的價值,需要其他方面更多的基礎積累。
個人所知的主要就是這點,雖然還有些其他的運用方式略了解些,但是自己還很模糊,也就不多提了。除此之外,nofollow應當還有不少運用方式,是個絕對值得發掘的屬性值。