PageRank的計算方法以及影響因素
Google搜索引擎采用的核心軟件稱為 PageRank,這是由Google創(chuàng)始人開發(fā)出的一套用于網(wǎng)頁評級的系統(tǒng),是Google搜索排名算法中的一個組成部分,級別從1到10級,10級為滿分,PR值越高說明該網(wǎng)頁在搜索排名中的地位越重要,也就是說,在其他條件相同的情況下,PR值高的網(wǎng)站在Google搜索結(jié)果的排名中有優(yōu)先權(quán)。網(wǎng)頁級別由此成為Google所有網(wǎng)絡(luò)搜索工具的基礎(chǔ)。
網(wǎng)頁級別概述
Google對網(wǎng)頁級別的描述
作為組織管理工具,網(wǎng)頁級別利用了互聯(lián)網(wǎng)獨特的民主特性及其巨大的鏈接結(jié)構(gòu)。實質(zhì)上,當(dāng)從網(wǎng)頁 A 鏈接到網(wǎng)頁 B 時,Google 就認為"網(wǎng)頁 A 投了網(wǎng)頁 B 一票"。Google 根據(jù)網(wǎng)頁的得票數(shù)評定其重要性。然而,除了考慮網(wǎng)頁得票數(shù)(即鏈接)的純數(shù)量之外,Google 還要分析投票的網(wǎng)頁。"重要"的網(wǎng)頁所投出的票就會有更高的權(quán)重并且有助于提高其它網(wǎng)頁的"重要性"。
重要的、高質(zhì)量的網(wǎng)頁會獲得較高的網(wǎng)頁級別。Google 在排列其搜索結(jié)果時,都會考慮每個網(wǎng)頁的級別。當(dāng)然,如果不能滿足您的查詢要求,網(wǎng)頁級別再高對您來說也毫無意義。因此,Google 將網(wǎng)頁級別與完善的文本匹配技術(shù)結(jié)合在一起,為您找到最重要、最有用的網(wǎng)頁。Google 所關(guān)注的遠不只是關(guān)鍵詞在網(wǎng)頁上出現(xiàn)的次數(shù),它還對該網(wǎng)頁的內(nèi)容(以及該網(wǎng)頁所鏈接的內(nèi)容)進行全面檢查,從而確定該網(wǎng)頁是否滿足您的查詢要求。
PR值算法原理總體上基于下面2個前提:
1、一個網(wǎng)頁被多次引用,則它可能是很重要的;
一個網(wǎng)頁雖然沒有被多次引用,但是被重要的網(wǎng)頁引用,則它也可能是很重要的;一個網(wǎng)頁的重要性被平均的傳遞到它所引用的網(wǎng)頁。這種重要的網(wǎng)頁稱為權(quán)威(Authoritive)網(wǎng)頁。
2、假定用戶一開始隨機的訪問網(wǎng)頁集合中的一個網(wǎng)頁,然后跟隨網(wǎng)頁的鏈接向前瀏覽網(wǎng)頁,不回退瀏覽,那么瀏覽下一個網(wǎng)頁的概率就是被瀏覽網(wǎng)頁的PageRank值。
影響PR值的因素
PR值體現(xiàn)為從0到10的11個數(shù)值,在Google的工具欄上以一條橫向綠色柱狀圖顯示,0級情況下呈白色。它是針對網(wǎng)頁而不是網(wǎng)站,因此一個網(wǎng)站的首頁和內(nèi)頁往往有著迥然不同的PR值。由于Google市場拓展進程的原因,中文網(wǎng)頁的PR值整體上低于英文網(wǎng)頁。對中文網(wǎng)站來說,擁有3級PR是基礎(chǔ), 4級PR算達標(biāo),5級PR可謂良好,而6、7級PR就算相當(dāng)優(yōu)秀的網(wǎng)站。當(dāng)然,由于PR最直接的影響因素是來自鏈接,因此這種評級并不代表內(nèi)容的級別水準(zhǔn),網(wǎng)站內(nèi)容質(zhì)量對PR的影響是間接的、長期的。根據(jù)PR值的算法原理,可知影響一個網(wǎng)站(首頁)PR值的因素主要包括:
1、網(wǎng)站的導(dǎo)入鏈接質(zhì)量:
根據(jù)前文對高質(zhì)量導(dǎo)入鏈接的分析,則獲得高PR值需要獲得來自以下網(wǎng)站的鏈接:
◆ 加入搜索引擎分類目錄與已經(jīng)加入目錄的網(wǎng)站交換鏈接
◆ 獲得來自PR值不低于4并與你的主題相關(guān)或互補的網(wǎng)站的鏈接
◆ 你的鏈接出現(xiàn)在流量大、知名度高、頻繁更新的重要網(wǎng)站上(如新聞源)
◆ 與你交換鏈接的網(wǎng)站具有很少導(dǎo)出鏈接
◆ 與內(nèi)容質(zhì)量高的網(wǎng)站鏈接(PR值上升潛力大)
2、 導(dǎo)出鏈接數(shù)量:
根據(jù)PR計算原理,由于"一個網(wǎng)頁的重要性被平均的傳遞到它所引用的網(wǎng)頁",因此反過來看,一個頁面內(nèi)過多的導(dǎo)出鏈接將潛在引起該頁PR值的流失。但從內(nèi)容的角度看,適當(dāng)數(shù)量的與主題有關(guān)聯(lián)的導(dǎo)出鏈接給搜索引擎帶來良好的印象。因此,一個頁面,尤其是首頁的導(dǎo)出鏈接數(shù)量的把握,應(yīng)該兼顧到PR值和關(guān)鍵詞內(nèi)容二者之間的平衡,即控制導(dǎo)出鏈接數(shù)量,以不超過10個為宜。
3、搜索引擎收錄一個網(wǎng)站的頁面數(shù)量
在探討SEO的時候,人們過多關(guān)注核心關(guān)鍵詞排名以及首頁的表現(xiàn)情況,卻往往忽略了一個極其重要的問題:即搜索引擎對一個網(wǎng)站收錄的頁面數(shù)量。后者在SEO中也有著極其重要的意義。一個用核心關(guān)鍵詞查詢排名不佳的網(wǎng)站,可能由于被抓取大量網(wǎng)頁而在用戶使用其它關(guān)鍵詞查詢時,內(nèi)頁獲得前三甲排名。由于用戶搜索時使用的關(guān)鍵詞具有分散性,使得這種情況往往給網(wǎng)站帶來極大訪問量。
正因為收錄頁面的數(shù)量直接影響訪問量,因此對PR值的影響也是很大的。被收錄頁面越多,主頁PR越高。不過需要強調(diào)的是,此處所指的數(shù)量是指被收錄數(shù)與網(wǎng)站頁面總數(shù)的比值,而不是收錄頁面的絕對數(shù)值。比如一個擁有50個頁面的網(wǎng)站被收錄了10個頁面,網(wǎng)站的被收錄比值是1/5,一個擁有5000個頁面的網(wǎng)站被收錄了500個頁面,比值是1/10,結(jié)果是收錄10個頁面比收錄500個頁面的網(wǎng)站還更具排名優(yōu)勢。但對各個搜索引擎來說,究竟達到多大的比值算是良好,目前還沒有相關(guān)的數(shù)據(jù)。
附:查詢網(wǎng)站收錄頁面數(shù)量:在搜索引擎中輸入:site:www.yoursite.com(如果輸入:site:yoursite.com,則獲得的是在yoursite.com域名下所有二級域名的網(wǎng)頁數(shù)量)。
工具推薦:www.marketleap.com/siteindex 可獲得網(wǎng)站在多個主流搜索引擎中的網(wǎng)頁收錄數(shù)
4、首頁PR的高低
盡管對PR的界定是針對網(wǎng)頁而不是網(wǎng)站,但由于每個網(wǎng)頁都依托某一網(wǎng)站而存在,首頁是推廣的核心頁面,所以網(wǎng)站首頁PR高低對內(nèi)頁各PR也產(chǎn)生直接影響。一般而言,一個網(wǎng)站各頁面的PR值呈現(xiàn)以下走向:首頁﹥一級頁面﹥二級頁面﹥?nèi)夗撁妗可钊胍患墸琍R降低1-2個檔次。更深層次可能就無法列入評級范圍了。當(dāng)然,如果一個深層內(nèi)頁有很多外部或內(nèi)部鏈接,情況則另當(dāng)別論。
5、文件類型
Google可以索引到的網(wǎng)頁和文件類型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是網(wǎng)站比較重要的內(nèi)容或文章。因此Google默認PDF格式文件的PR天生為3,高于一般HTML文件。
同理,Google給予XML、PS、Word、Power Point、Excel等類型頁面的PR也比普通網(wǎng)頁文件高。因此,對于網(wǎng)站比較有價值的內(nèi)容,建議做成PDF格式。
6、PR值的更新
Google 每個月進行一次徹底的數(shù)據(jù)更新(Dance),更新后的網(wǎng)站排名和導(dǎo)入鏈接都會有某些變化,但其PR更新時間一般要延遲至dance后三個月左右,而且網(wǎng)站的PR值相對穩(wěn)定,要上升或下降一級PR是很不容易的事情。
工具推薦:
查看PR值是否處于更新期間:www.seochat.com/seo-tools/future-pagerank (如果結(jié)果出現(xiàn)不一致的情況,則處于更新期間)
PR值的作用
由于網(wǎng)頁級別的高低直接受鏈接的影響,而鏈接僅是SEO的一個方面,因此PR的高低只能反映出SEO的部分效果。一個網(wǎng)頁如果擁有高PR值能夠說明的僅是:
◆ 網(wǎng)頁比較重要,擁有了排名靠前的優(yōu)先權(quán),并不能與排名靠前直接劃上等號
◆ 具有了獲得高質(zhì)量導(dǎo)入鏈接的談判優(yōu)勢 搜索引擎會加快對網(wǎng)頁數(shù)據(jù)的更新
◆ 看上去挺美
正因為具有了排名靠前的優(yōu)先權(quán)和談判優(yōu)勢,使得高PR網(wǎng)站往往最終確實產(chǎn)生高排名,業(yè)內(nèi)不少人士就干脆直接將PR與SEO劃等號,這不僅不正確,也不利于SEO實施。因為PR值不高的網(wǎng)站同樣有可能獲得好的排名,而PR高的不見得有理想的排名。并且,在這樣的思想指導(dǎo)下,人們往往片面追求鏈接效應(yīng),忽略了SEO對于內(nèi)容、結(jié)構(gòu)、關(guān)鍵詞等方面的分析和改進,而后者才是用戶和搜索引擎長期關(guān)注的焦點。網(wǎng)絡(luò)營銷專家馮英健博士認為R值的高低應(yīng)該是包括SEO在內(nèi)的搜索引擎營銷所產(chǎn)生的自然結(jié)果而不應(yīng)作為追求的目標(biāo)。
結(jié)論:在SEO的過程中,不能忘記內(nèi)容建設(shè),不能忘記優(yōu)質(zhì)外鏈,但忘掉PR可沒什么大不了的。
來源:月光博客