李彥宏超鏈分析專利,超鏈分析算法的作用
互聯網上的信息非常的龐大,要想讓用戶搜索到精準信息是很難的。搜索引擎技術非常復雜。百度創始人李彥宏在創立百度之前就已經是國際上比較厲害的搜索引擎技術專家了。據說李彥宏在找風險投資時,投資人詢問了三個搜索引擎界的技術牛人一個同樣的問題:要了解搜索引擎技術應該找誰,其中兩個人回答說找李彥宏,由此投資人就斷定李彥宏是最了解搜索引擎的人之一。
李彥宏超鏈分析示意圖
這其實就是現實生活中鏈接關系的應用:要判斷哪個人或網頁最具權威性,不能光看這個人或網頁,自己怎么說,還要看其他人對這個網頁怎么評價。超鏈分析的基本原理是在某次搜索的所有結果中,被其他網頁用超鏈指向得越多的網頁,其價值就越高,就越應該在結果排序中排名越靠前。
超鏈分析是一種引用投票機制,對于靜態網頁或者網站主頁,它具有一定的合量性,因為這樣的網頁容易根據其在互聯網上受到的評價產生不同的超鏈指向量,超鏈分析的結果可以反映網頁的重要程度,從而給用戶提供出更重要、更有價值的搜索結果。
李彥宏1997年就提交了一份名為“超鏈文件檢索系統和方法”的專利申請,這比Google創始人發明PR要早得多,不得不說這是非常具有前瞻性的研究工作。在這份專利中,李彥宏提出了與傳統信息檢索系統不同的基于鏈接的排名方法。
這個系統除了索引頁面之外,還建立一個鏈接詞庫,記錄鏈接錨文字的一些相關信息,如錨文字中包含哪些關鍵詞,發出鏈接的頁面索引,包含特定錨文字的鏈接總數,包含特定關鍵詞的鏈接都指向哪些頁面。詞庫不僅包含關鍵詞原型,也包含同一個詞千的其他衍生關鍵詞。
根據這些鏈接數據,尤其是錨文字,計算出基于鏈接的文件相關性。在用戶搜索時,將得到的基于鏈接的相關性與基于關鍵詞匹配的傳統相關性綜合使用,得到更準確的排名。
超鏈分析就是通過分析鏈接網站的多少來評價被鏈接的網站質量,這保證了用戶在百度搜索時,越受用戶歡迎的內容排名越靠前。在今天看來這種基于鏈接的相關性計算是搜索引擎的常態,每個SEO人員都知道。但是在十七八年前,這無疑是非常創新的概念。百度CEO李彥宏就是超鏈分析專利的唯一持有人,目前該技術已為世界各大搜索引擎普遍采用。當然現在的搜索引擎算法對鏈接的考慮,已經不僅僅是錨文字,實際上要復雜得多。但是大量精準有效的外鏈是提高目標關鍵詞排名的重要因素。在優化網站關鍵詞排名的時候高權重的外部鏈接還是非常重要的。