語義分析、潛在語義索引和SEO
搜索引擎排名的基礎之一,就是關鍵詞與網頁的相關性。
機器算法和人不一樣的地方是人可以直接理解詞的意思,文章的意思,機器和算法不能理解。人看到蘋果這兩個字就知道指的是那個圓圓的,有水的挺好吃的東西,搜索引擎卻不能從感性上理解。
但搜索引擎可以掌握詞之間的關系,這就牽扯到語義分析。
前些年SEO界很熱烈地談論過一陣潛在語義索引(Latent Semantic Indexing)。這是來自Google的一項專利,但申請了專利,不一定就會使用在真實算法中。 Google多次暗示,有時候比較明確表示,Google算法中實際沒有應用潛在語義索引。但了解潛在語義索引的概念,我覺得對頁面內容的寫作是非常有好處的,所以還是寫貼子介紹一下。
什么是潛在語義索引
所謂潛在語義索引指的是,怎樣通過海量文獻找出詞匯之間的語義關系。當兩個詞或一組詞大量出現在同一個文檔中時,這些詞之間就可以被認為是語義相關。共同出現概率越大,相關性越高。
舉個例子,電腦和計算機這兩個詞在人們寫文章時經常混用,這兩個詞在大量的文件中同時出現,搜索引擎就會認為這兩個詞是極為語義相關的,實際上這兩個詞的意思幾乎一樣,是同義詞。
再比如,蘋果和橘子這兩個詞也經常一起出現在很多文件中,這兩個詞既不是同義詞也不是近義詞,但搜索引擎根據共同出現的概率判斷,這兩個詞是語義相關的。這兩個詞和水果這個詞也很相關。這些判斷顯然都是符合實際情況的。
有時候兩個詞的相關性直覺看起來沒有那么明顯,甚至在人的邏輯上就沒有什么關系,比如“杰克”和“輪船”,但很可能被搜索引擎判斷為有一定的語義關系,因為會共同出現在電影泰坦尼克號介紹中。
要注意的是,潛在語義索引并不依賴于語言,所以SEO和搜索引擎優化雖然一個是英語,一個是中文,但這兩個詞大量出現在相同的網頁中,雖然搜索引擎還不能知道搜索引擎優化或SEO指的是什么,但是卻可以從語義上把”SEO”,”搜索引擎優化”,”search engine optimization”,”SEM”等詞緊緊的連在一起。
搜索引擎有沒有使用潛在語義索引,至今沒有定論, Google還曾經否認。但一個事實是,2002年Google買下了擁有潛在語義索引專利的一家公司Allied Semantic。
這種語義分析技術可以給我們在SEO上一些提示。
網站主題的形成
通常邏輯和結構適當的網站都會分成不同的頻道或欄目。在不同的頻道中談論有些區別但緊密相關的話題,這些話題共同形成網站的主題。搜索引擎在把整個網站的頁面收錄進去后,能夠根據這些主題詞之間的語義相關度判斷出網站的主題。
網頁內容寫作
注意觀察的話會發現,搜索排名有一個現象,搜索某個關鍵詞,排在靠前面的網頁有時甚至并不含有所搜索的關鍵詞,這很有可能是潛在語義索引在起作用。
比如搜索電腦,排在前面的網頁有可能出現一篇只提到計算機卻沒提到電腦。因為搜索引擎通過語義分析知道這兩個詞是一回事。
還有一個要注意的是,在進行網頁寫作的時候,不要局限于目標關鍵詞,應該包含與主關鍵詞語義相關、相近的詞匯,以支持主關鍵詞。設想一下,一篇討論泰坦尼克號電影的文章,卻沒提到杰克,也沒提到沉船,也沒提到羅絲,也沒提到小李子,也沒提到愛情……那么這篇文章是怎么討論泰坦尼克號的呢?還是有相當大的難度的。
這在搜索結果中也有體現,有的文章雖然大量出現主關鍵詞,但缺少其他支撐詞匯,排名往往不好。
來源:seo每天一貼 Zac 昝輝