Google的奇怪規(guī)則:URL不能以.0結(jié)尾
- 威海seo專題 威海網(wǎng)站收錄
- 1440
前兩天SEOMoz發(fā)現(xiàn)和解決了一個很奇怪的Google收錄問題。
SEOMoz有一個網(wǎng)頁,是關(guān)于他們舉辦的Web 2.0大獎(Web 2.0 Awards)。URL是:
http://www.seomoz.org/web2.0
這個獎在網(wǎng)上還挺受歡迎,鏈接很多,URL是PR7。而且一直以來在Google搜索”Web 2.0 Award”時都排在第一位。
但前幾天SEOMoz發(fā)現(xiàn)搜索Web 2.0 Award時,這個頁面從Google消失了。排在最前面的是一個更深一層的頁面。
SEOMoz也弄不清是這么回事。所以Rand聯(lián)系了Google里面認(rèn)識的人,Google的人建議最好把URL改成不以.0結(jié)尾。
注意看SEOMoz這個頁面URL,后面沒有跟著一個斜線/。在大部分情況下,URL結(jié)尾沒有典型文件擴(kuò)展名如.html,.php等時,URL會被當(dāng)作目錄,目錄名后面沒有斜線時,服務(wù)器會在后面自動加上一個斜線。比如SEO每天一貼,如果用戶直接打開:
https://www.seozac.com/
或者有其他網(wǎng)頁鏈接到上面這個URL,服務(wù)器都會自動做一個301轉(zhuǎn)向到:
https://www.seozac.com/
由于某種原因,SEOMoz的這個URL并沒有做301轉(zhuǎn)向自動在目錄后加上斜線,也就是說URL還是以.0結(jié)尾:
http://www.seomoz.org/web2.0
瀏覽器和蜘蛛就把這個URL當(dāng)作了文件名,這個文件的擴(kuò)展名(或者說文件類型)是.0。而.0文件Google拒絕收錄,就像.exe文件一樣。
SEOMoz做了很多調(diào)查,發(fā)現(xiàn)頁面沒被收錄問題確實(shí)是因?yàn)檫@個以.0結(jié)尾的URL。在網(wǎng)上找不到以.0結(jié)尾的文件被收錄在Google數(shù)據(jù)庫中。像以下這些文件在Google都沒收錄,但雅虎有收錄:
en.wikipedia.org/wiki/Windows_1.0
en.wikipedia.org/wiki/Web_2.0
http://en.wikipedia.org/wiki/Die_Hard_4.0
drupal.org/drupal-5.0
keznews.com/3799_Vista_Transformation_Pack_8.0_Final_-_VTP_8.0
en.wikipedia.org/wiki/BASIC_8.0
drupal.org/drupal-6.0
en.opensuse.org/OpenSUSE_11.0
www.shopping.com/xGS-Illustrator_11.0
www.mythtv.org/wiki/index.php/Opensuse_11.0
www.shopping.com/xGS-Suse_9.0
en.wikipedia.org/wiki/Mac_OS_X_10.0
en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0
而非常相似的下面這些URL,Google就有收錄:
en.wikipedia.org/wiki/Web_2
drupal.org/drupal-5.0-beta1
http://keznews.com/3799_Vista_Transformation_Pack_8_0_Final_-_VTP_8_0
drupal.org/drupal-6.0-beta1
www.mythtv.org/wiki/index.php/Opensuse_10.3
www.mythtv.org/wiki/index.php/Opensuse_10.2
en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3
比較一下這兩個URL,域名,鏈接深度等幾乎都沒什么區(qū)別,唯一的區(qū)別就是URL結(jié)尾的不同:
en.opensuse.org/Bugs:Most_Annoying_Bugs_10.3 收錄
en.opensuse.org/Bugs:Most_Annoying_Bugs_10.0 沒收錄
SEOMoz發(fā)現(xiàn)了這個問題后,發(fā)了一篇帖子。很快Matt Cutts也回了篇帖子,做出了回復(fù)和調(diào)整。Matt Cutts說,是因?yàn)檫B到URL
http://www.seomoz.org/web2.0
的鏈接足夠多時使Google認(rèn)為它是應(yīng)該被收錄的那個URL版本,但Google又不收錄.0文件,所以SEOMoz的這個頁面被刪除了。
Matt Cutts還提到一個小技巧,要檢查某種文件名是否會被Google中被收錄,有一個很簡單的指令如:
filetype:exe
上面的搜索結(jié)果可以看到,沒有直接以.exe結(jié)尾的URL被收錄,也就是說.exe文件Google不收錄。
同樣.0文件Google一直到兩天前還都不收錄。不過Matt Cutts看到SEOMoz的這個帖子后,與工程師重新審視了一下現(xiàn)在以.0結(jié)束的URL,肯定也不都是垃圾頁面(可能以前大部分是),所以對Google收錄算法做了一定調(diào)整,重新開始收錄.0文件。其實(shí)很多網(wǎng)頁以.0結(jié)束,并不是因?yàn)槲募愋停窍馭EOMoz那樣,在想寫Web2.0時,很巧合的以.0結(jié)尾而已。
現(xiàn)在搜索一下的話,已經(jīng)可以看到SEOMoz的這個Web2.0獎網(wǎng)頁已經(jīng)重新被收錄了:
第一,這種細(xì)節(jié)問題,不碰到還真想象不到。
第二,認(rèn)識人好辦事。
第三,Google經(jīng)常也從善如流。
來源:seo每天一貼 Zac 昝輝