搜索問答劇場 【六】“死鏈”常見問題解析
哈嘍大家好,
最近平小雕在觀察和學習時,
發現很多開發者都提出了死鏈方面的問題。
這不我(平小雕)和胡小魚立馬聯手找出了大家對死鏈的種種疑問,并做出了解答,大家快來看看怎么解決死鏈常見問題吧!
第六集【搜索問答劇場】,讓我們圍觀網站運營中出現的死鏈相關問題,學習如何快速處理網站死鏈吧!
一、了解死鏈
1、死鏈都有哪些類型?
A:死鏈一般是指頁面已經無效,無法對用戶提供任何有價值信息的頁面。包括協議死鏈和內容死鏈。
(1)協議死鏈:頁面的TCP協議狀態/HTTP協議狀態明確表示的死鏈,常見的如403、404、503狀態等。
(2)內容死鏈:服務器返回狀態是正常的,但內容已經變更為不存在、已刪除或需要權限等與原內容無關的信息頁面。內容死鏈,服務器端返回HTTP狀態碼200,無法設置為404。
2、Q:死鏈是如何產生的?
A:死鏈可能存在以下來源:
(1)網站內部主動或被動添加了錯誤內容鏈接,發現后需要及時做404處理,如網站被惡意添加大量黃反內容等。
(2)網站服務器、空間或程序問題,導致網站短暫無法訪問,如服務器不穩定。
(3)外部鏈接錯誤,用戶或者站長在站外發布了錯誤URL。
(4)爬蟲提取不完整的URL,個別爬蟲在提取頁面URL時,因為URL中有不規則字符,或者URL與后邊的文字鏈接起來,導致URL失效。
(5)網站改版,網站改版后,之前的老域名頁面直接刪除,導致了大量的死鏈接。
3、Q:為什么要及時處理死鏈 ?不處理是否有影響?
A:(1)死鏈是頁面無效,不能給瀏覽用戶提供任何價值,但增加網站的管理成本。
(2)當網站死鏈數據累積過多時,且被展示到搜索結果頁中時,對網站本身的訪問體驗和造成負面影響。
(3)百度蜘蛛會定期檢測網站頁面內容價值,若存在大量死鏈,可能會影響網站整體評價,從而不能更好的進行網站抓取和展現。
4、Q:如何發現網站中存在的死鏈接?
A:(1)搜索資源平臺工具:抓取異常工具可以查看最近產生的死鏈,且支持導出功能。
(2)參考爬蟲軟件:此類工具可以爬取全站所有鏈接并分析頁面狀態,分析完成后,支持導出功能,提取死鏈接即可。
二、教你如何處理死鏈頁面
1、Q:如何有效處理死鏈?
A:死鏈資源的更新,不同網站可能會存在不同周期。為保障及時更新死鏈,可以通過資源平臺-【死鏈提交】工具,進行提交。
2、Q:如何使用平臺工具處理死鏈?
A:使用【死鏈提交】工具有效的提交死鏈,需要以下步驟:
第一步:處理的頁面設置404頁面
將需處理的頁面設置404頁面,生成死鏈文件整理被黑、無效等需要被刪除的資源,頁面設置404,一定是404頁面。
將需提交的404頁面列表制作成一個待提交的文件,制作方法請參閱幫助文檔:
(與sitemap格式及制作方法一致)
第二步:將文件放置在網站根目錄下
將死鏈文件放置在網站根目錄下,比如您的網站為example.com,您已制作了一個silian_ example.xml死鏈文件,則將silian_example.xml上傳至網站根目錄即example.com/silian_ example.xml。
第三步:登錄百度搜索資源平臺
登錄搜索資源平臺,找到【死鏈提交】工具。(若未站點驗證,需要先完成站點驗證,之后使用工具提交文件)。
第四步:提交死鏈數據
(1)【資源提交】-【死鏈提交】工具中提交死鏈文件。
(2)提交完成后,關注死鏈文件處理狀態。
三、使用【死鏈提交】工具的注意事項
1、【死鏈提交】工具可以識別403、500等無效數據嗎?
A:不可以,【死鏈提交】工具僅識別404,請一定設置為404;若存在非404資源,可能會影響整個文件生效情況。
注:請勿使用該工具提交非死鏈內容,避免影響正常頁面的搜索展現效果。
2、【死鏈提交】工具是否可以刪除目錄下所有鏈接(如:*.a.example.com)?
A:不支持目錄級提交,只能提交具體需要刪除的鏈接 。
3、工具支持索引型sitemap文件嗎?
A:不支持,請勿提交索引型文件。
4、提交數據的生效周期是什么?
A:死鏈提交后一般生效周期為1-2周。
來源:百度搜索資源平臺