百度搜索算法規范詳解-1.頁面內容質量
- 威海百度搜索引擎算法 威海百度搜索算法規范詳解
- 1546
1.頁面內容質量
1.1 颶風算法 3.0 ——針對頁面內容質量問題
百度搜索于2017年7月4日發布颶風算法,嚴厲打擊惡劣采集問題,在2018年9月13日公布颶風算法升級為2.0版本,在2019年8月對颶風算法進行升級,上線颶風算法3.0。
颶風算法主要針對以下頁面內容質量問題:
1.1.1 惡劣采集行為:
(1)存在大量從其他站點、智能小程序或公眾號等內容生產方采集、搬運而來的內容,信息未經整合,排版混亂,文章可讀性差,有明顯采集痕跡,對用戶無任何增益價值。
問題示例1:文章有明顯采集痕跡
(2)存在多段文章拼接的內容,文章邏輯性差,無法滿足用戶需求,閱讀體驗差。
問題示例2:文章內容邏輯性差,閱讀體驗差
(3)站點或智能小程序內存在大量采集內容,自身內容生產力極差。
1.1.2 跨領域采集問題:
指站點/智能小程序為了獲取更多流量,發布不屬于站點/智能小程序領域范圍的內容,通常這些內容采集自互聯網,內容質量及相關性低、對搜索用戶價值低。對于這樣的行為搜索會判定該站點/智能小程序的領域專注度不足,會有不同程度的限制展現。
跨領域采集主要包括下面兩類問題:
第一類:主站或主頁的內容/標題/關鍵詞/摘要等信息顯示該站有明確的領域或行業,但發布內容與該領域不相關,或相關性較低。
問題示例:美食類智能小程序發布足球相關內容
第二類:站點/智能小程序沒有明確的領域或行業,內容涉及多個領域或行業,領域模糊、領域專注度低。
問題示例:智能小程序內容涉及多個領域
1.1.3 站群問題:
指批量構造多個站點/智能小程序,獲取搜索流量的行為。站群中的站點/智能小程序大多質量低、資源稀缺性低、內容相似度高、甚至復用相同模板,難以滿足搜索用戶的需求。
問題示例:多個智能小程序復用同一模板,內容質量低、相似度高
關于颶風算法的更多信息請參考:
2019.8.22 【官方說法】颶風算法3.0解讀
2019.8.8 颶風算法3.0即將上線,控制跨領域采集及站群問題
2018.9.20 【官方說法】颶風算法2.0解讀
2018.9.13 百度搜索將推出颶風算法2.0,嚴厲打擊惡劣采集行為
2017.7.4 百度推出颶風算法,嚴厲打擊惡劣采集
1.2 勁風算法 ——針對惡劣聚合頁問題
2020年2月,百度搜索技術團隊發現,部分網站及智能小程序通過惡意構造聚合頁面內容來獲取搜索排名,獲得搜索用戶關注,上線勁風算法,控制惡意構造聚合頁的問題對搜索用戶的影響。
聚合頁,是指頁面并無文章主體內容,而是多個頁面的索引鏈接圍繞在特定主題下的信息整合頁。
惡劣聚合頁問題主要包括以下四種類型:
(1)頁面內容與站點本身所屬領域不符,或站點無專注領域,多為采集拼湊內容。
問題示例1:站點內容領域分散
(2)頁面內容與標題及頁面中標記的標簽不符。
問題示例2:頁面內容與標題不符
(3)由網站搜索功能生成的靜態搜索結果頁。
問題示例3:靜態搜索結果頁
(4)空短、無有效信息、失效的聚合頁。
問題示例4:無有效信息的聚合頁
關于勁風算法的更多信息請參考:
2020.3.5 【官方解讀】勁風算法官方解讀
2020.2.27 勁風算法即將上線
1.3 細雨算法2.0 ——針對B2B領域低質問題
2018年6月,百度搜索發布細雨算法,針對B2B行業的網站受益問題進行規范和引導。
2019年11月,百度搜索發布細雨算法2.0,針對B2B行業的惡劣違規問題及低質內容。
細雨算法主要針對以下問題:
1.3.1 頁面標題作弊及誤導:
(1)非公司官網,title中包含“官網”等字樣,誤導搜索用戶認為是官網
問題示例4:
(2)頁面title中堆砌相近關鍵詞;
問題示例5:
(3)頁面title中穿插火星文字或者特殊符號,影響正常閱讀;
問題示例6:
(4) 頁面title中穿插受益方式。
問題示例7:
1.3.2 頁面正文內容中存在受益信息:
(1)正文內容不完整,頻繁穿插變形的受益方式。
具體是指:正文內容為無價值內容的拼接或者正文內容不完整,同時采用“英文字母”、“漢字諧音”、“特殊符合”、“全角符合”等方式代替聯系方式,穿插在正文內容中。
舉例:5992八⑧⑧⑧
舉例:13800138000
問題示例8:
(2)文章的配圖圖片中存在受益聯系方式。
具體是指:圖片中聯系方式水印面積較大,嚴重損害瀏覽體驗。
問題示例9:
(3)正文中商品或者服務信息內容為亂采集、拼接而成、排版混亂、用戶從頁面中無法獲得商品或者服務信息。
問題示例10:
1.3.3 惡劣違規內容:
(1)頁面內容惡劣采集。
如:拼接內容、純采集內容、跨領域采集內容等。
問題示例:B2B領域小程序采集時事新聞
(2)發布軟文信息。
問題示例:利用小程序頁面發布軟文,頁面標題是“垃圾車廠家哪家好“,內容是品牌軟文,對用戶產生誤導
(3)發布無法滿足用戶需求的空白頁面,對用戶完全無價值。
問題示例:該小程序頁面為空白頁面
(4)商品信息有誤。
如:商品詳情、價格等與實際情況不符
問題示例:商品價格與實際情況不符
(5)功能不可用。
如:交易、聯系電話、查看詳情等交互功能不可用等情況。
1.3.4 低質內容:
1、圖片內容低質。
如:圖片內容與文字描述不一致、圖片嵌入電話號碼、圖片質量極低影響閱讀體驗等。
問題示例:圖片中大量嵌入聯系電話
2、頁面內容低質。
如:頁面中只有圖片無有效信息,或信息提供不完善等情況。
問題示例:網站僅有圖片作為展示,沒有文字說明
關于細雨算法2.0的更多信息請參考:
2019.11.15 【官方說法】細雨算法2.0解讀
2019.11.7 針對B2B領域低質內容,細雨算法即將升級
2018.7.5 【官方說法】B2B領域細雨算法解讀
2018.6.28 百度搜索推出細雨算法 促進供求黃頁類站點生態健康發展
1.4 藍天算法 ——針對目錄交易問題
2016年11月,百度搜索推出藍天算法,持續打擊新聞類站點售賣軟文、目錄的行為,還用戶一片搜索藍天。被“藍天算法”所覆蓋的站點將會被降低其在百度搜索系統中的評價。
問題示例11:
關于藍天算法的更多信息請參考:
2016.11.21 百度推出藍天算法,嚴厲打擊新聞類站點售賣目錄
目錄
1. 頁面內容質量
2. 用戶需求滿足
3. 用戶體驗友好
4. 搜索公正及用戶安全
來源:百度搜索資源平臺 百度搜索學堂