百度智能小程序搜索優化指南(基礎版)-二、開發前必讀內容
2.1 必須了解的搜索知識
搜索是一個復雜的系統,了解一些基礎搜索知識,有助于開發者少走彎路。
百度搜索引擎原理:了解搜索引擎工作原理,可以更好的指導開發者,提高智能小程序和網站的搜索友好性。百度搜索引擎工作原理主要包括資源抓取、頁面分析、建立索引、搜索排序。
1、資源抓取:指百度蜘蛛對開發者主動提交的資源,以及互聯網發布的資源進行抓取和存儲的過程,為搜索結果展現提供了基礎數據支持。
2、頁面分析:對抓取的資源進行信息提取和分析處理,包括TDK參數和頁面正文信息、服務價值等,為精準匹配搜索用戶需求提供參考。
3、建立索引:參考頁面分析情況,建立URL索引、關鍵詞索引關系,同時索引庫分層級存儲,便于不同搜索關鍵詞需求下快速定位資源頁面。
4、搜索排序:結合用戶搜索需求、頁面因素、索引關系(存儲層級),綜合計算得到搜索排序。
百度蜘蛛(UA/IP):智能小程序抓取蜘蛛,即智能小程序UA/IP,開發者要正確識別抓取蜘蛛,確保未針對其進行任何封禁設置,正常訪問返回碼為200,訪問異常時可能會返回404、503等。識別方式參考《輕松兩步,教你快速識別百度蜘蛛》。
robots文件:開發者可通過 robots 文件聲明智能小程序中不想被搜索引擎收錄的部分,如果您的智能小程序高度開放,完全可以不必設置robots文件。智能小程序robots設置參考《robots協議介紹》
索引量與流量:索引量是指智能小程序資源中可以被搜索用戶搜索到的資源量,流量是指智能小程序資源在百度APP內搜索結果中的點擊量。
首先需要澄清,索引量的下降,不一定會帶來流量下降。
因為基于智能小程序資源內容質量和服務價值,百度搜索會對智能小程序資源進行分層管理,內容質量和服務價值越高,層級越高,在搜索中被展現和被用戶點擊的可能性越大,從而獲取更多的搜索流量收益。搜索會定期評估資源情況更新分層,同時對質量差和服務價值低的底層資源進行刪除,因而索引量數據可能會下降,被刪除的該類資源在搜索中被展現和被點擊的可能性很小,所以一般不會影響流量收益。
搜索排序:搜索結果的排序策略一直是嚴格保密的,智能小程序的介入,讓排序策略進一步復雜化。
1、傳統排序原則:時效性、權威性、內容豐富度,以及與用戶需求的相關性匹配度永遠是搜索排序不變的考量因素。
2、優待瀏覽和服務體驗好的智能小程序:由于智能小程序給搜索用戶帶來了瀏覽和服務體驗增益,所以在N個搜索結果得分相近的情況下,搜索會優先展現智能小程序的結果。
3、優待性能穩定的智能小程序:百度搜索非常重視搜索結果的穩定性,H5結果的死鏈問題,智能小程序的白屏、加載失敗等問題嚴重影響用戶體驗,不僅造成用戶流失,更有可能被搜索限制展現。
4、優待用心經營用戶的智能小程序:百度搜索希望搜索用戶可以通過智能小程序獲得更好的服務,同時為智能小程序經營用戶提供了諸多能力,對于認真經營用戶的智能小程序會有更多的傾斜扶持。開發者可參考《智能小程序用戶經營工具大全》
2.2 掌握常用工具
智能小程序開發者掌握以下常用工具,可以更好的輔助智能小程序的開發和資源管理。
2.2.1 代碼檢測工具
預檢測:排查開發代碼問題,提高審核通過率。
檢測包括頁面白屏、控件點擊有效性、圖片加載情況、文字展現異常等體檢檢測,以及是否存在誘導用戶下載APP、誘導用戶關注等內容檢測。工具操作詳情參考《預檢測工具圖文簡介》。
2.2.2 智能小程序資源管理工具
URL適配:提交適配規則,加速資源替換展現。
已有H5站點的開發者,使用該工具提交URL適配規則,將H5站點下資源快速替換為智能小程序資源。工具使用見【3.1.2.1已有H5站點,如何接入自然搜索】
新資源提交:主動提交新資源,加速資源收錄。
無H5站點,或者H5站點收錄不好時,為了便于智能小程序資源的快速收錄,可以使用該工具提交資源。工具使用見【3.1.2.2 無H5站點時,如何接入自然搜索】
資源刪除:刪除無價值資源,降低低質比例。
開發者可通過該工具向百度搜索提交需要刪除的已索引資源,包括死鏈、低質等對搜索用戶無價值的資源。工具使用見【4.2.3開發者自主刪除資源】
2.3 如何搭建智能小程序更友好
智能小程序的搭建過程中,開發者對目錄和path路徑、頁面基礎信息、頁面內容布局等的設置,需要符合一定的操作規范,才能確保對百度搜索的友好性,保障智能小程序資源在百度搜索中的抓取收錄和展現。
2.3.1 設置目錄和path路徑
2.3.1.1 目錄設置
智能小程序資源目錄層級設置,可參考H5網站目錄層級,遵循簡單、清晰的原則,不要將內容全部放在根目錄下,也不要設置過深目錄層級,既能方便開發者管理與維護,也方便百度蜘蛛的快速發現和抓取。
2.3.1.2 path路徑設置
智能小程序接入自然搜索結果時,web化路徑設置需遵循以下規范,否則會影響資源的索引和適配,進而影響智能小程序資源在搜索中的展現:
l web化路徑不能帶有#標記
一般來說,URL當中的#號是一個錨點的標志位,和不帶#的URL表示同一個頁面。不要在web化路徑中夾帶#標記,避免資源適配異常。
l web化路徑的參數不能為一條路徑
web化路徑可以帶參數,但參數本身不可以是一條路徑,不可以是一條URL。以下這三類都是不符合規范的:
xxx.smartapp.cn/parameter_a=/path1/file, xxx.smartapp.cn/parameter=http://xxx.baidu.com/path1/1.html, xxx.smartapp.cn/parameter=xxx.baidu.com/path1/1.html。
如需帶相關參數,務必清晰表述參數名和參數定義,如dir_name=news。
l 智能小程序頁面不允許做第三方跳轉
如果智能小程序頁面存在第三方跳轉,將被判定為低質資源,一般不會被收錄。若智能小程序頁面存在跳轉H5、嵌套H5等情況,需盡快自查整改,并重新提交資源或適配規則。
2.3.2 設置頁面基礎信息
智能小程序被搜索引擎正常收錄的前提是 web 化,web 化后智能小程序將以普通網頁的形式被蜘蛛發現和抓取,頁面基礎信息能提升資源在搜索中的收錄和展現效果,同時,智能小程序資源替換H5資源時,頁面基礎信息相似度校驗是非常重要的部分。所以設置符合規范的頁面基礎信息是至關重要的。
頁面基礎信息主要包括標題(title)、摘要(description)等信息。
2.3.2.1 標題
標題能夠讓用戶快速洞察頁面內容,了解該結果與需求的相關性,通常是用來決定用戶點擊行為的主要信息。所以,使用高質量的頁面標題對頁面來說至關重要。
1. 設置標題的原則:
1) 應確保智能小程序下的每個頁面都有指定的標題,且同一智能小程序的不同頁面應分別使用不同的標題,切勿多頁面標題重復。
2) 頁面標題應準確概括頁面內容,避免使用模糊和不相關的描述。
3) 頁面標題應簡明扼要,避免使用冗長的標題,避免關鍵詞堆砌。
4) 頁面標題的符號使用正確,可以參考百度建議的標題符號用法。
百度搜索建議標題符號用法:
2. 如何制作優質標題
頁面標題的構成,可以概括為“核心詞+修飾詞”格式,修飾詞建議不多于3個。不同頁面類型制作不同的標題形式。
頁面類型
頁面類型說明
建議標題格式
舉例
首頁
首頁是整個網站的入口
站點名/品牌名 - 首頁/官網/slogan
注:此類頁面的核心詞為品牌詞/網站名稱,修飾詞包括“官網“、“官方網站”、“首頁”、“主頁”、“Home”、網站的slogan、站點父品牌詞等。
優酷首頁
淘寶網 - 淘!我喜歡
京東 - 正品低價、品質保障、配送及時、輕松購物!
列表
站點內頻道/列表類頁面
列表/頻道名 - 上級頻道(可省) - 站點名
注:此類頁面的核心詞為列表/頻道方向內容,修飾詞可以是站點名和上級頻道內容,站點名為修飾詞時必須放在最末尾
男士頻道 - 唯品會
優酷財經 - 優酷
主題聚合頁
主體聚合頁是圍繞某一主題各方面屬性聚合而成的內容集合。
“主題 - 屬性1 - 屬性2 - 站點名”
注:此類頁面的核心詞是圍繞的主題,修飾詞可以是主題的屬性、上級頻道內容、站點名,站點名為修飾詞時必須放在最末尾
成都旅游攻略 - 玩法路線 - 自由行攻略 - 攜程旅行
內容頁
內容頁是指具體的內容頁,比如文章詳情頁、商品詳情頁、具體視頻的播放頁等
標題格式:“內容標題 - 列表/頻道名(可省) - 站點名”
注:1、此類頁面的核心詞是內容的主體說明,比如文章的標題、視頻的名稱、商品/店鋪的名稱等,修飾詞可以是上級頻道內容、站點名,站點名為修飾詞時必須放在最末尾
2、內容標題建議一句話表明,不重復表述,重復不超過3次
紅燒肉的做法 - 菜譜 - 香哈網
18號臺風“泰利”生成,或成今年“風王”! - 中國新聞網
3. 標題設置的常見問題
為了方便搜索引擎分析和展示頁面內容,在設置標題時,應區分清楚tag title、real title和page title。 其中tag title是指頁面 <title> 標簽中的標題,對應HTML頁面中的 <head><title></title><head>;real title 是指頁面正文中的標題,即用戶看到的內容標題;page title是指頁面頂部的標題組件,通常為網站名稱。
為了使用戶能正常在搜索結果中看到對應頁面的標題內容,tag title應與real title一致,即<title>標簽中的標題應與頁面正文標題一致。若不一致,則可能會影響該頁面在搜索結果中的展現效果。
以下為幾個badcase及對應修改方式:
1)錯誤設置:
tag title:xx汽車網
real title:后備箱放2箱水果被交警罰款?車主:我要這后備箱有何用?
page title:文章詳情
正確設置:
tag title:后備箱放2箱水果被交警罰款?車主:我要這后備箱有何用?- xx汽車網
(即下圖紅框部分應修改如上)
page title:xx汽車網(也可為當前頻道名稱)
4. 不允許出現的標題
1) 標題內容虛假。指標題和頁面內容不相符,欺騙誘導用戶點擊的情況。
2) 標題重復、堆砌。指通過頁面標題過度重復或堆砌等手段,獲取不正當流量的情況。
2.3.2.2 摘要
1. 摘要設置原則
(1)要求在前150個字符中體現出描述與目標關鍵詞的相關性(注:漢字及中文標點符號等于2個字符,英文字母、英文符號及數字等于1個字符)。目標關鍵詞中最核心的詞匯,必須完整地出現在描述中。
(2)不同頁面的摘要內容不能完全相同。
2. 如何制作優質摘要
(1)首頁頁面摘要,將首頁的標題、關鍵詞和一些特殊欄目的內容融合到里面,寫成簡單的介紹形式,不要只寫關鍵詞。
(2)欄目頁面摘要,將欄目的標題、關鍵字、分類列表名稱,一同寫入description中,寫成介紹形式。
(3)分類頁面摘要,將這個欄目中的主要關鍵字寫入。
注:避免在摘要中重復堆砌關鍵詞。
搜索結果標題和摘要的展現,參考頁面設置的TDK內容,但不保障內容完全一致。搜索結果的標題和摘要展現,一般會結合搜索用戶需求和頁面設置內容綜合評估展現。
2.3.2.3 如何設置操作
由于每個頁面基礎信息和頁面內容強相關,建議先通過 swan.request 請求開發者server,由開發者server返回相關信息,再通過頁面基礎信息的API設置到頁面中。
頁面基礎信息通過 swan.setPageInfo設置。在 web 化環境下,頁面基礎信息會通過 meta 標簽插入頁面 head 中。恰當的頁面基礎信息可以幫助爬蟲更精準的理解頁面內容。
詳細配置方法參考《swan.setPageInfo》接口使用說明。
注:這里的頁面標題與智能小程序頁面 json 配置中設置的navigationBarTitleText不同,navigationBarTitleText僅用于頁面頂部展示,頁面基礎信息中的title不會在頁面中展示,而是在web化的title標簽中。
頁面基礎信息設置的title:
json配置中設置的navigationBarTitleText:
注:如果您按照以上規范設置,搜索結果中依然存在標題和摘要展現異常,影響用戶瀏覽體驗,可以將問題反饋至智能小程序客服。
反饋路徑:【智能小程序開發者平臺】-> 右下角懸浮【客服支持】
2.3.3 設置頁面內容布局
2.3.3.1 發布時間
內容需要有顯著規范的發布時間,在每一篇文章中增加“明顯的”“規范的”發布時間,例如pubdate:2019.08.08 18:08。這有助于您的文章被解析出正確的時間信息,在搜索排序中獲得合理的展現效果。
2.3.3.2 頁面分塊
內容需要有規律的、合理的頁面分塊。在您的內容頁中,應有規律的組織網頁內數據,合理的進行分塊,主體內容不和作者、時間、回復等其他信息混在一起,區域獨立。這有助于百度搜索正確解析頁面內容,避免由于內容混亂影響搜索展現。
一般頁面從上到下,分別是主體內容、廣告區域、相關推薦,彼此之間界限清晰,分布合理。如下圖所示:
目錄
一、為什么百度搜索喜歡智能小程序
二、開發前必讀內容
三、智能小程序資源如何進入搜索
四、如何在自然搜索中刪除智能小程序資源
五、關注智能小程序在搜索中的流量收益
六、智能小程序搜索優化指南十大準則
來源:百度搜索資源平臺 百度搜索學堂