頭條搜索站長平臺-sitemapindex文件要求
sitemapindex文件根節點必須是<sitemapindex>。
sitemapindex文件編碼必須為UTF-8,第一行為: <?xml version="1.0" encoding="utf-8" ?>。
sitemapindex文件禁止使用命名空間,禁止使用規定之外的屬性。
sitemapindex文件大小不得超過5M,sitemap節點數量不超過1W。
必須保證sitemap中所有URL可訪問,且內容符合XML數據文件規范。
1.XML數據文件規范
數據XML文件的根節點必須為<DOCUMENT>
數據XML文件編碼必須為UTF-8,第一行為: <?xml version="1.0" encoding="utf-8" ?>
數據XML文件禁止使用命名空間,禁止使用規定之外的屬性。
數據XML單個文件大小不得超過10M(必須滿足),item數目不得超過1W。
除根節點之外的其它節點,標簽名建議采用英文小寫字母及下劃線‘_’
數據節點中包含轉義字符,請使用CDATA
對于數組型的節點,請在只有一個子節點時保證和多個節點時的結構相同
2.Txt格式規范
Txt文件編碼必須為UTF-8
Txt文件大小不得超過10M,每個文本文件最多可包含5w個網址
Txt文件每行都必須有一個網址,網址中不能有換行
Txt文件中不能包含網址列表以外的任何信息
- 必須書寫完整的網址,包含http/https
- 必須保證Txt文件中所有URL 可訪問,且內容符合Txt數據規范
注意事項
提交的sitemap有作弊嫌疑的url,頭條將進行嚴厲的處罰措施并取消相關權限
頭條spider有自身的爬取規則,sitemap只是幫助頭條spider更好的收錄您的網站,提交sitemap并不會決定網站收錄或者排名。
來源:頭條搜索站長平臺