Sitemap文件標準格式和大小說明
1、格式:
您可以采用如下三種格式的文件向360搜索提交Sitemap,文件編碼可以是UTF-8或GBK:
1)標準的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同時包含多個Sitemap文件)
2、大小:
1)單個Sitemap文件:大小不超過10MB,且包含不超過50000個網址。如果網站所包含的網址超過50,000個,則可將列表分割成多個Sitemap文件,放在Sitemap索引中。
2)單個Sitemap索引文件:大小不能超過500M,如果超過請提交多個Sitemap索引文件接口。
各格式樣式參見以下說明:
1、XML格式Sitemap說明
1) XML格式舉例
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<urlset>
<!--必填-->
<url>
<!--必填,定義某一個鏈接的入口,每一條數據必須要用<url>和</url>來標示 -->
<loc>http://www.xxxxxx.html/000000.html</loc>
<!--必填,URL長度限制在256字節內-->
<lastmod>2012-12-01</lastmod>
<!--更新時間標簽,非必填,用來表示最后更新時間-->
<changefreq>daily</changefreq>
<!--更新頻率標簽,非必填,用來告知引擎頁面的更新頻率 -->
<priority>0.8</priority>
<!--優先權標簽,優先權值0.0-1.0,用來告知引擎該條url的優先級-->
</url>
<url>
<loc>http://www.xxxxxx.html/000001.html</loc>
<lastmod>2012-12-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
2) XML標簽說明
標簽名稱 | 屬性 | 標簽說明 | 標簽類型 | 標簽限制 | 可選/必選 |
changefreq | / | 標示數據更新頻率 | 字符串 | 有效值為:always、hourly、daily、weekly、monthly、yearly、never | 可選 |
lastmod | / | 標示數據最新一次更新時間 | 日期 | 時間格式為yyyy-mm-dd | 可選 |
loc | / | 標示該條數據的存放地址 | url | 最小長度1個字符最大長度256個字符以"http://"開頭 | 必選 |
priority | / | 標示優先值 | 小數 | [0.0 1.0](大于等于0小于等于1,保留一位小數)例如:< priority >0.8< priority > | 可選 |
url | / | url地址的開始和結束 | / | 最多出現無限次 | 必選 |
urlset | / | urlset用來標記整個文檔的開頭 | / | / | 必選 |
2、文本格式Sitemap說明
文本格式文件每一行寫入一個網址,除此之外不包含其他信息。網址必須完整,網址中不能有換行,且包括協議頭(http://)
3、使用Sitemap索引文件(對多個Sitemap文件)說明
1) 索引Sitemap舉例
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex>
<sitemap>
<loc>http://www.example.com/1.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/2.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
</sitemapindex>
2) Sitemap索引文件標簽說明:
屬性 | 是否必填項 | 說明 |
<loc> </loc> | 是 | Sitemap位置標簽,標示sitemap地址位置 |
<lastmod> </lastmod> | 可填 | Sitemap修改時間標簽,標示最新修改時間 |
<sitemap> </sitemap> | 是 | Sitemap信息說明,標示某個sitemep的信息 |
<sitemapindex></sitemapindex> | 是 | 標示索引文件中所有sitemap的信息 |