|
什么是Sitemap协议
Sitemap 是一种站点地图协议。加入了Sitemap文件的网站将更有利于搜索引擎网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度. 用户通过提交Sitemap将明确告知搜索引擎,希望自己网站的哪些页面被收录。(下载Sitemap协议规范) Sitemap说明
- Sitemap文件采用.xml格式
- Sitemap文件必须使用utf-8编码
- 可以采用gzip(.gz)格式来压缩Sitemap文件
- Sitemap文件未压缩前不能大于2MB
- 一个Sitemap文件中包含的Url不能超过50000个
- Sitemap中Url的优先权的值是一个表示当前站点中Url重要程序的相对值
- Sitemap中Url的优先仅的缺省值是0.5
- Sitemap中的Url必须是xml安全的(URL's must be XML Safe (use XMLFormat())
标签
| 是否必须
| 说明
| <urlset>
| 是
| Sitemap文件最顶层的标签,Sitemap文件中的其它标签都必须包含在该标签内部
| <url>
| 是
| 每一条记录的父标签,下面的其它标签都得包含在该标签内部
| <loc>
| 是
| 页面Url, 长度不能超过2048
| <lastmod>
| 否
| 页面最后的更新时间,时间格式参见ISO 8601,通常使用YYYY-MM-DD格式
| <changefreq >
| 否
| 页面更新频率,取值为:always, hourly, daily, weekly, monthly, yearly, never。
这里需要注意:
always表示页面在每次被访问到时就更新
never表示当前Url的是一个目录
| <priority>
| 否
| 当前Url的相对优先权,这个优先权是相对于当前Sitemap中其它Url而言的
| Sitemap举例 [size=100%]<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://example.com/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://example2.com/</loc>
<lastmod>2006-11-19</lastmod>
<changefreq>daily</changefreq>
<priority>0.9</priority>
</url>
</urlset>
Sitemap索引说明
一个站点可以有多个Sitemap文件,对于多个Sitemap的站点,需要一个名为sitemap_index.xml的索引文件来指定各个Sitemap文件的位置。 关于Sitemap Index需要注意:
- Sitemap Index名字必须为sitemap_index.xml
- Sitemap Index文件必须使用utf-8编码
- Sitemap Index中包含的Sitemap数不能超过50000个
- Sitemap Index压缩前的大小不能超过2MB
标签
| 是否必须
| 说明
| <sitemapindex>
| 是
| Sitemap Index文件最顶层的标签,Sitemap Index文件中的其它标签都必须包含在该标签内部
| <sitemap>
| 是
| 每一条记录的父标签,下面的其它标签都得包含在该标签内部
| <loc>
| 是
| 用来指定某一个Sitemap文件位置的Url, 长度不能超过2048
| <lastmod>
| 否
| 该Sitemap文件最后的更新时间,时间格式参见ISO 8601,通常使用YYYY-MM-DD格式
| Sitemap索引举例 [size=100%]<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
入口:http://open.soso.com/datacoop/sitemap/
|
|