百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:
1、第一種格式樣例:txt文本格式
在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺進行提交 ? ?
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html ?
此文本文件需要遵循以下指南:
·?文本文件每行都必須有一個網(wǎng)址。網(wǎng)址中不能有換行。
·?不應包含網(wǎng)址列表以外的任何信息。
·?您必須書寫完整的網(wǎng)址,包括 http。
·?每個文本文件最多可包含 50,000 個網(wǎng)址,并且應小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
·?文本文件需使用 UTF-8 編碼或GBK編碼。 ?
2、第二種格式樣例:xml格式
單個xml數(shù)據(jù)格式如下:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<urlset>
<!--必填標簽-->
? ? <url>
? ? ? ? <!--必填標簽,這是具體某一個鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 -->
? ? ? ? <loc>http://www.yoursite.com/yoursite.html</loc>
? ? ? ? <!--必填,URL鏈接地址,長度不得超過256字節(jié)-->
? ? ? ? <lastmod>2009-12-14</lastmod>
? ? ? ? <!--可以不提交該標簽,用來指定該鏈接的最后更新時間-->
? ? ? ? <changefreq>daily</changefreq>
? ? ? ? <!--可以不提交該標簽,用這個標簽告訴此鏈接可能會出現(xiàn)的更新頻率 -->
? ? ? ? <priority>0.8</priority>
? ? ? ? <!--可以不提交該標簽,用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間-->
? ? </url>
? ? <url>
? ? ? ? <loc>http://www.yoursite.com/yoursite2.html</loc>
? ? ? ? <lastmod>2010-05-01</lastmod>
? ? ? ? <changefreq>daily</changefreq>
? ? ? ? <priority>0.8</priority>
? ? </url>
</urlset>
上述Sitemap向百度提交了一個url:http://www.yoursite.com/yoursite.html?
若有多條url,按照上述格式重復<url></url>之間的片斷,列明所有url地址,打包到一個xml文件,向站長平臺進行提交。
3、第三種格式樣例:Sitemap索引格式
如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然后將該索引文件提交。您無需分別提交每個文件。
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8編碼-->
<sitemapindex>
<!--必填,以 <sitemapindex> 開始標記作為開始,以 </sitemapindex> 結(jié)束標記作為結(jié)束-->
? ? <sitemap>
? ? ? ? <!--必填,以<sitemap>標簽提交一個子sitemap文件-->
? ? ? ? ? ? ?? ? ? ?<loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
? ? ? ? <!--必填,識別sitemap的位置-->
? ? ? ? <lastmod>2009-12-14</lastmod>
? ? ? ? <!--選填,識別相對sitemap文件的修改時間-->
? ? </sitemap>
? ? <!--必填,標簽閉合-->
</sitemapindex>
<!--必填,標簽閉合-->
有多個Sitemap,按上述格式重復<sitemap></sitemap>之間的片斷,列明所有Sitemap地址,向站長平臺進行提交。
閱讀本文的人還可以閱讀: