您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

保存到本地

共抓取:0条网址, 未登录的情况下只能获取1000条,如需获取更多,请先登录或者联系站长


    什么是Sitemap

    Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。
    百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。
    此外,Sitemap 与搜索排名没有关系。
    百度Sitemap支持哪些格式
    百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:
    1.第一种格式样例:txt文本格式
    在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交
    http://www.example.com/repaste/101562698_5230191316.html
    http://www.example.com/repaste/101586283_5230215075.html
    http://www.example.com/repaste/101639435_5230310576.html
    此文本文件需要遵循以下指南:
    · 文本文件每行都必须有一个网址。网址中不能有换行。
    · 不应包含网址列表以外的任何信息。
    · 您必须书写完整的网址,包括 http。
    · 每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
    · 文本文件需使用 UTF-8 编码或GBK编码。
    2.第二种格式样例:xml格式
    单个xml数据格式如下:

    单个xml数据格式如下:
    <?xml version="1.0" encoding="utf-8"?>
    <!-- XML文件需以utf-8编码-->
    <urlset>
    <!--必填标签-->
        <url>
            <!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->
            <loc>http://www.yoursite.com/yoursite.html</loc>
            <!--必填,URL链接地址,长度不得超过256字节-->
            <lastmod>2009-12-14</lastmod>
            <!--可以不提交该标签,用来指定该链接的最后更新时间-->
            <changefreq>daily</changefreq>
            <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->
            <priority>0.8</priority>
            <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->
        </url>
        <url>
            <loc>http://www.yoursite.com/yoursite2.html</loc>
            <lastmod>2010-05-01</lastmod>
            <changefreq>daily</changefreq>
            <priority>0.8</priority>
        </url>
    </urlset>
    上述Sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html 

    上述Sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html
    若有多条url,按照上述格式重复之间的片断,列明所有url地址,打包到一个xml文件,向搜索资源平台进行提交。
    创建Sitemap时有哪些注意事项?
    第一,一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
    第二,一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。
    第三,如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。
    第四,搜索资源平台sitemap文件提交已不再支持索引型文件形式,历史提交的索引型文件已不再进行抓取,建议站长及时删除,重新进行资源提交。
    如何提交Sitemap
    第一步,将需提交的网页列表制作成一个Sitemap文件,文件格式请阅读百度Sitemap协议都支持哪些格式。
    第二步,将Sitemap文件放置在网站目录下。比如您的网站为example.com,您已制作了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml
    第三步,登录百度搜索资源平台,确保提交Sitemap数据的网站已验证归属。
    第四步,进入Sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和Sitemap文件地址
    最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。

    联系我
    置顶