这是一个wordpress纯PHP代码生成的完整站点地图、免插件生成网站地图的php代码,可以同时生成首页、文章、单页面、分类和标签的sitemap.xml
一、代码如下:
<?php
require('./wp-blog-header.php');
header("Content-type: text/xml");
header('HTTP/1.1 200 OK');
$posts_to_show = 1000;
echo '<?xml version="1.0" encoding="UTF-8"?>';
echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">'
?>
<!-- generated-on=<?php echo get_lastpostdate('blog'); ?> Diy By www.df81.com-->
<url>
<loc><?php echo get_home_url(); ?></loc>
<lastmod><?php $ltime = get_lastpostmodified(GMT);$ltime = gmdate('Y-m-d\TH:i:s+00:00', strtotime($ltime)); echo $ltime; ?></lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<?php
/* 文章页面 */
$myposts = get_posts( "numberposts=" . $posts_to_show );
foreach( $myposts as $post ) { ?>
<url>
<loc><?php the_permalink(); ?></loc>
<lastmod><?php the_time('c') ?></lastmod>
<changefreq>monthly</changefreq>
<priority>0.6</priority>
</url>
<?php } /* 文章循环结束 */ ?>
<?php
/* 单页面 */
$mypages = get_pages();
if(count($mypages) > 0) {
foreach($mypages as $page) { ?>
<url>
<loc><?php echo get_page_link($page->ID); ?></loc>
<lastmod><?php echo str_replace(" ","T",get_page($page->ID)->post_modified); ?>+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
<?php }} /* 单页面循环结束 */ ?>
<?php
/* 博客分类 */
$terms = get_terms('category', 'orderby=name&hide_empty=0' );
$count = count($terms);
if($count > 0){
foreach ($terms as $term) { ?>
<url>
<loc><?php echo get_term_link($term, $term->slug); ?></loc>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<?php }} /* 分类循环结束 */?>
<?php
/* 标签(可选) */
$tags = get_terms("post_tag");
foreach ( $tags as $key => $tag ) {
$link = get_term_link( intval($tag->term_id), "post_tag" );
if ( is_wp_error( $link ) )
return false;
$tags[ $key ]->link = $link;
?>
<url>
<loc><?php echo $link ?></loc>
<changefreq>monthly</changefreq>
<priority>0.4</priority>
</url>
<?php } /* 标签循环结束 */ ?>
</urlset>
将以上代码保存为 sitemap.php,传到网站根目录。手动访问查看效果,如:https://www.df81.com/sitemap.php
二、伪静态
①、Nginx
编辑已存在的 Nginx 伪静态规则,新增如下规则后(平滑)重启 nginx 即可:
rewrite ^/sitemap.xml$ /sitemap.php last;
②、Apache
编辑网站根目录的 .htaccess ,加入如下规则:
RewriteRule ^(sitemap)\.xml$ $1.php
做好伪静态规则后,就可以直接访问 sitemap.xml 看看效果了,比如 https://www.df81.com/sitemap.xml
三、纯静态
实现方法有多种,比如在 Nginx 的 fastcgi 缓存中取消 xml 文件的缓存屏蔽等。
在这里,我就分享一个自己一直在用的最简单的实现方法:Linux 定时任务+wget 定时生成 sitemap.xml
具体实现:将 sitemap.php 放到某个不为人知的目录,然后定时使用 wget 去请求这个文件,并将数据保存为 sitemap.xml 存放到网站根目录就可以了!比如:
#每天在网站根目录生成一个 sitemap.xml diypath 为 sitemap.php 的实际位置 0 1 * * * wget -O /home/wwwroot/www.df81.com/sitemap.xml https://www.df81.com/diypath/sitemap.php >/dev/null 2>&1
如果是启用了 https 的站点,需要加入 --no-check-certificate 的选项,即:
#每天在网站根目录生成一个 sitemap.xml diypath 为 sitemap.php 的实际位置(针对 https 网站) 0 1 * * * wget -O /home/wwwroot/www.df81.com/sitemap.xml --no-check-certificate https://www.df81.com/diypath/sitemap.php >/dev/null 2>&1
Ps:使用这个方法,注意 sitemap.php 里面的 require('./wp-blog-header.php'); 要改成 require('../wp-blog-header.php'); 也就是注意相对位置!
如果实在搞不清楚什么是相对路径,那么就用简单粗暴的方法:将网站根目录的 sitemap.php 重命名为一个只有自己知道的 php 文件,比如 xml.php,然后如下添加任务:
#每天在网站根目录生成一个 sitemap.xml(xml.php 为自己重命名的 php 文件名称) 0 1 * * * wget -O /home/wwwroot/www.df81.com/sitemap.xml https://www.df81.com/xml.php >/dev/null 2>&1
这样一来,就解决了 sitemap.xml 是动态数据问题了!
上一篇: rss格式规范及示例解释