简介说明
- 1. 站长主动向百度搜索推送数据,可缩短爬虫发现网站链接时间,可加快爬虫抓取速度,但无法解决网站内容是否收录问题。
- 2. 百度搜索资源平台为站长提供链接提交通道,但不保证一定能够收录提交的链接。
- 3.通过程序代码方式,将根据自己需要将网站的链接提交给百度蜘蛛。
- 4.本程序代码是将文章的id提取出来,再和单页页面组合成新的数组,提交的时候按20条进行分割,最终提交给百度蜘蛛。
<?php include ( "wp-config.php" ) ; require_once (ABSPATH.'wp-blog-header.php'); global $wpdb; $qianzui = "https://www.jioluo.com/"; //更改为自己的域名 $houzui = ".html";//URL网址链接后缀 $sql="SELECT ID FROM wp_posts WHERE post_type = 'post' AND post_status = 'publish' ORDER BY ID DESC limit 0,195"; $myrows = $wpdb->get_results($sql); foreach ($myrows as $b) { $id=$b->ID; $url=$qianzui.$id.$houzui; $ar[] = $url; } $urls = array( 'https://www.jioluo.com/topics/pm', 'https://www.jioluo.com/topics/cloud', 'https://www.jioluo.com/topics/cloud/domains', 'https://www.jioluo.com/topics/idcnews', 'https://www.jioluo.com/topics/btc', ); //更改为自己的单页面 $num=array_merge_recursive($urls,$ar); $chunk_result = array_chunk($num, 20); foreach ($chunk_result as $a){ $api = 'http://data.zz.baidu.com/urls?site=https://www.jioluo.com/&token=*****'; //这里要替换为自己在百度官方的api地址,如何获取文章有介绍 $ch = curl_init(); $options = array( CURLOPT_URL => $api, CURLOPT_POST => true, CURLOPT_RETURNTRANSFER => true, CURLOPT_POSTFIELDS => implode("\n", $a), CURLOPT_HTTPHEADER => array('Content-Type: text/plain'), ); curl_setopt_array($ch, $options); $result = curl_exec($ch); echo $result; } ?>
将上述代码保存命名为push.php,上传到网站根目录,然后就可以直接访问https://你的域名地址/push.php这个页面来推送给百度蜘蛛了,可以每隔几天访问一次。
参数说明:
1、$sql语句中,limit 0,195这里是提取最近195篇文章,可以根据自己需要调整。
2、$houzui 网址后缀,有些站长可能没有用.html这种方式,比如是https://你的域名地址/1437/这种链接,那么$url=$qianzui.$id.$houzui这段就要修改为$url=$qianzui.$id
3、$urls变量是自定义需要提取的链接地址,可以根据自己需要添加,如果不需要可以删除这部分代码,删除以后后面$chunk_result = array_chunk($num, 20);就需要修改为$chunk_result = array_chunk($ar, 20);
百度蜘蛛主动推送的api获取方式如下图:
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)