千家信息网

Python如何实现推送百度链接

发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,这篇文章将为大家详细讲解有关Python如何实现推送百度链接,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。通过代码实现抓取个人博客中某一页指定文章链接,并批量将该链
千家信息网最后更新 2024年11月22日Python如何实现推送百度链接

这篇文章将为大家详细讲解有关Python如何实现推送百度链接,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

通过代码实现抓取个人博客中某一页指定文章链接,并批量将该链接推送到百度站长平台,起到快速收录的目的。

import sysimport requestsfrom bs4 import BeautifulSoup# 推送百度爬虫def push_page(url):    headers = {        'User-Agent': 'curl/7.12.1',        'Host': 'data.zz.baidu.com',        'Content-Type': 'text/plain',        'Content-Length': '83'    }    urls = "http://data.zz.baidu.com/urls?site=https://www.lyshark.com&token=xxxxxxx"    try:        html = requests.post(urls, headers=headers, data=url, timeout=5).text        push_status = eval(html)['success']        if push_status == 1:            return 1        else:            return 0    except:        return 0# 获取路径def get_page(page):    html = requests.get(page,timeout=5).text    try:        bs = BeautifulSoup(html,"html.parser")        ret = bs.select('div[class="container"] div[class="row"] h3[class="post-title"] a')        for item in ret:            push_url = item.get('href')            push_ref = push_page(push_url)            print("推送: {} --> 状态: {}".format(push_url,push_ref))        return 1    except:        return 0if __name__ == "__main__":    arg = sys.argv    get_page(arg[1])

补充

百度目前提供自动提交链接和手动提交链接两种方式,其中自动提交又分为主动推送、自动推送和sitemap三种形式,按百度的说法,主动推送的效果最好,百度站长平台后台也提供了curl、php、ruby的推送示例代码但没有提供python代码,网上很少有现成的python版本主动推送代码(仅有的也有点小问题,需要修改一下),现将目前我正在使用的主动推送python代码贴出。

#encoding:utf-8import httplibdef tuisong():    filecontents = open( "urls.txt", "r" ).read()                 //urls.txt为需要推送的URL文件,每行一个    url = "/urls?site=域名(不带http)&token=令牌(在自己的百度站长平台后台可以看到)"    conn = httplib.HTTPConnection('data.zz.baidu.com')    conn.request(method="POST", url=url, body=filecontents)    response = conn.getresponse()    baiduresult = response.read()    conn.close()    return baiduresult if __name__=="__main__":    ts=tuisong()    print ts

推送后会返回相关的代码!

下面是我用的requests实现的,更简洁:

import requestsdef tuisong(self):               url = "/urls?site=域名(不带http)&token=令牌(在自己的百度站长平台后台可以看到)"                filecontents = {'file': open('urls.txt', 'rb')}  #urls.txt为需要推送的URL文件,每行一个                r=requests.post("http://data.zz.baidu.com"+url, files=filecontents)        baiduresult ="推送成功,结果为%s \n" %(r.text)               return baiduresult        if __name__=="__main__":    ts=tuisong()    print(ts)

关于"Python如何实现推送百度链接"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。

0