千家信息网

怎么编写Python爬虫爬取B站小视频的源码

发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,今天就跟大家聊聊有关怎么编写Python爬虫爬取B站小视频的源码,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。如果要爬取多页的话 在最下方循环
千家信息网最后更新 2024年11月11日怎么编写Python爬虫爬取B站小视频的源码

今天就跟大家聊聊有关怎么编写Python爬虫爬取B站小视频的源码,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

如果要爬取多页的话 在最下方循环中 填写好循环的次数就可以了

项目源码

from fake_useragent import UserAgentimport requestsimport time
ua=UserAgent()

def downloader(url, path): start = time.time() # 开始时间 size = 0 headers = { 'User-Agent':ua.random } response = requests.get(url, headers=headers, stream=True) # stream 属性必须带上 chunk_size = 1024 # 每次下载的数据大小 content_size = int(response.headers['content-length']) # 总大小 if response.status_code == 200: print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024)) # 换算单位 with open(path, 'wb') as file: for data in response.iter_content(chunk_size=chunk_size): file.write(data) size += len(data) # 已下载的文件大小 print('\r' + '[下载进度]:%s%.2f%%' % ('>' * int(size * 50 / content_size), float(size / content_size * 100)), end=" ") end = time.time() # 结束时间 print('\n' + '视频下载完成!用时%.2f秒' % (end - start))


def The_URL(page): URL='http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={}&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc'.format(page) headers={ 'User-Agent':ua.random } sponse=requests.get(URL,headers=headers).json() item=sponse.get('data').get('items') for i in item: ite=i.get('item') #视频标题 Video_name=ite.get('description')
#发布日期 Release_time=ite.get('upload_time_text')
#视频下载地址 Video_download_link=ite.get('video_playurl')
#视频作者 The_name=i.get('user').get('name')
try: print('当前下载的是:%s'%Video_name) downloader(Video_download_link,path='%s.mp4'%Video_name) except Exception as e: print(e.args)
for i in range(0,100): i=i*10+1 The_URL(i)

看完上述内容,你们对怎么编写Python爬虫爬取B站小视频的源码有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

0