如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,本篇文章为大家展示了如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。前言耗子喂汁是什么意思什么梗呢?可
千家信息网最后更新 2025年02月01日如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕
本篇文章为大家展示了如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
前言
耗子喂汁是什么意思什么梗呢?可能很多人不知道,这个梗是出自马保国,经常上网的人可能听说过这个名字,而他所说的一些话也被当成了一些梗,比如年轻人不讲武德,闪电五连鞭等等
B站马保国的一段视频中他右眼红肿金句频出,部分经典句式甚至被网友们总结归纳成了"保国体",变成了口头禅,比如"年轻人不讲武德,欺侮我六十九岁的老同志""耗子尾汁"(好自为之)等
那么让我们来看看网友们大都发了啥弹幕
项目目标
爬取B站弹幕,词云图
第一个视频播放量快2000W了,弹幕也有4.8W
每天一遍,快乐源泉,嘿嘿嘿
环境
Python3.6
pycharm
爬虫代码
导入工具
import requestsimport parselimport csvimport time
先按F12,找到弹幕的数据在哪
从列表页中获取详情页的URL地址等数据
for page in range(20,32): time.sleep(1) print('=================正在下载11月{}日弹幕===================================='.format(page)) url = 'https://api.bilibili.com/x/v2/dm/history?type=1&oid=140610898&date=2020-11-{}'.format(page) headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36', "cookie": "__uuid=1896D3F7-4A98-54EB-F7FA-3301CE9EF5F307776infoc; buvid3=B68B2187-4C3E-4466-A896-FBF9B292099B190963infoc; LIVE_BUVID=AUTO4115757254257055; stardustvideo=1; rpdid=|(umu|ulY)JJ0J'ul~l~klRJ); sid=8cq4r229; im_notify_type_65901796=0; laboratory=1-1; DedeUserID=523606542; DedeUserID__ckMd5=909861ec223d26d8; blackside_state=1; CURRENT_FNVAL=80; SESSDATA=a976c0b4%2C1618637313%2C4d792*a1; bili_jct=7f54729ec20660f750661122b80746d2; PVID=1; bp_video_offset_523606542=458111639975213216; CURRENT_QUALITY=16; bfe_id=1e33d9ad1cb29251013800c68af42315" } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding selector = parsel.Selector(response.text) data = selector.css('d::text').getall() for i in data: print(i) with open('B站弹幕.csv', mode='a', newline='', encoding='utf-8-sig') as f: writer = csv.writer(f) links = [] links.append(i) writer.writerow(links)
词云代码
import jiebaimport wordcloudimport imageio# 读取文件内容f = open('csv文件地址', encoding='utf-8')txt = f.read()# print(txt)# jiabe 分词 分割词汇txt_list = jieba.lcut(txt)string = ' '.join(txt_list)# 词云图设置wc = wordcloud.WordCloud( width=800, # 图片的宽 height=500, # 图片的高 background_color='white', # 图片背景颜色 font_path='msyh.ttc', # 词云字体 # mask=py, # 所使用的词云图片 scale=15,)# 给词云输入文字wc.generate(string)# 词云图保存图片地址wc.to_file('\\1.png')
上述内容就是如何让Python爬取B站耗子尾汁、不讲武德出处的视频弹幕,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
图片
耗子
视频
讲武
云图
内容
地址
出处
年轻
代码
年轻人
技能
数据
文件
知识
网友
保国
简明
人不知
好自为之
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
珠海仿真软件开发
php备份数据库
诊断数据库位置不存在
嵌入式软件开发相关比赛
广场舞网络安全不烦恼
数据库查询文本框内容并复制
珠海服务软件开发收费
电力系统网络安全到岗到位
广州运维管理软件开发中心
郎溪库存软件开发服务耗材
教育软件开发及应用
数据库大量订单优化
专业模具制造管理软件开发
软件开发9 年经验
数据库10g安装黑框没了
架设外网服务器
数据库顾客信息系统
镇海游戏软件开发流程
苹果系统用什么软件开发的
论文参考文献数据库的顺序
php备份数据库
万国觉醒不同服务器可以互通吗
服务器运行维护和资源管理
湖北挑水郎网络技术
数据库构建架构数
千年 楼兰服务器
网络安全观后感八百字
王者荣耀服务器前100
香港凤凰网络技术有限公司
创魔181服务器温凉访云