怎么用Python进行数据分析
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这篇文章主要讲解了"怎么用Python进行数据分析",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么用Python进行数据分析"吧!评论情感倾向先调用
千家信息网最后更新 2025年02月01日怎么用Python进行数据分析
这篇文章主要讲解了"怎么用Python进行数据分析",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"怎么用Python进行数据分析"吧!
评论情感倾向
先调用百度AI来分析微博和b站的评论情感倾向。
知乎的回答字数过多,做情感分析肯定不准确,就没做分析。
from aip import AipNlp
""" 你的 APPID AK SK """
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY '
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "XXXXXXXX"
""" 调用词法分析 """
response = client.sentimentClassify(text)
# "sentiment":2, //表示情感极性分类结果 0:负向,1:中性,2:正向
# "confidence":0.40, //表示分类的置信度
# "positive_prob":0.73, //表示属于积极类别的概率
# "negative_prob":0.27 //表示属于消极类别的概率
for info in response['items']:
if info ['sentiment'] == 2:
print("正向")
if info ['sentiment'] == 0:
print("负向")
if info['sentiment'] == 1:
print("中性")
print("可信度:",info['confidence'])
print("属于积极类别的概率是:",info['positive_prob'])
print("属于消极类别的概率是:",info['negative_prob'])
需要注意的是,在各个平台评论最多的"奔涌吧,后浪!",在百度AI中是个消极句子,需要特殊处理。
结果如下:
非常明显,b站的弹幕正向居多,而微博的评论负向居多。
词云
通过上文的情感分析,各家平台的用户对于《后浪》的态度各异,他们又是如何评价的呢?
统计评论和回答中的高频词,制作词云看一下吧。
from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator
isCN = 1 # 0:英文分词 1:中文分词
back_coloring_path = '浪花.jpg' # 设置背景图片路径
text_path = 'reviews.txt' # 设置要分析的文本路径
stopwords_path = 'stop_word.txt' # 停用词词表
imgname1 = '词云图.png' # 保存的图片名字1(只按照背景图片形状)
back_coloring = imread(back_coloring_path) # 设置背景图片
wc = WordCloud(#font_path = font_path # 设置字体
font_path='C:\Windows\Fonts\simfang.ttf',
#font_path='hanyiqihei.ttf',
background_color = 'white', # 设置背景颜色
max_words = 3000, # 设置显示的最大词数
mask = back_coloring, # 设置背景图片
max_font_size = 200, # 设置字体最大值
min_font_size = 20, # 设置字体最小值
random_state = 42, # 随机有N种配色方案
width = 2000 , height = 1720 ,margin = 4 )
words = {}
for i in word_counts:
words['{}'.format(i[0])] = i[1]
wc.generate_from_frequencies(words)
# txt_freq例子为 { word1: fre1, word2: fre2, word3: fre3,......, wordn: fren }
plt.figure()
b站
知乎
感谢各位的阅读,以上就是"怎么用Python进行数据分析"的内容了,经过本文的学习后,相信大家对怎么用Python进行数据分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
分析
图片
情感
背景
评论
数据
数据分析
概率
类别
背景图片
字体
学习
最大
中性
倾向
内容
平台
结果
路径
后浪
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
计算机网络技术用什么代表
广东数据库建设数据科学服务
网站建设 数据库
机关公共网络安全自查报告
软件开发工程需求调研
宣传网络安全法作文
邹平仓库库存软件开发
软件开发合同金额
青岛浪潮服务器哪家好
stm32fatfs数据库
电子发票邮件服务器异常怎么办
平台软件开发绩效怎么做
搭建分布式数据库
网络安全法考试报名条件
软件开发入门书籍都有哪些
没有源代码可以维护服务器吗
数据库系统经历几个阶段
大学手机软件开发课程
php项目服务器环境部署
表格与表格连接数据库
托管服务器租用
数据库class
isv软件开发商公司
互联网网络科技招代理
爬虫技术获取微博数据库
混合现实全息会议软件开发
hdfs不是数据库
服务器有个硬盘显示不是raid
通达oa服务器集群
济南互联网金融科技有限公司