千家信息网

用R语言怎么画小提琴图

发表于:2024-11-26 作者:千家信息网编辑
千家信息网最后更新 2024年11月26日,本篇内容介绍了"用R语言怎么画小提琴图"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!数据已经存储到了
千家信息网最后更新 2024年11月26日用R语言怎么画小提琴图

本篇内容介绍了"用R语言怎么画小提琴图"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

数据已经存储到了文件里 首先是读取数据
library(readr)
df<-read_tsv("author_number.tsv")
head(df)
image.png
期刊分别是
table(df$journal)
image.png
首先通过summary()函数看一些数据的基本情况
summary(df)
image.png

作者数量最多的竟然有446人,中位数是6个人,符合日常认知

我们看一下400多个作者的论文是什么?


library(dplyr)

df%>%
filter(auth_num == 446) -> df1

df1$id
image.png
image.png

这个应该是采集了很多人的数据,可能是把参与实验的所有人全都列成作者了

接下来就是小提琴图展示每个期刊作者数量的分布了

用原始数据作图代码和结果如下

ggplot(df, aes(x=journal, y=auth_num, fill=journal)) +
geom_violin(scale="width") +
geom_boxplot(width=.12,
fill=I("black"),
notch=T,
outlier.size=NA,
col="grey40") +
stat_summary(fun="median",
geom="point", shape=20, col="white") +
#scale_y_log10(breaks=c(1:5, seq(10, 50, by=10), 100, 200, 300)) +
coord_flip() + labs(x="", y="Number of authors per paper") +
theme_classic() + theme(legend.position="none") +
scale_fill_brewer()
image.png

这个结果不太好看,所有作者对原始数据做了log10转化

ggplot(df, aes(x=journal, y=auth_num, fill=journal)) +
geom_violin(scale="width") +
geom_boxplot(width=.12,
fill=I("black"),
notch=T,
outlier.size=NA,
col="grey40") +
stat_summary(fun="median",
geom="point", shape=20, col="white") +
scale_y_log10(breaks=c(1:5, seq(10, 50, by=10), 100, 200, 300)) +
coord_flip() + labs(x="", y="Number of authors per paper") +
theme_classic() + theme(legend.position="none") +
scale_fill_brewer()
image.png

log10转换 是一种比较好的方案当数据有明显的离群值的时候

这次新学到的知识点包括

lappy()函数指定参数

lapply(files_all,
read_tsv,
col_type= list(
col_character(),
col_character(),
col_character(),
col_character())) %>%
bind_rows -> data_all

统计字符串中指定字符的数量

library(stringr)
str_count("A,B,C",pattern=",")

"用R语言怎么画小提琴图"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

数据 作者 小提琴 数量 知识 语言 原始 接下来 内容 函数 字符 情况 更多 期刊 结果 好看 实用 明显 学有所成 中位数 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 惠州酷友网络技术有限公司 庆祝国庆节网络安全教育 并发请求同一行数据库 做财务用什么软件开发 数据库大作业 为什么服务器不能连接战舰世界 sql数据库自动生成编号 xp数据库关闭 网络安全保卫大队传唤 cdb文件是什么数据库 unix远程服务器操作命令 会网络技术怎样赚钱 长宁区信息化数据库系统销售商家 计算机应用技术和网络技术的区别 思科网中网络技术答案 网络安全宣传主题班会动态 福建润商网络技术有限公司邮编 医院网络安全保障机制 无效的目标服务器或文件夹路径 打发票时提示服务器无法创建对象 华为软件开发云公司大连 sql数据库中的两个表的记录 网络安全 方向律师 其他基础软件开发服务 为什么要做数据库开发 数据库 20%表示 网络安全手抄报美丽又简单字又少 网络安全形势政策报告 进口网络视频服务器厂家 ntp服务器没影响什么意思
0