千家信息网

如何用R对连续数据做描述统计

发表于:2025-01-29 作者:千家信息网编辑
千家信息网最后更新 2025年01月29日,这篇文章将为大家详细讲解有关如何用R对连续数据做描述统计,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。用R做基本描述统计,可选的函数很多,反而显得不那
千家信息网最后更新 2025年01月29日如何用R对连续数据做描述统计

这篇文章将为大家详细讲解有关如何用R对连续数据做描述统计,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

用R做基本描述统计,可选的函数很多,反而显得不那么直接。挑选着学习几个好用的能满足日常分析需求即可。

函数使用


自带summary()
pastecs包stat.desc()

案例数据

employee雇员数据,下载数据自由练习。


练习1

对整个数据集进行描述统计。

         summary(employee)

结果:


显然这并不是我们想要的,一些分类变量并不适合用summary函数。

练习2

指定单一变量做描述统计

         summary(employee["salary"])

结果:


练习3

指定多个变量做描述统计

         summary(employee[c("salary","salbegin")])

结果:


练习4

指定多个变量做描述统计

         stat.desc(employee[c("salbegin","salary")],norm = T)

结果:


stat.desc()函数使用格式为:
stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)


其中的x是一个数据框或时间序列。

若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(默认值),则计算中位数、平均数、平均数的标准误、平均数95%的置信区间、方差、标准差以及变异系数。若norm=F(默认值),则不返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro-Wilk正态检验结果。

关于如何用R对连续数据做描述统计就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

0