加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

R语言数据处理方法~小结

发布时间:2021-01-20 16:24:10 所属栏目:大数据 来源:网络整理
导读:文章目次 1. R自带函数 2. reshape2数据重构 3. dplyr 4. tidyr 5. 字符串处理赏罚 1. R自带函数 1.1 转置 行使函数t()可对一个矩阵或数据框举办转置,对付数据框,行名将酿成变量(列)名。 数列array举办维度转换 aperm 1.2 整合数据aggregate 在R中行使一个或
副问题[/!--empirenews.page--]

文章目次

1. R自带函数

2. reshape2数据重构

3. dplyr

4. tidyr

5. 字符串处理赏罚


1. R自带函数

1.1 转置

行使函数t()可对一个矩阵或数据框举办转置,对付数据框,行名将酿成变量(列)名。

R说话数据处理赏罚要领~小结

数列array举办维度转换 aperm

1.2 整合数据aggregate

在R中行使一个或多个by变量和一个预先界说好的函数来折叠(collapse)数据。挪用名目为:

R说话数据处理赏罚要领~小结

个中x是待折叠的数据工具,by饰一个变量名构成的列表,这些变量将被去掉以新的视察,而FUN则是用来计较表述性统计量的标量函数,它将被用来计较新视察中的值。


by中的变量必需在一个列表中(纵然只有一个变量)。也可以在列表中为各组声明自界说的名称,譬喻by=list(Group.cyl=cyl,Group.gears=gear)。

1.3 apply待清算

1.4 union和intersect

R说话数据处理赏罚要领~小结

1.5 归并 cbind和rbind

纵向归并数据凡是用于向数据框中添加视察。

(1)rbind() :纵向归并两个数据框(数据集)

(2)cbind() :横向归并两个数据框(数据集)

注:两个数据框行(列)数必需沟通。假如x中拥有y中没有的变量,在归并它们之前需做以下处理赏罚:

(1)删除dataframeA中的多余变量;

(2)在dataframeB中建设追加的变量并将其值设为NA(缺失)。

R说话数据处理赏罚要领~小结

1.6 匹共同并 merge

merge结果同dplyr的join,join的效力更高。

(1)inner_join 等价于 merge(all=F)

(2)left_join 等价于 merge(all.x=T,all.y=F)

(3)right_join 等价于 merge(all.x=F,all.y=T)

(4)full_join 等价于 merge(all=T)

R说话数据处理赏罚要领~小结

1.7 解除一再数据 unique

unique 函数可以去掉向量、数据框或相同数列的数据中一再的元素。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读