加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

R语言数据处理方法~小结

发布时间:2021-01-20 16:24:10 所属栏目:大数据 来源:网络整理
导读:文章目次 1. R自带函数 2. reshape2数据重构 3. dplyr 4. tidyr 5. 字符串处理赏罚 1. R自带函数 1.1 转置 行使函数t()可对一个矩阵或数据框举办转置,对付数据框,行名将酿成变量(列)名。 数列array举办维度转换 aperm 1.2 整合数据aggregate 在R中行使一个或

R说话数据处理赏罚要领~小结

2. reshape2包

起首将数据“融合”(melt),以使每一行都是一个独一的标识符-变量组合。然后将数据“重铸”(cast),可以行使任何函数对数据举办整合成想要的任何外形。

注:reshape包的重铸函数为cast(),reshape2包的重铸函数为dcast()和acast()

R说话数据处理赏罚要领~小结

2.1融合-melt

数据集的融合是将它重构为这样一种名目:每个丈量变量独有一行,行中带有要独一确定这个丈量所需的标识符变量。

R说话数据处理赏罚要领~小结

2.2重铸-dcast和acast

Use?acast?or?dcast?depending on whether you want vector/matrix/array output or data frame output. Data frames can have at most two dimensions.

1.dcast——返回的功效是一个数据框

2.acast——返回的功效可所以向量、矩阵可能数组

挪用名目为:

R说话数据处理赏罚要领~小结

md为已融合的数据,formula描写想要的功效,是(可选的)数据整合函数。
接管的公式形如:

R说话数据处理赏罚要领~小结

在这个公式中,rowvar1 + rowvar2 + ...?界说了要划掉的变量荟萃,以确定各行的内容,而colvar1 + colvar2 + ...?则界说了要划掉的、确定各列内容的变量荟萃。


3. dplyr

3.1 根基操纵

3.1.1 数据范例

将过长过大的数据集转换为表现更友爱的 tbl_df 范例

R说话数据处理赏罚要领~小结

3.1.2 筛选filter

按给定的逻辑判定筛选出切合要求的子数据集,相同于 base::subset() 函数

R说话数据处理赏罚要领~小结

用R自带函数实现:

R说话数据处理赏罚要领~小结

除了代码简捷外,还支持对统一工具的恣意个前提组合,如:

3.1.3 分列 arrange

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读