加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

R语言数据处理方法~小结

发布时间:2021-01-20 16:24:10 所属栏目:大数据 来源:网络整理
导读:文章目次 1. R自带函数 2. reshape2数据重构 3. dplyr 4. tidyr 5. 字符串处理赏罚 1. R自带函数 1.1 转置 行使函数t()可对一个矩阵或数据框举办转置,对付数据框,行名将酿成变量(列)名。 数列array举办维度转换 aperm 1.2 整合数据aggregate 在R中行使一个或

R说话数据处理赏罚要领~小结

另: 一些汇总时的小函数

n(): 计较个数?n_distinct(x): 计较 x 中独一值的个数

3.3 链式操纵(管道) %>% 或 %.%

dplyr包还新引进了一个操纵符,读成then,行使时把数据名作为开头,然后依次对此数据举办多步操纵。好比:

R说话数据处理赏罚要领~小结

按数据处理赏罚的思绪写代码,一步步深入,?既易写又易读,靠近于从左到右的天然说话次序, 比拟一下用R自带函数实现的.

R说话数据处理赏罚要领~小结

文章里还暗示: 通过 %>% 那段代码比跑上面这段代码,运算速率晋升许多倍.

至于这个奇怪的观念会不会和 ggplot2 里的 + 毗连号一样,施展出各种奇奥的成果呢? 照旧在现实行使中多体验感觉吧.

3.5 数据匹共同并join

(1)inner_join(x,y) :只包括同时呈此刻x,y表中的行

(2)left_join(x,y) :包括全部x中以及y中匹配的行

(3)semi_join(x,y) :包括x中,在y中有匹配的行,功效为x的子集

(4)anti_join(x,y) :包括x中,不匹配y的行,功效为x的子集,与semi_join相反

(5)full_join(x,y) :包括以是x、y中的行

(6)right_join(x,y) :包括全部y中以及x中匹配的行

R说话数据处理赏罚要领~小结

3.6 毗连数据库

(1)dplyr 可以毗连数据库

(1)行使与当地数据框操纵一样的语法

(3)只支持天生SELECT语句

(4)支持SQLite,PostgreSQL/Redshift,MySQL/MariaDB,BigQuery,MonetDB

3.7 操作窗体函数调动数据

4. tidyr

tidyr包的作者也是Hadley Wickham,与dplyr包团结行使,是reshape2包的更换。(先挖坑...)

5. 字符串处理赏罚

5.1 字符个数 nchar

nchar()可以或许获取字符串的长度,它和length()的功效是有区此外。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读