加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理赏罚之——data.table

发布时间:2021-01-27 22:30:27 所属栏目:大数据 来源:网络整理
导读:data.table 简介 关于 R 中的数据处理赏罚,我们接着先容 data.table 包。上期我们先容的 dplyr 有相同于sql的一套数据处理赏罚的语法,而 data.table 则有着它本身的一套语法,它能处理赏罚险些全部 dplyr 可以处理赏罚的数据,并且代码量更少,服从更高,出格是在处理赏罚大至G

j不提供参数名的时辰,会自动天生相同(V1,?V2)的参数名。

b) keyby

假如在分组数据计较后,想要对分组数据举办排序,这时便可用到keyby参数。

– 计较差异球员在差异胜败相关了局均得分与助攻数,并按球员和胜败相关举办排序
c) 管道操纵 

data.table中也有相同dplyr%>%成果的函数,下面我们来看看这个成果的甜头:

# 按球员分组求进场均得分和助攻,再按得分降序分列
mptsmastby = .mpts# ? ?player ? ? mpts ? ? ?mast
# 1: ? 库里 30.06329 ?6.670886
# 2: ? 威少 23.47500 10.425000
# 3: ? 沃尔 19.88312 10.246753
# 4: ? 欧文 19.64151 ?4.716981
# 5: ? 保罗 19.54054 ?9.972973
# 6: ? 康利 15.30357 ?6.107143
# 行使管道操纵
# 6: ? 康利 15.30357 ?6.107143

可以看出,data.table中的管道操纵是凭证DT[ ... ][ ... ][ ... ]的情势举办操纵的。

e) 用.SD同时对多罗列办沟通计较

– 计较每一个球员的场均数据
# 提取球员,得分,助攻,抢断,失误数据列
ast,0);">stl,0);">tov# 按球员分组计较其他全部数据列的均值
lapply.SD,136); font-style: italic;"># ? ?player ? ? ?pts ? ? ? ast ? ? ?stl ? ? ?tov
# 1: ? 库里 30.06329 ?6.670886 2.139241 3.316456
# 2: ? 康利 15.30357 ?6.107143 1.196429 1.500000
# 3: ? 保罗 19.54054 ?9.972973 2.054054 2.621622
# 4: ? 沃尔 19.88312 10.246753 1.883117 4.129870
# 5: ? 威少 23.47500 10.425000 2.037500 4.275000
# 6: ? 欧文 19.64151 ?4.716981 1.056604 2.339623

回收.SD会对除分组数据外全部的数据列做处理赏罚,而现实处理赏罚数据的时辰,每每是必要指定个中多列数据举办处理赏罚,并不是所稀有据列,这时辰就必要共同.SDcols参数举办操纵。例子如下:

# 按球员分组仅计较得分和助攻数据的均值
.SDcols]
## 用.SDcols对球员的得分和助攻数据举办处理赏罚
# ? ?player ? ? ?pts ? ? ? ast
# 2: ? 康利 15.30357 ?6.107143
# 3: ? 保罗 19.54054 ?9.972973
# 4: ? 沃尔 19.88312 10.246753
# 5: ? 威少 23.47500 10.425000
# 6: ? 欧文 19.64151 ?4.716981
– 取每个球员前两场的数据
– 把每个球员的得分和助攻数连起来作为一个变量 
# 新变量为一列
val # ? ? ?player val
# ? 1: ? 库里 ?46
# ? 2: ? 库里 ?37
# ? 3: ? 库里 ?17
# ? 4: ? 库里 ?27
# ? 5: ? 库里 ?21
# ?--- ? ? ? ? ?
# 834: ? 欧文 ? 5
# 835: ? 欧文 ? 2
# 836: ? 欧文 ? 2
# 837: ? 欧文 ? 4
# 838: ? 欧文 ? 4

## 新变量为列表
# ? ?player ? ? ? ? ? ? ? ?val
# 1: ? 库里 46,37,27,21,39,
# 2: ? 康利 22,12,24,7,19,136); font-style: italic;"># 3: ? 保罗 12,5,13,25,20,136); font-style: italic;"># 4: ? 沃尔 15,22,14,8,136); font-style: italic;"># 5: ? 威少 13,23,26,136); font-style: italic;"># 6: ? 欧文 35,11,15,10,

小结

data.table的一样平常语法情势如下:

]
i选择行:
  1. (编辑:湖南网)

    【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读