加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

美团R说话数据运营拭魅战

发布时间:2018-08-17 00:36:34 所属栏目:教程 来源:喻灿
导读:技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战 一、弁言 连年来,跟着漫衍式数据处理赏罚技能的不绝刷新,Hive、Spark、Kylin、Impala、Presto 等器材不绝推陈出新,对大数据荟萃的计较和存储成为实际,数据客栈/贸易说明部分日益成

现实数据运营说明进程中,可以固化通例的图表揭示和可视化说明进程,实当代码复用,进步开拓服从。下图是美团到店餐饮技能部数据团队蕴蓄的部门可视化组件示例:

美团R说话数据运营拭魅战

图一 可视化组件示例

基于可视化组件库,一个可视化进程只必要一行代码即可完成,能极大晋升开拓服从。上图中最后的四象限矩阵阐昭示例图的代码如下:

  1. vis_4quadrant(iris, 'Sepal.Length', 'Petal.Length', label = 'Species', tooltip = 'tooltip', title = '', xtitle = '萼片长度', ytitle = '花瓣长度', pointSize = 1, annotationSize = 1) 

茲再附四象限矩阵说明可视化组件的函数声明:

  1. vis_4quadrant <- function(df, x, y, 
  2.   label = '', tooltip = '', title = '', xtitle = '', ytitle = '', 
  3.   showLegend = T, jitter = T, centerType = 'mean', 
  4.   pointShape = 19, pointSize = 5, pointColors = collocatcolors2, 
  5.   lineSize = 0.4, lineType = 'dashed', lineColor = 'black', 
  6.   annotationFace = 'sans serif', annotationSize = 5, annotationColor = 'black', annotationDeviationRatio = 15, 
  7.   gridAnnotationFace = 'sans serif', gridAnnotationSize = 6, gridAnnotationColor = 'black', gridAnnotationAlpha = 0.6, 
  8.   titleFace = 'sans serif', titleSize = 12, titleColor = 'black', 
  9.   xyTitleFace = 'sans serif', xyTitleSize = 8, xyTitleColor = 'black', 
  10.   gridDesc = c('A 区', 'B 区', 'C 区', 'D 区'), dataMissingInfo = '数据不完备', renderType = 'widget') { 
  11.  
  12.   # 绘制分组散点图 
  13.   # 
  14.   # Args: 
  15.   #   df: 数据框;须要字段;必要举办图形绘制的数据,至少应该有三列 
  16.   #   x: 字符串;须要字段;映射到 X 轴的列名,对应 df 的某一列,此列必需是数值范例或日期范例 
  17.   #   y: 字符串;须要字段;映射到 Y 轴的列名,对应 df 的某一列 
  18.   #   label: 字符串;映射到点上的笔墨注释 
  19.   #   tooltip: 字符串;映射到点上的悬浮信息 
  20.   #   title: 字符串;问题 
  21.   #   xtitle: 字符串;X 轴问题 
  22.   #   ytitle: 字符串;Y 轴问题 
  23.   #   showLegend: bool;界说分区图例是否展示 
  24.   #   jitter: bool;界说是否扰动 
  25.   #   centerType: 字符串;界说中心点范例,mean 代表均匀值,median 代表中位数 
  26.   #   pointShape: 整形;界说点型 
  27.   #   pointSize: 数值;界说点巨细 
  28.   #   lineSize: 数值;界说线宽 
  29.   #   lineType: 字符串;界说线型 
  30.   #   lineColor: 字符串;界说线色 
  31.   #   annotationFace: 字符串;界说注释字体 
  32.   #   annotationSize: 数值;界说注释字体巨细 
  33.   #   annotationColor: 字符串;界说注释字体颜色 
  34.   #   annotationDeviationRatio: 数值;界说注释文本向上偏移系数 
  35.   #   gridAnnotationFace: 字符串;界说网格注释字体 
  36.   #   gridAnnotationSize: 数值;界说网格注释字体巨细 
  37.   #   gridAnnotationColor: 字符串;界说网格注释字体颜色 
  38.   #   gridAnnotationAlpha: 数值;界说网格注释文本透明度 
  39.   #   titleFace: 字符串;界说问题字体 
  40.   #   titleSize: 数值;界说问题字体巨细 
  41.   #   titleColor: 字符串;界说问题字体颜色 
  42.   #   xyTitleFace: 字符串;界说 X、Y 轴问题字体 
  43.   #   xyTitleSize: 数值;界说 X、Y 轴问题字体巨细 
  44.   #   xyTitleColor: 字符串;界说 X、Y 轴问题字体颜色 
  45.   #   gridDesc: 长度为 4 的字符串向量 
  46.   #   dataMissingInfo: 字符串;数据题目提醒文本 
  47.   #   renderType: 字符串;界说渲染功效范例,widget 对应 htmlwidget 组件,html 对应 html 内容 
  48.  
  49.   #   代码实现略 

3.3 可一再性数据说明

数据运营说明每每是一个一再性的、重人工参加的进程,最终会落地一套数据说明框架,这套数据说明框架适配详细的数据,用于支持企业数据决定。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读