电商卷皮BI的实践演进和架构系统—猫友会大讲坛第4期
Q1:查询HBase中的数据有没有效什么SQL引擎呢?有的话用的是什么SQL查询引擎? A1:我们没有效什么SQL引擎,我们首要是靠row-key的计划。 Q2:hadoop平台的陈设是通过? ambari这些吗? A2:我们行使cloudera的版本的。 Q3:先生好,可否或许讲授一下怎么按照用户画像做保举,这内里用到什么技能点。 A3:首要照旧数据发掘的算法,有聚类,协同过滤,商品相似度之类的算法,不外针对差异的营业场景行使的算法纷歧样。技能上,我们是用的sparkR。 Q4:我们此刻olap今朝正在行使apache kylin,saiku和kykin团结怎么样,有过调研没? A4:Saiku直接+kylin我们还没有效过,不外应该是OK的,由于saiku首要是界面揭示。 Q5:BI发掘的用户画像和鹰眼体系,有什么离线指标来评价相干的数据质量? A5:相同用户画像的性别,首要看两个方面,包围率和精确率,包围率晋升了,大概精确率就会降落,后续我们可以一连跟踪用户的举动,可能举办一些现实的回访,来验证并优化我们的数据模子。鹰眼更多的是基于法则引擎做的。 Q6:数据meta打点是怎么做的? A6:营业上我们对全部的数据指标口径举办同一,全部展示数据的处所都是同等的,然后对付改观等等流程都有必然的打点。 猫友会 技能交换分享,求职简历投递 ?扫小猫助手二维码,插手猫友会 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |