整理数据成数据科学家最大挑衅
数据说明师耗费一半以上的时刻整理和转换数据,而不是从中提取贸易智能,这并不特别。数据储存的局限不绝增大,数据范例也在激增。新一代的器材簇拥而至,并理睬把伟大的器材送到不依靠数据的科学家的手上。 技能规模最热点的地位之一是数据科学家,或者只有最新呈现的首席高管地位:首席数据科学家能逾越他们。显而易见,人们对这种趋势一向存在质疑,来自美国科技网站InfoWorld的 Yves de Montcheuil曾引用过一则笑话,数据学家就是住在加利福尼亚州的贸易说明师。 每个公司都必要把公司的数据转换为贸易智能,这并不是什么风趣的事,这就是数据科学家包袱主导责任的时辰。但跟着数据数目和种类的激增,数据科学家发明,他们大部门的时刻都耗费在整理和转换数据,而不是说明数据,并把它们汇报给企业司理。 最近,IT项目众包公司CrowdFlower的数据科学家举办了一项观测(必要注册可查察)。观测发明,三分之二的说明职员以为整理和组织数据是它们最费时的事变,52%称他们最大的障碍是数据质量差。受访者说出了在它们事变中行使的48种差异的技能,最受接待的是Excel(55.6%),其次是开源说话研究(43.1%),和Tableau数据可视化软件(26.1%)。 ![]() ▲来历:CrowdFlower公司 数据科学家以为它们最大的挑衅是整理数据耗费时刻,数据质量差,穷乏说明时刻,以及无效的数据建模。 是什么克制了数据说明的成长?被观测的数据科学家罗列出,包罗穷乏有用满意他们事变必要的器材(54.3%),组织没有清晰地声名方针和宗旨(52.3%),以及培训投资不敷(47.7%)。 ![]() ▲来历:CrowdFlower公司 缺乏器材,方针不明晰,不注重培训被陈诉为影响数据科学家服从的首要障碍。 理睬将满意大数据说明师必要的新器材 在技能规模有一个根基的课题:早期只有少数精英必要领略和行使常识、器材,跟着时刻的推移,产物日益改造,价值低落,企业顺应,技能逐渐成为了主流。新的数据说明器材簇拥而至,理睬把技能的效益带给非科研职员。 2014年8月17日,Steve Lohr在纽约时报上登载了几种产物的简介。譬喻,ClearStory Data公司的软件团结多个来历的数据,并转换成图表、舆图和其他图形。在数据筹备题目上Paxata公司采纳了差异方法,他们的软件通过各类可视化器材对数据举办检索、整理,和混实用于说明。 这家不以营利为目标的常识开放尝试室,号称是一个为“国民骇客、数据打点者,以及对技能和资讯团结的也许性发生乐趣的平凡国民”提供的社区。这个组织正在招募“数据打点员”志愿者,来维护焦点数据集,譬喻海内出产总值和ISO代码。空军总司令部的Rufus Pollock于2015年1月3日对该项目举办了描写。 ![]() ▲来历:常识开放尝试室 常识开放尝试室正在探求志愿者措施员,筹谋焦点数据集并作为零阻力数据打算的一部门。 没有比行使Morpheus更简朴和直接的方法来打点异构MySQL、MongoDB、Redis和ElasticSearch数据库。仪表板上的一次单击,Morpheus能使你在殽杂云上无缝提供、监控和说明SQL、NoSQL和内存数据库。你缔造每个的数据库实例都包罗一个内置的容错和妨碍的完备副本集。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |