加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

对付进修大数据的新人,面临开拓说话和说明软件时,该怎样选择?

发布时间:2018-10-18 01:09:17 所属栏目:大数据 来源:多智时代
导读:大数据快速成长的本日,许多人选择插手大数据进修的阵营,课时从那边入手,怎样选择吻合的开拓说话来做与大数据相干的事,这个话题应该困扰了不少大数据进修的新人,在面临八门五花的「开拓说话」和「说明软件」时,本身该怎样选择? 先开门见山的给出结论

大数据快速成长的本日,许多人选择插手大数据进修的阵营,课时从那边入手,怎样选择吻合的开拓说话来做与大数据相干的事,这个话题应该困扰了不少大数据进修的新人,在面临八门五花的「开拓说话」和「说明软件」时,本身该怎样选择?

1

先开门见山的给出结论:在职场中,进修任何一门技能,优先思量事变需求自己,其次是职业成长所需,最后才是乐趣和洽奇驱动。本末颠倒的话,不只进修服从低下,并且还也许竹篮吊水一场空,挥霍时刻本钱。

就拿我本身说事,念书时代在做「数学建模」时,由于不是计较机软件相干的专业,独一打仗过的C说话(The C Programming Language)也只懂皮毛,以是每一次角逐为了去「网络数据、处理赏罚数据、说明数据和构建模子」,只能借助人力、Excel、Matlab和SPSS去操纵。

虽然,这些器材也足够去满意角逐的手艺要求了,并且角逐的焦点也不在于非要用更高级的编程说话,相反它们只是办理题目的一种情势而已,要害在于要快速上手,要能办理需求痛点。

以是,在这样的一个环境之下,我并没有捐躯大量的进修本钱,从头去进步C说话的编程手段,乃至是从0到1去进修Java说话。

邻近秋招前,我开始去相识家产上常用的数据开拓软件和开拓说话,的确是琳琅满目,有Python、R、Eviews、SAS、SPSS、Tableau、水晶易表,一大堆。尚有Java、C、C++、Hadoop各类词汇都显露于面前。

当时辰就有点不知所措了,完全不知道该学什么,以是最后都选择打仗了一遍,但功效真的是白搭全力,挥霍时刻。

后头演习入职了一家互联网电商平台,陈设了6~7个节点的漫衍式集群去做大数据计较,其时还觉得本身终于能玩「大数据」了,可没想到最后用的最多的却是SQLHQL、Excel、PPT、SPSS。并且它们已经足够办理一般的事变需求了。

以是说,进修任何一门技能,最好能在现实事变中有所行使,事实你的事变时刻限定了你的进修精神,不然你很难去到达纯熟的水平,更别提深入专研。

但不管怎样,从行业的成长趋势上,许多新手艺是必必要进修和把握的,假如事变中真的没有机遇去打仗和行使的话,那就只能换一个更吻合的平台。

当初我就是这样去思量的,事实「大数据」的高潮已经全面放开了,再不抓紧就只有看落日西下了。

以是,在后头几年的事变经验中,我都是在打仗Hadoop、Spark相干的开源软件,从0到1的去学过Python、Java、Hive、MapReduce(基于Java实现)、Shell 、Scala、Spark Streaming这些手艺。

可是不管怎样,这统统的新常识进修都是为了去顺应事变情形,为了更快捷和更高效去办理事变需求的题目。同时由于事变中经常打仗到,以是才气纯熟起来,也才有机遇去深入思索更底层的题目。

总而言之,我以为任何技能都是为了更好的处事于营业,营业是驱动技能成长的要害身分。

虽然,从行业趋势上,我也规划在后期引入深度进修的计较框架,也会去思量高并发的计较服从优化等等,可是回归本质都是为了晋升营业模子的结果,办理更多营业需求痛点。

因此,要想去进修新手艺,引入新技能,大条件是现有的营业需求已经获得有所办理,并且可以或许获得营业的支持和信赖,这样在后期技能的推进上才气偶然刻去探索,有机遇去实行。不然,你同样只能学个皮毛。

好了,报告完了我本身,最其后谈谈大大都伴侣的排场,这也是各人所体谅的。

① 起首,作为数据小白,应该先辈修什么数据手艺?

毫无疑问,这时辰你必要先把「入门」作为主要方针,不要过于暴躁,优先思量去进修SQL、Excel、SPSS、PPT,这样你才有机遇进入一个平台,可以或许打仗数据,开始数据说明,实行撰写陈诉。操作好这个跳板,你才气向「生长」进阶。

② 其次,作为营业职员(含说明师、产物司理),应该进修什么数据手艺?

这时辰你必要去进一步进步本身的专业手艺,这样才有机遇去更相识数据,实习数据感,写出更有深度的说明陈诉,乃至是往后的转岗。以是你必要一把利剑,我会优先保举Python,节减往后进修其他说话(Java、Scala)的时刻本钱。

③ 其它,作为数据开拓,应该先辈修什么数据手艺?

我的提议是,你先去做好一个Java工程师,把握必然的专业手艺,再来思量从事大数据开拓呢。

虽然,这样的时刻本钱或者挺高,并且现阶段开源这套技能框架根基不变和易上手了。

④ 最后,作为数据发掘,应该先辈修什么数据手艺?

数据发掘这个岗亭,严酷上区别于算法工程师,前者是一个偏营业、重数据、看实践的岗亭,普通易懂就是在试探海量数据中的经济代价。

以是,大部门数据发掘工程师,首当其冲的痛点是必要思索一个题目:怎样将以往纯熟的这套技能和流程与「大数据」和「营业」相团结。

别想着操作PythonR去直连出产情形的数据做说明,许多平台都有碉堡机,也不应承当地情形与出产情形的直接交互。纵然你load到了线上数据,可是只依附DataFrame这样的操纵,我以为很难去说明出什么数据代价,更别提能不能单机运算的服从。

以是,做数据发掘事变时,除了思索模子的结果晋升,也要思量清晰本身的模子后期将怎样去与线上营业团结,以及它的计较服从和自动化事变。

因此,我提议优先去思量一下漫衍式集群的计较方法,假如平台缺乏团队和资金的话,要么思量单独增进本机的计较资源和优化模子的计较服从,要么思量换一个事变情形。

最后,对付大部门数据发掘工程师来说,必然要增强SQL、Excel的行使,这是最根基,也是最重要的。

所讲的这些,是为了让各人正确的做数据。进修这些手艺,是为了让各人轻松的做数据。归根到底,都是为了进步焦点竞争力,花最短的时刻,输出最大的代价,让本身更值钱!

在不久的未来,多智期间必然会彻底走入我们的糊口,有乐趣入行将来前沿财富的伴侣,可以保藏 多智期间 ,实时获取人工智能、大数据、云计较和物联网的前沿资讯和基本常识,让我们一路联袂,引领人工智能的将来!

相干阅读:

怎样入门大数据

怎样写一个更好的Python函数?

大数据干货 | 论Spark好手是奈何炼成的

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读