专访大数据专家韩健:分布式大数据技术与银行业的融合
韩健,大数据处理赏罚与银行应用规模的资深IT专家。多年从事数据客栈建树、银行数据说明与决定支持、银行数据化运营、操作大数据防控银行风险等银行IT规模的事变。 2008 年结业于北京邮电大学,并得到打点科学与工程硕士学位,是海内最早开展操作算法节制风险、防控银行名誉风险的数据专家。先后接受美国格理团体(GLG)高级IT参谋、邮政储备银行高级数据存储专家、民生银行高级数据说明专家等地位,主导过邮政储备银行储备齐集项目、邮政储备银行公司营业项目、民生银行齐集运营筹划与检视数据项目、银监会EAST现场搜查项目、民生银行与人民法院执行查控专线项目等多个世界性贸易银行的大型项目。同时,还通过了Hitachi Data Systems Certified Storage Manager日立高级存储认证、HP-CSE 惠普高级认证等多项国际IT认证,致力于操作信息技能和漫衍式大数据技能改革当代贸易银行营业流程,低落银行运营本钱,晋升风险防控程度。今朝首要认真贸易银行信息体系、海量基本架构运营体系、云平台和大数据说明平台等体系的筹划、研发及运营,在银行营业流程优化、IT产物筹划、银行应用体系建树和大数据存储和处理赏罚等规模有富厚履历。 Q:请您先容您的职业过程 - 在邮储银行、民生银行等知名大型贸易银行的事变经验为您带来什么影响和感悟? 韩健:要说感悟的话,两个字归纳综合一下就是“戴德”,无论是邮储银行照旧民生银行都给了我很是辽阔的平台。我有幸见证了以大数据、云平台为代表的各类IT技能给传统银行业带来的庞大变革,同时让本身拥有了跨界的手段,将IT技能与传统银行营业更好的融合。从我小我私人的职业过程来讲,首要经验了两个阶段: 第一阶段是 2008 年到 2014 年在邮储银行的职业经验,我作为项目标主导者教育团队完成了操作小型机集群更换大型机构建焦点体系的建树,搭建漫衍式的大数据存储平台,这项技能在海内银行业的初次乐成实行,且在开放式平台上建树云云复杂局限的营业焦点体系,在环球尚无乐成案例;第二阶段是 2014 年至今在民生银行的职业经验,我作为高级数据专家参加幸廒的凤凰打算大型项目,与行内同事一路操作大数据平台自主研发数据说明模子,在内控合规、反诓骗、运营流程优化等方面均取得了卓有成效的研究成就。 Q:适才您提到的操作小型机更换大型机的漫衍式集群技能,这项技能获得了工信部、人民银行、银监会等国度部委及禁锢机构的高度承认,可否可以简朴谈一下这项技能的内容以及它的意义? 韩健:好的。一向以来,我国贸易银行首要是基于大中型主机、以齐集式架构构建其营业体系,这种架构具有技能成熟、体系靠得住、应用实现相对简朴等利益,同时也存在焦点技能由海外供给商所把持、体系投入本钱高档弱点。跟着开放平台处理赏罚手段的大幅晋升、高速收集技能的日益成熟,以及云计较、漫衍式存储等新技能的快速成长和应用,基于开放平台、回收漫衍式架构建树营业体系,因为具有本钱低、易扩展、自主可控等上风,也成为贸易银行架构转型的趋势。 这项工程于 2011 年 6 月 16 日正式启动,整个工程历时三年,于 2013 年 5 月 26 日在陕西乐成试点上线,从此颠末三省试点、五批推广、 27 轮预演后,共完成了世界 30 个省(区、市)的切换上线。 自启动推广事变以来,营业处理赏罚正常,买卖营业乐成率均值始终保持在98%以上,体系乐成率均值始终保持在99%以上。这项工程是银行信息科技规模迄今技能最伟大、建树难度最大的工程。以小型机集群更换大型机构建焦点体系的技能蹊径取得圆满乐成,是在海内同业的初次乐成实行,且在开放式平台上建树云云复杂局限的营业焦点体系,在环球尚无乐成案例。因此,工信部等多个部委也暗示这项技能为国度实现焦点技能“自主可控”的安详计谋作出了起劲试探,在维护金融和信息安详靠得住方面迈出了要害一步。而我本人也很是有幸作为该项目标主导者得到了“ 2011 年度中国邮政团体公司科学技能奖”。 Q:提到漫衍式的存储技能,您以为此刻较量主流的大数据存储技能有哪些?详细到银行业哪种较量好? 韩健:今朝大数据存储技能蹊径最典范的共有三种:回收MPP架构的新型数据库集群、基于Hadoop的技能扩展和封装,环绕Hadoop衍生出相干的大数据技能以及大数据一体机,一种专为大数据的说明处理赏罚而计划的软、硬件团结的产物。前两种技能的都是漫衍式的存储,第三种是齐集式的。从我小我私人的角度,漫衍式存储是将来大数据的成长偏向。详细到这两种漫衍式存储技能的较量,MPP漫衍式数据库较Hadoop漫衍式体系在伟大逻辑的布局化数据处理赏罚上具有必然的上风,且可基于SQL开拓,对付有较富厚SQL履历的银行体系开拓者开拓与运维更轻易,但这并不料味着MPP漫衍式数据库就是大数据处理赏罚的最佳办理方案。由于在银行体系数据中,布局化数据代价密度凡是高于非布局化或半布局化数据,而在银行数据中非布局化数据占用了大量的存储资源。这是由于银行体系中布局化数据以账务数据为主,而非布局化数据则首要齐集在凭据影像等数据。虽然布局化数据中也包罗部门日记信息等代价密度不高的数据,而数据存储与处理赏罚技能正在由“一种架构支持全部应用”向“多种架构支持多类应用”转变。 Q:在新一代体系架构中,大数据是焦点要素。这在搭建大数据平台时,需着手大数据管理相干建树。对付银行业大数据管理您有什么观点? 韩健:我先谈谈什么是大数据管理。数据管理自己分狭义和广义两个区别,狭义的管理首要是组织、制度、流程这些,而广义的管理包罗数据质量、数据尺度这些。数据管理夸大两点,一是高层支持,二是各部分普及参加。银监会稀有据质量的精采尺度,而且会举办非现场搜查加现场搜查,这是银行数据管理事变最大的督导。 2017 年,中国银监会启动了贸易银行数据尺度化的事变,我作为银监会禁锢数据尺度化类型小组的专家成员正在举办这方面的研究,会对贸易银行的前中靠山各个营业规模的数据举办类型。从这个角度来看,无论是禁锢层照旧银行自己,都对大数据管理的重要性都有了清晰的熟悉。 Q:您深耕银行IT数据多年,作为这个规模的先行者和精巧孝顺专家,您以为在银行开展大数据事变的偏向和团队建树上的提议? 韩健: 大数据技能的成长日新月异,数据的人才储蓄和技能蕴蓄却不能一挥而就,必要相等力度的一连投入。人才储蓄方面,应本着“引进一批,作育一批,储蓄一批”的原则,引进一小批高条理技强人才,通过详细的项目实验,作育大量的存量技强职员,并通过面向高校和社会的大数据技能比赛、扶助开源社区等方法,形成普及而有用的人才储蓄。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |