加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

8个用于数据发掘的卓越开源器材

发布时间:2021-05-31 04:31:07 所属栏目:大数据 来源:互联网
导读:在呆板进修的流程中数据发掘是重要的一环。数据发掘是从大量数据中提取潜匿的或未知,但也许有效信息的进程。这些数据最终会被加上标签,用于模子的实习。许多的

在呆板进修的流程中数据发掘是重要的一环。数据发掘是从大量数据中提取潜匿的或未知,但也许有效信息的进程。这些数据最终会被加上标签,用于模子的实习。许多的数据科学家和呆板进修工程师都有其认识的数据发掘器材,但市场上也不乏很多开源的数据发掘器材。

 

Apache Mahout

 

Apache Mahout是风行的漫衍式线性代数框架。该框架是具稀有学表达手段的Scala DSL,可以或许让统计学家和数据科学家以更快的方法实现其算法。它构建了一个用于快速建设可扩展且机能驱动的呆板进修应用措施的情形。

 

8个用于数据发掘的最佳开源器材

Apache Mahout有诸多上风,好比它应承应用措施以更快的方法说明大型数据集;支持数学表达式Scala DSL;支持多个漫衍式后端,包罗Apache Spark;合用于CPU/GPU/CUDA加快的模块化本机求解器。

 

DataMelt

 

DataMelt或DMelt是用于数值计较,数学、统计、标记计较,数据说明和数据可视化的开源软件。该平台是Python,Ruby,Groovy等各类剧本说话的组合,以及其他Java软件包。

 

8个用于数据发掘的最佳开源器材

DMelt是一个计较平台,可以在各类操纵体系上与差异的编程说话一路行使;DataMelt可以与Java平台的几种剧本说话一路行使,譬喻Jython(Python编程说话),Groovy,JRuby(Ruby编程说话)和BeanShell;它可建设高质量的矢量图形图像(SVG,EPS,PDF等),这些图像可以包括在LaTeX和其他文本处理赏罚体系中。

 

ELKI

 

由Index-Structures或ELKI支持的开拓KDD应用措施的情形,是用Java说话编写的开源数据发掘软件。该平台可以或许研究算法,重点是聚类说明和离群值检测中的无监视要领。

 

 

 

它提供了数据索引布局,譬喻R*树,可明显进步机能;利便该规模的研究职员和门生举办扩展;ELKI提供了大量可高度参数化的算法。

 

Knime

 

KNIME Analytics Platform用Java编写,基于Eclipse,是用于承载数据科学使命的开源软件。它是一种多说话软件开拓情形,包罗一个集成开拓情形(IDE)和一个可扩展的插件体系。Knime是一个免费的数据说明,陈诉和集成平台。

 

8个用于数据发掘的最佳开源器材

它应承用户从2000多个节点中举办选择来构建事变流程;应承行使直观的拖放式图形界面,建设可视化事变流程,而无需编程。

 

Orange

 

Orange是一款开源的,基于组件的数据发掘软件,用于呆板进修和数据可视化。它包罗一系列数据可视化、搜刮、预处理赏罚和建模技能,而且可以用作Python编程说话的模块。

 

8个用于数据发掘的最佳开源器材

Orange具有交互式数据可视化成果,还可以执行简朴的数据说明;它包罗交互式数据搜刮,可通过清楚的可视化举办快速定性说明。

 

Rattle

 

Rattle用R说话编写,是风行的用于数据发掘的开源GUI,可表现数据的统计和可视择要。它可以转换数据,以便可以对其举办建模。它按照数据构建无监视和受监视的呆板进修模子,以图形方法表现模子的机能,并对新数据集举办评分以陈设到出产中。

 

8个用于数据发掘的最佳开源器材

Rattle通过GUI展示R Statistics软件的成果,它提供了可观的数据发掘成果;通过图形用户界面举办的全部交互都被捕捉为R剧本,可以独立于Rattle界面在R中轻松执行;该器材可用于进修和成长R的手艺,然后在Rattle中构建初始模子。

 

scikit-learn

 

scikit-learn是一个风行的Python库,用于数据说明和数据发掘,它成立在SciPy,Numpy和Matplotlib的基本上。scikit进修的首要成果为分类、回归、聚类、降维、模子选择以及数据预处理赏罚。

 

8个用于数据发掘的最佳开源器材

scikit-learn包罗用于猜测数据说明的简朴有用的器材;它提供了风行的模子,包罗降维、交错验证集成要领、参数调解等等。

 

Weka

 

Weka或Waikato常识说明情形是一种风行的开源呆板进修软件,可以通过图形用户界面,尺度终端应用措施或Java API举办会见。它是用于办理现实数据发掘题目的呆板进修算法的荟萃。它是用Java编写的,险些可以在任何平台上运行。

 

8个用于数据发掘的最佳开源器材

Weka包括大量用于尺度呆板进修使命的内置器材,它提供对闻名器材箱,如scikit-learn,R以及Deeplearning4j的透明会见。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读