礼品代发网真实快递信息:8个用于数据挖掘的最佳开源工具

数据挖掘是机器学习过程中的重要组成部分。数据挖掘是从大量数据中提取隐藏或未知但潜在有用信息的过程。这些数据最终将被标记并用于模型训练。许多数据科学家和机器学习工程师都有熟悉的数据挖掘工具,但市场上也有许多开源数据挖掘工具。

阿帕奇穆罕默德

Apache Mahout是一个流行的分布式线性代数框架。该框架是具有数学表达能力的Scala DSL,它使统计学家和数据科学家能够以更快的方式实现他们的算法。它为快速创建可扩展的、性能驱动的机器学习应用程序建立了一个环境。

Apache Mahout有很多优势,例如允许应用程序以更快的方式分析大型数据集;支持数学表达式Scala DSL;支持多个分布式后端,包括Apache Spark;用于中央处理器/图形处理器/CUDA加速的模块化本机解算器。

DataMelt

DataMelt是一个开源软件,用于数值计算、数学、统计、符号计算、数据分析和数据可视化。该平台是Python、Ruby、Groovy和其他脚本语言以及其他Java软件包的组合。

DMelt是一个计算平台,可以在不同的操作系统上与不同的编程语言一起使用;数据融合可以与Java平台的几种脚本语言一起使用,如Jython、Groovy、JRuby和BeanShell。它可以创建高质量的矢量图形图像。),它可以包含在LaTeX和其他文本处理系统中。

ELKI

由索引结构或ELKI支持的开发KDD应用程序的环境是用Java语言编写的开源数据挖掘软件。该平台可以研究算法,重点是聚类分析和异常值检测中的无监督方法。

它提供了数据索引结构,如R*树,可以显著提高性能;促进该领域研究人员和学生的发展;ELKI提供了大量可以高度参数化的算法。

Knime

用Java编写的基于Eclipse的KNIME分析平台是一个用于执行数据科学任务的开源软件。它是一个多语言软件开发环境,包括一个集成开发环境和一个可扩展的插件系统。Knime是一个免费的数据分析、报告和集成平台。它允许用户从2000多个节点中选择来构建工作流。允许使用直观的拖放图形界面创建可视化工作流,无需编程。

橙色的

Orange是一个开源的、基于组件的数据挖掘软件,用于机器学习和数据可视化。它包括一系列数据可视化、搜索、预处理和建模技术,可以作为Python编程语言的一个模块使用。

Orange具有交互式数据可视化功能,还可以进行简单的数据分析;它包括交互式数据搜索,可以通过清晰的可视化进行快速定性分析。

嘎嘎声

用R语言编写的Rattle是一个流行的开源数据挖掘图形用户界面,它可以显示统计数据和数据的可视化摘要。它可以转换数据,以便建模。它基于数据构建无监督和有监督的机器学习模型,以图形方式显示模型的性能,并为部署到生产中的新数据集评分。

拨浪鼓通过图形用户界面展示了统计软件的功能,提供了可观的数据挖掘功能;通过图形用户界面进行的所有交互都被捕获为r脚本,它可以很容易地在r中独立于拨浪鼓界面执行;这个工具可以用来学习和发展R的技能,然后用拨浪鼓建立一个初始模型。

sci kit-学习

Scikit-learn是一个流行的用于数据分析和数据挖掘的Python库,它基于SciPy、Numpy和Matplotlib。scikit学习的主要功能是分类、回归、聚类、降维、模型选择和数据预处理。

Scikit-learn包括一个简单有效的预测数据分析工具;它提供了流行的模型,包括降维、交叉验证集成方法、参数调整等。

新西兰黑秧鸡

Weka或Waikato知识分析环境是一个流行的开源机器学习软件,可以通过图形用户界面、标准终端应用程序或Java应用编程接口访问。它是用于解决实际数据挖掘问题的机器学习算法的集合。它是用Java编写的,几乎可以在任何平台上运行。

Weka包含大量用于标准机器学习任务的内置工具,提供了对scikit-learn、R和Deeplearning4j等著名工具箱的透明访问。

赞(0)
未经允许不得转载:京东空包 » 礼品代发网真实快递信息:8个用于数据挖掘的最佳开源工具
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址