机器学习算法 Java 库 Smile 1.5.0 发布,引入新特性
标签:
软件更新新闻
| 发表时间:2017-11-23 06:46 | 作者:
出处:http://www.oschina.net/?from=rss
机器学习算法 Java 库 Smile 1.5.0 已发布。该版本引入了新特性和修复 bug,改进了对 Windows 的支持,具体如下:
-
DataFrame
-
New Shell for Mac and Linux
-
Shell improvement for Windows
-
Out of box support of native LAPACK for Windows
-
Scala functions to export AttributeDataset, double[][], double[] to ARFF or CSV
-
Scala functions for validation measures
-
Refactor feature transformation and generation classes
-
NeuralNetwork for regression
-
Recursive least squares
-
Refactor Scala NLP API
-
Bug fixes
SmileMiner是一个包含各种现有的机器学习算法的Java库。主要组件包括:
-
mile 机器学习的核心库
-
SmileMath 数学函数、排序、随机数生成器、最优化、线性代数、统计分布、假设检验
-
SmileData Parsers for arff, libsvm, delimited text, sparse matrix, microarray gene expression data.
-
SmileGraph 邻接表和矩阵图算法
-
SmileInterpolation 一维和二维插值
-
SmileNLP Natural Language Processing.
-
SmilePlot 基于Swing的可视化库
下载地址
相关 [机器学习 算法 java] 推荐:
- - 开源中国社区最新新闻
机器学习算法 Java 库 Smile 1.5.0 已发布. 该版本引入了新特性和修复 bug,改进了对 Windows 的支持,具体如下:. SmileMiner是一个包含各种现有的机器学习算法的Java库. mile 机器学习的核心库. SmileMath 数学函数、排序、随机数生成器、最优化、线性代数、统计分布、假设检验.
- - 标点符
机器学习通常会被分为2大类:监督学习和非监督学习. 在监督学习中,训练数据由输入和期望的输出组成,然后对非训练数据进行预测输出,也就是找出输入x与输出y之间的函数关系F:y = F(x). 根据输出的精确特性又可以分为分类和回归. 分类和回归的区别在于输出变量的类型. 定量输出称为回归,或者说是连续变量预测.
- - ITeye博客
使用命令:mahout -h.
在Mahout实现的机器学习算法见下表:. EM聚类(期望最大化聚类). 并行FP Growth算法. 并行化了Watchmaker框架. 非Map-Reduce算法. 扩展了java的Collections类. Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能.
- - IT瘾-geek
在从事数据科学工作的时候,经常会遇到为具体问题选择最合适算法的问题. 虽然有很多有关机器学习算法的文章详细介绍了相关的算法,但要做出最合适的选择依然非常困难. 在这篇文章中,我将对一些基本概念给出简要的介绍,对不同任务中使用不同类型的机器学习算法给出一点建议. 在文章的最后,我将对这些算法进行总结.
- - 博客园_首页
(一)什么是k-近邻分类算法. (二)怎样从文件中解析和导入数据. (三)使用Matplotlib创建扩散图. (一) 什么是k-近邻分类算法. 简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类,k-近邻是一种有监督的分类算法. k-近邻的工作原理:存在一个样本数据集,也称之为训练样本集,并且样本集中的每个数据都存在标签,即每个样本所属的类别.
- - ITeye博客
Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中.
- - CSDN博客推荐文章
本文我们会概述一些流行的机器学习算法. 机器学习算法很多,并且它们自身又有很多延伸. 因此,如何确定解决一个问题的最好算法是很困难的. 下面我们先说基于学习方式对算法的分类和算法之间的相似性,让大家有个整体意识;接着再陈述各类算法. 一、基于学习方式对算法的分类. 根据如何处理经验、环境或者任何我们称之为输入的数据,算法分为不同种类.
- - CSDN博客综合推荐文章
重要引用: Andrew Ng Courera Machine Learning; 从机器学习谈起; 关于机器学习的讨论; 机器学习常见算法分类汇总; LeNet Homepage; pluskid svm. 首先让我们瞻仰一下当今机器学习领域的执牛耳者:. 这幅图上的三人是当今机器学习界的执牛耳者.
- -
在美团商家数据中心(MDC),有超过100w的已校准审核的POI数据(我们一般将商家标示为POI,POI基础信息包括:门店名称、品类、电话、地址、坐标等). 如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行了一些尝试:利用机器学习方法,自动标注缺失品类的POI数据. 例如,门店名称为“好再来牛肉拉面馆”的POI将自动标注“小吃”品类.
- - IT瘾-dev
机器学习既是一门科学,也是一种艺术. 纵观各类机器学习算法,并没有一种普适的解决方案或方法. 事实上,有几个因素会影响你对机器学习算法的选择. 有些问题是非常特别的,需要用一种特定的解决方法. 例如,如果你对推荐系统有所了解,你会发现它是一类很常用的机器学习算法,用来解决一类非常特殊的问题. 而其它的一些问题则非常开放,可能需要一种试错方法(例如:强化学习).