热门人工智能开源工具(框架)

标签: 人工智能 开源 工具 | 发表时间:2021-04-21 09:37 | 作者:qingfengxd
出处:https://juejin.cn/backend

分享一些热门的人工智能开源工具/框架。

图片

TensorFlow

图片

TensorFlow™是一个开源软件库,最初由Google Brain Team的研究人员和工程师开发。TensorFlow使用数据流图进行数值计算。图中的节点表示数学运算,边表示它们之间通信的多维数据数组(张量)。其架构灵活,你可以使用单个API将计算部署到桌面、服务器或移动设备中的一个或多个CPU或GPU。

TensorFlow提供了多种API。最低级别的API——TensorFlow Core——提供了完整的编程控制。高级API则建立在TensorFlow Core的顶部。这些更高级别的API通常比TensorFlow Core更容易学习和使用。此外,更高级别的API使得重复性的任务在不同的用户之间变得更容易、更一致。一个高级API就像tf.estimator,可以帮助您管理数据集、评估器、训练和推理。

TensorFlow中的数据中心单位是张量。一个张量由一组形成任意数量维数组的原始值组成。张量的阶就是它的维数。

一些使用Tensorflow的Google应用有:

1.RankBrain:在www.google.com上大规模部署用于搜索排名的深度神经网络。

2.Inception图像分类模型:基准模型和对高度精确的计算机视觉模型的后续研究,它是在获得2014年Imagenet图像分类挑战赛的模型基础之上进行构建的。

3.SmartReply:可自动生成电子邮件响应的Deep LSTM模型。

4.Massively Multitask Networks for Drug Discovery:Google与斯坦福大学合作的识别有效候选药的的深度神经网络模型。

5.用于OCR的设备级计算机视觉:基于设备级的计算机视觉模型实现光学字符识别,进行实时翻译。

PyTorch

Torch是一个开源机器学习库、科学计算框架和基于Lua编程语言的脚本语言。

图片

功能

1.一个强大的 n 维数组

2.有很多索引、切片、转换的程序。

3.可使用 LuaJIT编写简单的C扩展。

4.线性代数程序

5.神经网络和基于能量的模型

6.数字优化程序

7.GPU支持,更加快速和高效

8.可嵌入,带有 iOS 和 Android 的后台端口

Torch供 Facebook 人工智能研究小组、 IBM、 Yandex 和 Idiap 研究所使用。现在,它已经扩展到 Android 和 iOS系统上,研究人员也使用Torch来构建硬件实现数据流。

Pytorch是一个Python的开源机器学习库,用于自然语言处理等应用,主要由 Facebook 的人工智能研究小组开发,Uber 的概率编程软件"Pyro"就是在Pytorch上创建的。

Caffe

Caffe是一种清晰而高效的深度学习框架。

图片

Caffe最初由杨庆佳在加州大学伯克利分校读博期间发起,后来由伯克利AI研究公司(BAIR)和社区贡献者联合开发。它主要专注于用于计算机视觉应用的卷积神经网络。对于计算机视觉相关的任务来说,Caffe是一个不错且较为流行的选择,您可以在Caffe Model Zoo上注册,下载很多已经成功建模的模型,直接用于开发。

优点

1.Expressive架构鼓励实用和创新。用配置定义的模型和优化,而不需要硬编码。通过设置单个标志在GPU机器上进行训练,然后部署聚类或移动设备,实现CPU和GPU之间的切换。

2.可扩展代码更有助于开发。在Caffe开发好的的第一年,就有1,000多个开发者分享了出去,对其做了重大贡献。

3.Caffe的高速使理论实验和实际应用得到了完美的结合。Caffe使用单个NVIDIA K40 GPU每天可处理超过6000万张图像。

4.社区:Caffe已经为视觉、语音和多媒体领域的学术研究项目,启动原型,甚至大规模工业应用提供支持。

Apache SystemML

利用大数据进行机器学习的最佳开源工具。

SystemML是由IBM创建的机器学习技术,是Apache中的顶级项目之一,它是一个灵活、可扩展的机器学习系统。SystemML的重要特点如下:

1.使用类R和类Python语言定制算法。

2.有多种执行模式,包括Spark MLContext、Spark Batch、Hadoop Batch、Standalone和JMLC(Java机器学习连接器)。

3.基于数据和聚类特性的自动优化,保证了算法的高效率和可扩展性。

4.将SystemML视为机器学习的结构化查询语言SQL。SystemML的最新版本(1.0.0)支持:Java 8+、Scala 2.11+、Python 2.7/3.5+、Hadoop 2.6+以及Spark 2.1+。

5.可在Apache Spark上运行,在Apache Spark上,SystemML通过逐行查看代码,确保代码是否能够在Apache Spark聚类上运行。

未来对SystemML的开发将包括:使用GPU进行额外的深度学习,例如导入和运行神经网络架构以及用于训练的预训练模型。

SystemML的Java机器学习连接器(JMLC)

Java机器学习连接器(JMLC)API是一种编程接口,它在嵌入式时与SystemML进行交互。JMLC的主要目的是作为一个评分API,其中,评分函数是用SystemML的DML语言表示的。除了评分外,嵌入式SystemML还可在一台机器上运行的更大的应用程序的上下文中,执行聚类等无监督学习任务。

Apache Mahout

Apache Mahout是一个分布式线性代数框架,提供了一些经典的机器学习算法。

Mahout旨在帮助开发人员方便快捷的实现自己的算法。Apache Spark是一种即拿即用的分布式后台,或者也可以将其扩展到其他分布式后台。其特点如下:

1.数学表达Scala DSL。

2.支持多种分布式后端(包括Apache Spark)。

3.包含用于CPU / GPU / CUDA加速的模块化本地求解器。

4.Apache Mahout应用的领域包括:协作过滤(CF),聚类和分类。

功能

1.Taste CF.Taste 是 Sean Owen 在 SourceForge 上发起的一个针对协同过滤(CF)的开源项目,并在 2008 年被赠予 Mahout。

2.支持 Map-Reduce 的集群实现包括 :k-Means、模糊 k-Means、Canopy、Dirichlet 和 Mean-Shift算法等。

3.分布式朴素贝叶斯和互补朴素贝叶斯的分类实现。

4.用于进化编程的分布式适应度函数。

5.矩阵和矢量库。

OpenNN

OpenNN是一个用c++编写的开源类库,它实现了神经网络建模。

Opennn (开放神经网络图书馆)以前被称为Flood,它是以R. Lopez在2008年泰罗尼亚技术大学的博士论文《在工程变分问题的神经网络》为基础开发的。

Opennn使用一组函数实现了数据挖掘,并且,可以使用一个API将这些函数嵌入到其他软件工具中,使软件工具和预测分析任务之间进行交互。Opennn的主要优点就是它的高性能。由于采用c++开发,因此它有更好的内存管理和更高的处理速度,并利用 OpenMP 和 GPU 加速度(CUDA)实现 CPU 并行化。

Opennn包中含有单元测试、许多示例和大量文档。为神经网络算法和应用的研究开发提供了一个有效的框架。神经网络设计是一个基于OpenNN的专业预测分析工具,这就意味着神经网络设计的神经引擎是基于 OpenNN 建立的。

Neuroph

Neuroph是一种用 Java 编写的面向对象的神经网络框架。

Neuroph可用于在Java程序中创建和训练神经网络,它提供了Java类库以及用于创建和训练神经网络的GUI工具easyNeurons。Neuroph是一个轻量级的Java神经网络框架,可用于开发常见的神经网络架构。它包含一个设计良好的开源Java库,其中包含少量与基本神经网络概念对应的基础类。它还有一个很好的GUI神经网络编辑器来快速创建Java神经网络组件。目前,已经在Apache 2.0许可下作为开源发布出来。

Neuroph的核心类与人工神经元、神经元层、神经元连接、权重、传递函数、输入函数和学习规则等基本神经网络概念对应。Neuroph支持常见的神经网络体系结构,例如具有反向传播,Kohonen和Hopfield网络的多层感知器。所有的这些类都可以进行扩展和定制,以自定义创建神经网络和学习规则。Neuroph同时也支持图像识别。

Deeplearning4j

Deeplearning4j是第一个为Java和Scala编写的商业级开源分布式深度学习库。

Deeplearning4j旨在成为顶尖的即拿即用设备,而不是只是做一些配置,这使得非专业人员也能够快速的构建模型。

DL4J可以通过Keras(包括TensorFlow,Caffe和Theano)从大多数主要框架中导入神经网络模型,它为数据科学家、数据工程师和DevOps提供了跨团队工具包,弥合了Python生态系统和JVM之间的障碍。现在,Keras是Deeplearning4j的Python API。

功能

1.分布式 cpu 和 gpu

2.Java, Scala and Python APIs

3.适用于微服务体系结构

4.通过降低迭代次数进行并行训练

5.在Hadoop 上可伸缩

6.在AWS扩展上提供Gpu 支持

1.Deeplearning4J: 神经网络平台

2.ND4J: Numpy for the JVM

3.DataVec:机器学习ETL操作的工具

4.JavaCPP:Java和C ++之间的桥梁

5.Arbiter:机器学习算法的评估工具

6.RL4J:JVM的深度增强学习

Mycroft

Mycroft声称是世界上第一个开源助手,适用于从科学项目到企业软件应用程序的任何事情。

Mycroft可以在任何地方运行——台式计算机上、在汽车内或在树莓派上运行。这是可以自由混合、自由扩展和改进的开源软件。

OpenCog

OpenCog是一个旨在构建开源人工智能框架的项目。

OpenCog是认知算法的多元化组合,每种组合都体现了它们的创新之处。但是,认真遵守认知协同原则才是OpenCog整体架构强大的原因。OpenCog最初是基于2008年“Novamente Cognition Engine”(NCE)发布的源代码。

1.一个图表数据库,它包含术语、原子公式、句子和关系作为超图。

2.一个模理论解算器,作为通用图形查询引擎的一部分,用于执行图和超图模式匹配。

3.一种称为元优化语义进化搜索的概率遗传程序(MOSES),最初由在Google工作的Moshe Looks开发。

4.有一个基于 OpenPsi 和 Unity 的虚拟世界中的交互学习应用体系。

5.有一个由Link Grammar和RelEx组成的自然语言输入系统,它们都采用类AtomSpace来表示语义和句法的关系。

6.有一个称为SegSim的自然语言生成系统,它实现NLGen和NLGen2。

7.Psi 理论的实现,用于处理情绪状态、驱动和冲动,称为 OpenPsi。

**目前主流的是Tensorflow和Pytorch较多,国内的百度飞浆号称中国版TensorFlow也值得关注,百度* 飞浆* 提供了不少应用场景,有利于快速开发

相关 [人工智能 开源 工具] 推荐:

15个顶级的开源人工智能工具

- - 博客园_新闻
artificial intelligence(AI)是科技研究中最热门的方向之一. 像 IBM、谷歌、微软、Facebook 和亚马逊等公司都在研发上投入大量的资金、或者收购那些在机器学习、神经网络、自然语言和图像处理等领域取得了进展的初创公司. 考虑到人们对此感兴趣的程度,我们将不会惊讶于斯坦福的专家在 人工智能报告中得出的结论:“越来越强大的人工智能应用,可能会对我们的社会和经济产生深远的积极影响,这将出现在从现在到 2030 年的时间段里.

热门人工智能开源工具(框架)

- - 掘金 后端
分享一些热门的人工智能开源工具/框架. TensorFlow™是一个开源软件库,最初由Google Brain Team的研究人员和工程师开发. TensorFlow使用数据流图进行数值计算. 图中的节点表示数学运算,边表示它们之间通信的多维数据数组(张量). 其架构灵活,你可以使用单个API将计算部署到桌面、服务器或移动设备中的一个或多个CPU或GPU.

Google 人工智能系统 TensorFlow 开源背后

- - TECH2IPO
Google 周一发布人工智能系统 TensorFlow 并宣布开源,TensorFlow 是 Google 耗费心血开发出了第二代人工智能系统,Google 此举并不像表面看来那么简单. 尽管 Google 宣布 TensorFlow 开源,人人皆可使用,但是 Google 掌握着使其成功的大部分因素:大数据、运行软件的高性能的计算机网络和强大的人工智能专家团队.

10个关于人工智能和机器学习的有趣开源项目

- - 极客521 | 极客521
本文简要介绍了10款    Quora上网友推荐的 人工智能和机器学习领域方面的开源项目. GraphLab是一种新的面向机器学习的并行框架. GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从别的应用程序或者服务中抓取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序.

10款人工智能和机器学习领域方面的开源项目

- - 灯火阑珊
GraphLab是一种新的面向机器学习的并行框架. GraphLab提供了一个完整的平台,让机构可以使用可扩展的机器学习系统建立大数据以分析产品,该公司客户包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它们从别的应用程序或者服务中抓取数据,通过推荐系统、欺诈监测系统、情感及社交网络分析系统等系统模式将大数据理念转换为生产环境下可以使用的预测应用程序.

Java开源建站工具

- Amom - 阮一峰的网络日志
美国程序员Jon Scott Stevens,公布了他的创业公司所使用的开发工具清单. 他的语言平台是Java,开发项目是一个网站(还未上线). 所用到的工具都是开源的,可以免费得到. 在目前的创业者之中,用Java作为网站开发语言的人似乎很少. 这当然不是没有原因的,Java看上去确实不像是最便捷的网站开发工具,给人的感觉是用起来麻烦又费事.

推荐系统开源工具 – SVDFeature

- Roger - Resys China
SVDFeature是我们(上海交大Apex实验室)在参加KDDCUP 2011期间开发的. 通过这个工具,我们和港科大(HKUST)的联合小组InnerPeace在KDDCUP 2011中获得Track 1第三名,并创造单模型最好成绩. 在此分享给大家,并希望和大家有更多的交流. (1)基于feature的可扩展性 —— SVDFeature实现了我们的基础模型feature-based matrix factorization.

Last.fm 开源其 C++ 工具库

- - 博客园_新闻
Last.fm 的音乐信息检索团队近日开源了 moost 工具,这是该团队在产品开发过程中使用的 C++ 实用程序的集合. Last.fm 是 Audioscrobbler 音乐引擎设计团队的旗舰产品,是世界上最大的音乐社交平台,该平台充分利用集体的智慧,通过每个用户的音乐收听情况为其提供个性化推荐、联系品味相近的用户、提供定制的电台广播及更多其他服务.

开源的 Flash swf 反编译工具

- - 鲁塔弗的博客
为了自定义腾讯自选股的flash K线图. 我想弄清楚它如何传输数据的,看起来不想是通过flashvar传入,所以把swf文件download下来,反编译看看代码 ,一目了然啊.. 网上找了一圈swf反编译工具,如下这个可以用. JPEXS Free Flash Decompiler, 百度网盘下载,这是用java开发的开源软件,运行需要先安装jre环境.