英特尔推出用于Apache Spark的深度学习库

标签: tuicool | 发表时间:2017-02-10 08:00 | 作者:
出处:http://itindex.net/admin/pagedetail

英特尔今天宣布推出开源 BigDL,一个用于 Apache Spark 开源集群计算框架的分布式深度学习库。

深度学习库是英特尔公司在行业中实现最先进的人工智能战略的一部分。在去年 11 月宣布的公司战略,详细介绍了英特尔所做的工作——通过旗下的人工智能学院(Intel® Nervana™)使人工智能训练和工具被更广泛的开发人员所获取。

BigDL 具有基于 Spark 架构的高效大规模分布式深度学习库,使大数据用户和数据科学家更容易获得深度学习。BigDL 使得 AI 专家能够像在数百个领域的数千个应用程序中工作的数据科学家一样研究数据。

BigDL 还可以作为用于数据存储、处理和挖掘、特征工程以及机器和深度学习工作量等的统一数据分析平台(Hadoop / Spark)。它允许开发人员将深度学习应用程序编写为在现有 Spark 或 Hadoop 集群之上运行的标准 Spark 程序,以使深度学习工作量与他们使用的数据更直接地接触。BigDL 已经在 Databricks Spark 平台上运行。

英特尔软件与服务部高级副总裁兼总经理 Doug Fisher 说:「BigDL 是一个开源项目,我们鼓励所有开发人员在 BigDL Github 上与我们联系,采样代码并为项目做出贡献。」

BigDL:在 Apache Spark 上的分布式深度学习

BigDL 是一个为 Apache Spark 而建的分布式深度学习库;通过 BigDL,用户能够以标准的 Spark 程序编写深度学习应用,并能直接在现有的 Spark 或 Hadoop 集群上运行。

丰富的深度学习支持。BigDL 是在 Torch 之后搭建的模型,为深度学习提供全面支持,包括经由 Tensor 的数字计算和高级神经网络;此外,用户还可以通过使用 BigDL 把 Caffe 或 Torch 里预训练的模型加载到 Spark 程序中。

极其完美的运行表现。为了获取非常好的运行表现,在每个 Spark 任务中 BigDL 使用因特尔 MKL 和多线编程。因此,在单个节点的至强(Xeon,与主流 GPU 比较)处理器上的处理比即用部署的开源框架 Caffe、Torch 以及 TensorFlow 有量级上的提升。

高效的横向扩展性能。BigDL 能高效的进行横向扩展从而实现大数据的数据分析,通过发布 Apache Spark(快如闪电般的分布式数据处理框架),以及 Spark 上有效实施的同步 SGD 和全局归约交流机制。

为什么是 BigDL?

你也许想用 BigDL 写一些深度学习程序如果:

  • 你想要在存储数据(例如 HDFS,HBase,Hive 等)的相同大数据(Hadoop / Spark)集群上分析大量数据。

  • 你想要为你的大数据(Spark)程序和/或工作流程添加深度学习功能(训练或预测)。

  • 你想要利用现有的 Hadoop / Spark 集群来运行深度学习应用程序,然后可以与其他工作量(例如 ETL、数据仓库、特性工程、经典机器学习、图形分析等)动态共享。

怎样使用 BigDL?

  • 想学习如何安装和搭建 BigDL(Linux 和 macOS 上的安装),你可以查阅构建文档(Build Page)。链接:https://github.com/intel-analytics/BigDL/wiki/Build-Page

  • 想学习如何运行 BigDL 程序(运行一个局部 Java 程序或者 Spark 程序),你可以查阅开始指导页面(Getting Started Page)。链接:https://github.com/intel-analytics/BigDL/wiki/Getting-Started

  • 想在 EC2 上尝试使用 BigDL,你可以查阅在 EC2 上运行的页面(Running on EC2 Pages)。链接:https://github.com/intel-analytics/BigDL/wiki/Running-on-EC2

  • 想在几分钟内学到如何通过 BigDL 创建实用的神经网络,你可以查阅教程页面(Tutorial Page)。链接:https://github.com/intel-analytics/BigDL/wiki/Tutorials

更多细节内容,可以在说明文档中查阅(Documents Page),说明文档包含教程、范例、编程指南等内容。链接:https://github.com/intel-analytics/BigDL/wiki/Documents

支持

  • 你可以加入 BigDL 谷歌网上论坛(https://groups.google.com/forum/#!forum/bigdl-user-group)(或订阅邮件列表:[email protected])以获得更多关于 BigDL 的问题和讨论。

  • 你可以在问题页面上发布错误报告和功能请求。

GitHub 资源:https://github.com/intel-analytics/BigDL

相关 [英特尔 推出 apache] 推荐:

英特尔推出用于Apache Spark的深度学习库

- - IT瘾-tuicool
英特尔今天宣布推出开源 BigDL,一个用于 Apache Spark 开源集群计算框架的分布式深度学习库. 深度学习库是英特尔公司在行业中实现最先进的人工智能战略的一部分. 在去年 11 月宣布的公司战略,详细介绍了英特尔所做的工作——通过旗下的人工智能学院(Intel® Nervana™)使人工智能训练和工具被更广泛的开发人员所获取.

携手腾讯,英特尔推出“智能家庭网关”解决方案

- - 穿过记忆的河流
携手腾讯,英特尔推出“智能家庭网关”解决方案. 2014-10-31 纪佳鹏 21世纪经济报道. 导读:腾讯智能硬件开放平台,拥有庞大的用户基数及开发者,腾讯账号足以影响数以亿计的用户与设备之间的关联网络,为智能硬件的应用形式提供很多可能. 10月30日,在2014腾讯全球合作伙伴大会上,英特尔联合腾讯共同推出了软件、硬件一体化的智能家庭网关解决方案.

Apache Shiro 介绍

- - CSDN博客推荐文章
什么是Apache Shiro?. Apache shiro 是一个强大而灵活的开源安全框架,可清晰地处理身份认证、授权、会话(session)和加密. Apache Shiro最主要的初衷是为了易用和易理解,处理安全问题可能非常复杂甚至非常痛苦,但并非一定要如此. 一个框架应该尽可能地将复杂的问题隐藏起来,提供清晰直观的API使开发者可以很轻松地开发自己的程序安全代码.

Apache Derby Papers

- -
Derby Type System (Note: if your browser shows HTML source for this page instead of displaying it, save the file locally with . It will prompt you to click on "Grant license to ASF for inclusion in ASF works", and this is the permission we need in place to host your contribution on the Derby web site..

英特尔开源Cilk Plus

- tinda - Solidot
英特尔宣布开源Cilk Plus C和C++语言并行编程扩展. Cilk多线程编程技术最早由MIT开发,是一个基于Gcc编译器的开源项目. 后来开发者创建了一个创业公司,推出改进的私有版本,整合到Windows下的多种编译器中. 之后它被英特尔公司收购,整合进英特尔的编译器中. 现在,它再次成为一个开源项目,成为Gcc 4.7下的一个分支.

Apache防止攻击

- - 小彰
为了防止恶意用户对Apache进行攻击,我们需要安装mod_security这个安全模块. mod_security 1.9.x模块的下载与安装. 下载地址: http://www.modsecurity.org/download/index.html. 建议使用1.9.x,因为2.x的配置指令与1.x完全不同,解压后进入解压目录,执行:.

Apache OpenOffice 3.4发布

- - Solidot
Apache OpenOffice的第一个版本v3.4正式发布. 主要新特性包括:改进ODF支持,包括ODF 1.2加密选项和新电子表格功能;改进Calc组件的数据透视表(Pivot Table)支持;原生支持SVG,增强图形如线帽和剪切变形;简体和繁体中文等原生语言支持;改进性能等. 在甲骨文将OpenOffice.org捐给Apache软件基金会后,OOo的命运曾存在许多争议.

Apache PDFBox 1.8.0 发布

- - 开源中国社区最新新闻
Apache PDFBox 1.8.0 发布了,该版本除了修复大量 bug 之外,还包含如下新特性:. PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具. PDF 文档加密与解密. 与 Lucene搜索引擎的集成. 填充PDF/XFDF表单数据.

Apache Log4j 2.0介绍

- - CSDN博客推荐文章
Apache Log4j 2.0介绍. 作者:chszs,转载需注明. 作者博客主页:http://blog.csdn.net/chszs. Apache Log4j是著名的Java日志框架之一,在早些年应用最广. 但近两年来,随着SLF4J和LogBack的兴起,很多流行的开源框架在日志模块方面逐步转移到SLF4J+LogBack上,Log4j日渐衰落.

Apache 的 MaxClients 與 MaxRequestsPerChild

- - SSORC.tw
對於 Apache 架設的伺服器,在遇到連線數問題上,以下參數是會考慮微調的. 不過遇到多個 VirtualHost 與連線變多時,需要適時調整. ServerLimit 與 MaxClients 是針對同時間最大連線數為多少,也等於是 Apache 程序數量,ps 一下就會有多少個 /usr/sbin/httpd 等.