Drill:企业级Hadoop和NoSQL的SQL查询引擎
Apache的Drill是一个开源的,用于Hadoop和NoSQL的低延迟SQL查询引擎。
现代大数据的应用,如社交,移动互联网,互联网和物联网有着大量的用户,比传统的事务应用程序更大的数据量。这些应用程序相关的数据集的发展非常迅速,往往是自我描述,可以包括复杂的类型,比如JSON,和Parquet。 Apache的Drill从底层建立了可伸缩性地提供低延迟查询对这种快速发展的多结构化数据集。
零日分析及快速应用开发
Apache的Drill可以直接查询自我描述和半结构化数据文件(如JSON,,Parquet)和HBase表,而无需定义和维护架构的集中存储,如Hive里metastore。这意味着用户可以在线探索数据,而以前需要数据准备,建模,ETL和随后的管理模式花费数周或数月时间。
专为半结构化/嵌套数据
Drill提供了一个像JSON般的内部数据模型来表示和处理数据。这个数据模型的灵活性允许Drill查询,不压扁,既简单又复杂/嵌套数据类型以及不断变化的常见于Hadoop/ NoSQL的应用程序驱动的模式。Drill还提供了直观的扩展SQL复杂/嵌套数据类型的工作。
与现有的SQL环境的和Apache Hive兼容
使用Drill,企业可以最大限度地降低转换成本和学习曲线,为用户提供熟悉的ANSI SQL语法。分析师可以继续使用该工具并自动生成ANSI SQL代码,通过利用Drill公开标准的JDBC/ ODBC接口使用Hadoop数据交互和熟悉的BI /分析工具。用户还可以通过即插即用使用Hive环境,低延迟的即席查询现有的Hive里表和重用Hive里的元数据,数以百计的文件格式和UDF开箱。
转载请保留原文链接
SourceForge上的FileZilla是个恶意软件
SourceForge上actioncheese评论道:
SourceForge下载的 FileZilla FTP 软件中发现包含多个恶意软件,其中包括isearch.omiga-plus.com浏览器劫持。虽然容易清除,它改变了你的默认主页设置,并添加主页地址到浏览器图标的目标地址。我希望一个狡猾的下载网站的行为,不是来自Sourceforge。 FileZilla是伟大的软件,我以前极力推荐:) 不过这个评论仍然得到一个1星的话我必须得卸载它。
也有网友说:“我没有注意到不好的评论,因为几个月前,我下载它安装在一台电脑,并且安装得很顺利。我重新启动Windows后,每次我连接到互联网,我的Windows就死机,而且没有办法恢复正常。我不确定FileZilla是否被SourceForge强制使用坏的安装程序,因为我从SourceForge下载其他程序的安装程序,一切都进行得很顺利。”
FileZilla是一种快速、可信赖的FTP客户端以及服务器端开放源代码程序,具有很多丰富的功能。
FileZilla在2003年11月获选为SourceForge.net当月最佳推荐项目
FileZilla功能有:
- 可以断点续传进行上传、下载(需要服务器支持)
- 自定义命令
- 可进行站点管理
- 防超时功能(有的FTP服务器会将超时过久的用户赶出,这样超时的用户就得重复登录)
- 超时侦测
- 支持防火墙
- 支持SOCKS4/5、HTTP1.1代理
- 可进行SSL加密连接
- 支持SFTP(Secure FTP)
- 可以排队进行上传、下载
- 支持拖放
- 多国语言支持,包括简体、繁体中文(Linux平台需额外安装“filezilla-locales”包)
- 可通过Kerberos进行GSS验证与加密
转载请保留 原文地址
Hue ——一个用于Apache Hadoop大数据分析的Web界面应用
Hue是一个用于Apache Hadoop分析数据的Web界面。它支持文件和作业浏览器,Hive,Pig,Impala,Spark,Oozie的编辑器,Solr的搜索仪表板,HBase,Sqoop2,等等。
Hue官方网站:http://gethue.com
它的特点:
- 文件浏览器用于访问HDFS
- 编辑器开发和运行Hive查询
- 搜索应用程序查询,探索,可视化数据和仪表板使用Solr
- Impala应用程序执行交互式SQL查询
- Spark编辑器和Dashboard
- Pig编辑器提交Pig脚本
- Oozie的编辑器和Dashboard提交和监控工作流程,协管员和调度
- HBase浏览器的可视化,查询和修改HBase的表
- 用于访问Hive元数据和HCatalog 的Metastore浏览器
- 作业浏览器用于访问MapReduce作业(MR1/ MR2-YARN)
- 作业设计器用于创建MapReduce/流/ Java的作业
- 一个Sqoop2编辑器和Dashboard
- ZooKeeper浏览器和编辑器
- 一个DB查询编辑器可用于MySQL,Postgres,SQLite和Oracle
- 最重要的是,一个SDK可用于创建集成Hadoop的新的应用程序。