数据同步工具 Elasticsearch-datatran v6.2.9 发布

标签: 数据 同步 工具 | 发表时间:2021-04-19 22:33 | 作者:
出处:https://www.oschina.net/news/project

数据同步工具 Elasticsearch-datatran 6.2.9 发布, Elasticsearch-datatran 由  bboss 开源的数据同步迁移工具,支持在Elasticsearch、关系数据库(mysql,oracle,db2,sqlserver、达梦等)、Mongodb、HBase、Hive、Kafka、文本文件、SFTP/FTP多种数据源之间进行海量数据同步;支持日志文件实时增量采集到kafka/elasticsearch/database。

Elasticsearch版本兼容性:支持各种Elasticsearch版本(1.x,2.x,5.x,6.x,7.x,+)之间相互数据迁移

v6.2.9 功能改进

  1. 数据同步改进:完善ip2region和geoip数据库热加载机制

  2. Restclient改进:升级httpcliet组件版本到最新的官方版本4.5.13

  3. Restclient改进:升级fastxml jackson databind版本2.9.10.8

  4. Restclient改进:增加对elasticsearch pit机制的支持,参考用例:

    testPitId方法

    https://gitee.com/bboss/eshelloword-spring-boot-starter/blob/master/src/test/java/org/bboss/elasticsearchtest/springboot/SimpleBBossESStarterTestCase.java

  5. 数据同步工具扩展:增加日志文件采集插件,支持全量和增量采集两种模式,实时采集日志文件数据到kafka/elasticsearch/database

    使用文档: https://esdoc.bbossgroups.com/#/filelog-guide

    日志文件采集插件使用案例:

    1. 采集日志数据并写入数据库
    2. 采集日志数据并写入Elasticsearch
    3. 采集日志数据并发送到Kafka

    之前版本升级6.2.9注意事项,需手动修改增量同步状态表结构,增加下面三个字段:

         status number(1) ,  //数据采集完成状态:0-采集中(默认值)  1-完成  适用于文件日志采集 默认值 0
    filePath varchar(500)  //日志文件路径,默认值""
    fileId varchar(500)  //日志文件indoe标识,默认值""
  6. Restclient改进:设每个elasticsearch数据源默认版本兼容性为7,为了处理启动时无法连接es的情况,可以根据连接的es来配置和调整每个elasticsearch数据源的配置,示例如下: elasticsearch.version=7.12.0

  7. 调整gradle构建脚本语法,保持与gradle 7的兼容性

  8. Restclient改进:elasticsearch节点自动发现和故障节点健康检查后台线程模型调整为daemon模式

  9. http-proxy改进:http-proxy节点自动发现和故障节点健康检查后台线程模型调整为daemon模式

相关 [数据 同步 工具] 推荐:

数据同步工具 Elasticsearch-datatran v6.2.9 发布

- - 开源中国-软件更新资讯
Elasticsearch版本兼容性:支持各种Elasticsearch版本(1.x,2.x,5.x,6.x,7.x,+)之间相互数据迁移. 数据同步改进:完善ip2region和geoip数据库热加载机制. Restclient改进:升级httpcliet组件版本到最新的官方版本4.5.13. Restclient改进:升级fastxml jackson databind版本2.9.10.8.

数据同步工具之FlinkCDC/Canal/Debezium对比-技术圈

- -
数据准实时复制(CDC)是目前行内实时数据需求大量使用的技术,随着国产化的需求,我们也逐步考虑基于开源产品进行准实时数据同步工具的相关开发,逐步实现对商业产品的替代. 本文把市面上常见的几种开源产品,Canal、Debezium、Flink CDC 从原理和适用做了对比,供大家参考. 本文首发微信公众号《import_bigdata》.

开源实时数据同步工具NiFi

- - 标点符
Apache NiFi 是一个强大的数据流管理和自动化工具,旨在简化数据的采集、传输、处理和分发. 它特别适合于构建和管理复杂的数据流管道,支持从各种数据源到不同目标系统的数据传输. Apache NiFi主要功能. Apache NiFi 是一个用于自动化数据流的强大工具,具有广泛的功能集,旨在支持从各种数据源到不同目标的复杂数据流管道.

Altsync – 同步多台电脑间的 Outlook 数据文件夹 | 小众软件 > 网络工具

- 淼 - 小众软件
Altsync 可以同步多台电脑间的 Outlook 数据文件夹,无需额外服务器,设置简单. Gmail 等网页版电子邮件服务让邮件随时保持在云端,但依旧使用 Outlook 做为邮件客户端的同学大有人在. Altsync 可以帮助你同步多台电脑间的 Outlook 所有类型数据文件夹(日历,联系人,电子邮件,日记,笔记和任务),免费版可以同步四个文件夹.

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

- - agapple
   08年左右,阿里巴巴开始尝试MySQL的相关研究,并开发了基于MySQL分库分表技术的相关产品,Cobar/TDDL(目前为阿里云DRDS产品),解决了单机Oracle无法满足的扩展性问题,当时也掀起一股去IOE项目的浪潮,愚公这项目因此而诞生,其要解决的目标就是帮助用户完成从Oracle数据迁移到MySQL上,完成去IOE的第一步. .

同步mysql数据到hive

- - ITeye博客
地址为:http://archive.cloudera.com/cdh/3/下载相应版本,如sqoop-1.2.0-CDH3B4.tar.gz. 地址为:http://archive.cloudera.com/cdh/3/,版本可以为hadoop-0.20.2-CDH3B4.tar.gz. 3.解压 sqoop-1.2.0-CDH3B4.tar.gz ,hadoop-0.20.2-CDH3B4.tar.gz 到某目录如/home/hadoop/,解压后的目录为.

Firefox书签同步工具Xmarks

- Carl.King - 月光博客
  前段时间Xmarks被解封,使得这个优秀的浏览器书签同步工具得以重新在国内使用,我们知道,Google Chrome浏览器自带书签同步功能,IE浏览器可以通过Dropbox实现书签同步,而对于Firefox浏览器来说,最好用的书签同步工具无疑是Xmarks.   Xmarks是一款用于书签备份以及自动同步本地书签到服务器端的Firefox扩展,当我们使用多台电脑的Firefox浏览器的时候,只要在各个浏览器安装Xmarks扩展并登录,就可以自动同步Firefox书签,和Dropbox一样方便.

高速数据同步服务器——Doozer

- Tim - Some reminiscences, some memories
昨天在讨论平台新架构的时候,还在说要搞个配置管理的服务出来,方便接口的管理. 然后今天就看到了这个……人品爆发了吗. 好吧,不扯淡,直接翻译 Doozer 的 README 吧. Doozer 我还没实测,不过感觉,如果真得像 README 上面说得那样,还是很有用,很有用的. 关键——这个玩意提供了 go 的接口.

MySQL数据库设置主从同步

- - CSDN博客架构设计推荐文章
MYSQL主从同步是目前使用比较广泛的数据库架构,技术比较成熟,配置也不复杂,特别是对于负载比较大的网站,主从同步能够有效缓解数据库读写的压力. 1、可以作为一种备份机制,相当于热备份. 2、可以用来做读写分离,均衡数据库负载. 1、主从数据库版本一致,建议版本5.5以上. # 日志文件名 log-bin = mysql-bin # 日志格式,建议mixed binlog_format = mixed # 主数据库端ID号 server-id = 1.