工商银行打造在线诊断平台的探索与实践

- - DockOne.io

作者 | 刘慕雨中国工商银行软件开发中心云计算实验室. 在信息系统建设方面，工商银行一直积极探索，以开放的姿态借鉴行业先进经验，旨在为客户提供更优质的金融服务和用户体验. 随着分布式架构和云计算平台在工行的广泛应用，如何高效排查程序错误或性能瓶颈，是个棘手的问题. 为此，我们基于 Arthas 建设了在线诊断平台，在保护客户信息安全的原则基础上，对相关能力做了剪裁和整合，通过 Web 方式支持更复杂的交互场景，在实际线上问题分析中发挥关键作用.

大型系统在线问题诊断与定位

- - 掘金架构

本文是武汉 gopher meetup 的分享内容整理而成，分享内容在 “无人值守” 的两篇和其它社区分享中亦有提及. (也就是说你看过那两篇，这个可以不用看了). 混口饭吃也是不容易，既然有问题了，我们还是要解决的. 要先看看有没有现成的思路可以借鉴. Google 在这篇论文里提到过其内部的线上 profile 流程：.

工商银行神秘技术故障引发恐慌

- - Solidot

中国最大国有银行工商银行的柜面取款、ATM、网银等服务周日中断近一个小时，引发了客户恐慌和诸多猜测，其中包括黑客攻击，以及银行为紧缩银根而有意为之. 国家电视台CCTV声称工行技术故障导致服务中断45分钟. 工商银行则通过官方微博表示，计算机系统从上午10:38开始升级，造成部分业务受到影响，到11:23所有服务已经全部恢复.

工商银行MySQL数据库架构解密

- -

点击▲关注 “IT168企业级”给公众号置顶. 作者：林承军编辑：爱可生. 摘要：本文根据DTCC数据库大会分享内容整理而成，将介绍工行 IT 架构转型中传统 OLTP 数据库架构面临的挑战和诉求，构建基于 MySQL 分布式企业级解决方案实践历程，包括技术选择、高可用设计、两地三中心容灾、运维管理、资源使用效率等方面的思考和实践经验，同时也介绍了工行转型的成效以及对后续工作的一些思考.

中国工商银行DevOps工具链建设之路

- - DockOne.io

【编者的话】新技术发展迅猛，金融产品和服务模式创新加快，快速增长的产品需求与有限研发资源之间的矛盾长期存在. 如何提高研发效能，快速上线业务需求，支撑业务创新发展，是金融机构产品研发部门面临的挑战. 传统银行的产品、架构体系庞大复杂，对研发效能提升带来更大挑战，无论流程改进还是工具支撑，都需兼顾现有系统的安全稳定运行.

工商银行分布式服务 C10K 场景解决方案

- - DockOne.io

来源 | 阿里巴巴云原生公众号. Dubbo 是一款轻量级的开源 Java 服务框架，是众多企业在建设分布式服务架构时的首选. 中国工商银行自 2014 年开始探索分布式架构转型工作，基于开源 Dubbo 自主研发了分布式服务平台. Dubbo 框架在提供方消费方数量较小的服务规模下，运行稳定、性能良好.

Service Mesh 在中国工商银行的探索与实践

- - DockOne.io

微服务架构是当今互联网和金融机构渐趋主流的系统架构模式，其核心是集成服务通信、服务治理功能的服务框架，微服务框架在持续演进同时，服务网格（Service Mesh）作为一种新型的微服务架构，因架构灵活、普适性强，被认为具有较好发展前景. 中国工商银行（后简称工行）主动探索服务网格领域，从 2019 年开始服务网格技术预研工作，通过对服务网格技术深入研究和实践后，于 2021 年建设了服务网格平台.

中国工商银行银行卡被盗用后，处理过程实录

- Nickcheng - 博客园-Duiker's Blog

最近发现自己工商银行的银行卡消磁了，所以去工商银行的换张卡，结果发生了一连串杯具. 换完卡，查询了一下余额，发现少了几千块，打印详单吧，确认是被盗用了，联系工行，打110报警，结果步步都是个坎，看来老百姓别没事麻烦这些大爷. 续1：在工行详单中通常会打印出所在的地区号和网点号，但是对于普通老百姓来说，给出的这些数字，你想了解到底是在那个地方被盗刷了，您就得打95588这个电话了，发生问题的两笔业务的地区号分别是4600和4000，查询后确认分别是北京和深圳.

如何诊断CDN故障

- - 火丁笔记

某项目使用CDN做文件下载服务，最近不时有网友反馈下载出错，因为CDN是第三方提供的，且节点众多，所以诊断起来有点麻烦，必须想想招儿. 首当其冲的问题是如何确认CDN有哪些节点. 幸运的是通过阿里测提供的服务，我们能拿到这个IP列表，当然这个IP列表不可能百分百完整，不过应该包含了大部分的节点，有兴趣的可以参考百度的JQuery CDN例子.

JVM诊断调优CheatSheet

- - ImportNew

使用top去获取进程cpu使用率；使用/proc文件查看进程所占内存. 查看类的一些信息，如字节码的版本号、常量池等. 查看进程的gc情况. jstat -gcutil [pid] (显示总体情况). jstat -gc [pid] 1000 10（每隔1秒刷新一次一共10次）. 查看jvm内存使用状况.

工商银行打造在线诊断平台的探索与实践

传统方式排查问题的痛点

Arthas 的解决方案

落地使用上的困难

技术方案

1. 整体架构

1）在线诊断平台

2）在线诊断网关

3）在线诊断进程

2. 诊断过程详解

1）诊断前准备

2）开始安装

3）获取安装介质

4）启动诊断程序

5）使用和卸载

实际使用效果

1. 控制面板

2. 线程清单

3. 方法监测

1）方法观测

2）方法追踪

3）方法追溯

4）方法监控

4. 反编译

5. 其他能力

回顾与展望

Arthas 有奖征文正在进行中！

相关 [工商银行在线诊断] 推荐：