一次线上问题排查所引发的思考

- - crossoverJie's Blog

之前或多或少分享过一些内存模型、对象创建之类的内容，其实大部分人看完都是懵懵懂懂，也不知道这些的实际意义. 直到有一天你会碰到线上奇奇怪怪的问题，如：. 线程执行一个任务迟迟没有返回，应用假死. 接口响应缓慢，甚至请求超时. 这类问题并不像一个空指针、数组越界这样明显好查，这时就需要刚才提到的内存模型、对象创建、线程等相关知识结合在一起来排查问题了.

思考系统API设计的问题

- edware_love - C++博客-首页原创精华区

最近正好在思考系统API设计中考量的一些问题，. 我现在的理解是这样的，假设有巨大的真实内存. windows首先将高2G的内存自己占了，用作各种内核对象. 这2G内存共享给每个进程，但进程不能直接访问，只能通过windows给定的函数访问. : 然后每个进程都给他2G内存，进程如果创建自己的对象就放到自己那2G内存里面，如果要建立内核对象就放到共享的那高2G里面去.

要找出答案，或需暂停对问题的思考

- 无 - 译言-每日精品译文推荐

你是否也曾有过遗失了钥匙，急切想找到它们却无果，但当你不在去找时，反而意外地找到了它们. 不知为何，一旦你停止了寻找，无需刻意地，你的大脑便开始把零碎的线索一一拼凑起来. 事实证明创新的过程有时也是如此. 如果你困在一个问题里无法找出答案，你所能做的一件最好的事便是暂时转移注意力. 不但要移开目光，还要真的是把注意力转移开.

在最近的一个作品中，在使用 opacity 属性来实现页面整体透明的时候，发现了一个问题. 如果两个层发生了重叠，使用了 opacity 属性并且属性值小于1的层，会覆盖掉后面的层. 于是动手做了个实验，来验证 opacity 的层次. 网页中的层叠规律是这样的：如果两个层都没有定义 position 属性为 absolute 或者 relative 属性，哪个层的HTML代码放在后面，哪个层就显示在上面.

系统设计典型问题的思考

- - 四火的唠叨

最近我老婆在找工作，于是我也一起学习了一些系统设计的知识，这里总结典型的思路和题目. 首先，反复沟通和澄清系统需求. 只有把需求澄清清楚了，才可以开始思考并落到纸面上. 但是需求的沟通应该是持续和循序渐进的，问题很难从一开始就思考全面. 其次，尝试抽象一个简单的模型，从简单模型开始，思考不同的场景和约束，逐步完善.

或许你从小就一直在思考的两个算术问题

- 依云 - Matrix67: My Blog

你是否很小就注意到了下面这两个有趣的算术现象. 这两个简单的算术谜题是否一直都困扰着你. 今天，大家终于有机会解开谜团了. 问题一： 2 加 2 等于 4 ， 2 乘 2 也等于 4. 还有其它的整数对，它们的和与积也相等吗. 我们要求的就是 mn = m+n 的整数解. 由于 m 、 n 都是整数，因此 m - 1 和 n - 1 也都是整数.

线上性能问题初步排查方法

- - 并发编程网 - ifeve.com

有时候有很多问题只有在线上或者预发环境才能发现，而线上又不能Debug，所以线上问题定位就只能看日志，系统状态和Dump线程，本文只是简单的介绍一些常用的工具，帮助定位线上问题. 1: 首先使用TOP命令查看每个进程的情况，显示如下：. 我们的程序是Java应用，所以只需要关注COMMAND是Java的性能数据，COMMAND表示启动当前进程的命令，在Java进程这一行里可以看到CPU利用率是300％，不用担心，这个是当前机器所有核加在一起的CPU利用率.

线上存储服务崩溃问题分析记录

- - codedump

上周我们的存储服务在某个线上项目频繁出现崩溃，花了几天的时间来查找解决该问题. 由于问题在线上发生，较难重现，首先想到的是能不能加上更多的信息，在问题出现时提供更多的解决思路. 首先，我们的代码里，在捕获到进程退出的信号比如SIGABRT、SIGSEGV、SIGILL等信号时，会打印出主线程的堆栈，用于帮助我们发现问题.

不改一行代码定位线上性能问题

- - crossoverJie's Blog

最近时运不佳，几乎天天被线上问题骚扰. 前几天刚解决了一个 HashSet 的并发问题，周六又来了一个性能问题. 我们提供出去的一个 OpenAPI 反应时快时慢，快的时候几十毫秒，慢的时候几秒钟才响应. 由于这种也不是业务问题，不能直接定位. 所以尝试在测试环境复现，但遗憾的测试环境贼快. 中途有抱着侥幸心里让运维查看了 Nginx 里 OpenAPI 的响应时间，想把锅扔给网络.

线上服务请求慢问题排查

- - 掘金后端

收到测试的消息，项目页面打开很慢. 查看线上JVM监控平台，发现每分钟由于GC暂停的时间 30~50s. jstat -gccause pid time，发现老年代的占比一直在99%左右，并且发生full gc之后，变化很小. 然后，查看线上gc日志，发现老年代的空间在full gc 前后基本无变化.

一次线上问题排查所引发的思考

前言

生产现象

定位问题

解决办法

本地模拟

内存分析

更多建议

总结

号外

相关 [线上问题思考] 推荐：