去追寻生命的自由
Python调用系统命令卡住 Python调用系统命令卡住
简单记录一下问题的排除过程,和对应的处理方式! 今天在 Twitter 上面看到 laixintao 发了一个小心,说的是发现在 Python 程序下直接调用系统命令时,如果返回信息量过大的话,子进程输出信息量 stdout 会把
Linux服务器Swap使用过高 Linux服务器Swap使用过高
简单记录一下问题的排除过程,和对应的处理方式! 收到告警反馈,发现某台服务器上面,swap 内存使用很高,但实际的物理内存使用却不高。随即,登录服务器,查看内存的使用情况和对应的负载情况。 [1] 查看服务器内存使用情况 Swap:
ZFS进程占用大量CPU资源 ZFS进程占用大量CPU资源
写入时复制事务模型/快照与克隆/轻量化文件系统创建 ZFS 是一个拥有逻辑卷管理功能的文件系统,最早源自于 Oracle 为 Solaris 操作系统开发的文件系统。ZFS 具有可扩展性,并且包括大量保护措施防止数据损坏,支持高存储容量
Supervisor日志输出异常 Supervisor日志输出异常
Supervisor是用 Python 开发的在 Linux/Unix 系统下的一个进程管理工具。 用 Supervisor 管理的进程,当一个进程意外被杀死,Supervisor 监听到进程死后,会自动将它重新拉起,很方便的做到进程自
Celery多任务PG卡死问题 Celery多任务PG卡死问题
纸上得来终觉浅,绝知此事要躬行。 Celery 是一个简单、灵活且可靠的,处理大量消息的分布式系统,并且提供维护这样一个系统的必需工具。它是一个专注于实时处理的任务队列,同时也支持任务调度。 1. 报错表象 日志虽然删除了敏感信息,
防止OOM导致服务器卡死 防止OOM导致服务器卡死
Linux 系统下应避免因内存耗尽导致系统 Hang 住或频繁读写 Swap 的情况! **内存不足(OOM)**是计算机操作经常不希望出现的状态,在这种状态下,无法分配其他内存供程序或操作系统使用。这样的系统将无法加载任何其他程序,并
防止服务器重启卡壳 防止服务器重启卡壳
日常使用 Linux 系统,总是能够给我们带来不一样的惊喜! 现在在互联网公司中,很大一部分开发都是使用 Ubuntu 作为主力操作系统,进行日常开发和娱乐的,所以如果遇到机器重启的时候卡住也非常常见,尤其是喜欢尝鲜的 Ubuntu
防止程序OOM时退出 防止程序OOM时退出
Linux 系统上面总有一个小众但神奇的命令! 当物理内存和交换空间不够用时,OOM Killer 就会选择杀死进程,那么它是怎样知道要先杀死哪个进程呢?其实 Linux 的每个进程都有一个 oom_score (位于/proc/&
GitLab异常占用大量内存 GitLab异常占用大量内存
推荐使用 Py-Spy 和 Scalene 这个两个工具进行问题排查。 [1] 问题现象 情况是下面这个样子的: 有一个开发给我们的某一个仓库提交了代码,紧接着没多久,发现我们的 Gitlab 服务和聊天工具均无法正常使用了。登
Chrome非安全端口限制 Chrome非安全端口限制
学好排除问题的方法,有助于提高生产力。 大概中午的时候,XXX 在群里反馈有一个服务通过 Chrome 浏览器无法正常得到服务反馈的 Json 内容,并给出了如下截图。但是通过脚本以及 Postman 等测试工具都是可以正常到的请
Redis输出缓冲区限制问题 Redis输出缓冲区限制问题
学好排除问题的方法,有助于提高生产力。 1. 缓冲区限制修改 你是时候该学习学习 Redis 数据库了! Redis 为了解决输出缓冲区消息大量堆积的隐患,设置了一些自身的保护机制,主要采用以下两种限制措施: 大小限制 当某一客
奇怪的Shell管道返回值 奇怪的Shell管道返回值
学好排除问题的方法,有助于提高生产力。 [1] 问题现象 今天发现 CI 监控发送了一条告警,显示有一个服务的 runtime 镜像打包失败了。通过查看对应自动化工具 GoCD 的 pipeline 的打包日志,并没有发现是因为
1 / 3