1日前
记一次k8s集群内业务问题排查思考
客户反馈某功能页面加载失败,控制台返回500错误。初步排查发现RocketMQ broker频繁重启,怀疑是NFS连接问题导致。通过日志和系统状态分析,推测是网络故障导致存活探针重启容器。需进一步复现环境以确认具体原因。
2月前
Raycast 2025年度总结
由于无法查看图片内容,我无法直接生成摘要。请提供文章的文字内容或描述图片中的信息。
3月前
摸鱼日记:一次常规的小变更,意外踩到了历史粘痰
客户要求将HTTP+IP访问方式改为域名+HTTPS,并使用F5代理。在配置过程中,遇到微服务重启后无法连接ES的问题。经排查发现是防火墙和IPv4转发策略导致跨节点流量被阻止。最终通过修改iptables和sysctl设置解决了网络问题,服务恢复正常。
4月前
记一次出差|Ubuntu20.04离线安装ssh服务器
博主在北京为竞赛场地进行行业软件私有化部署,面对临时搭建的“裸”环境,包括无预置网络、临时网线及租赁设备。第一天完成硬件验证,第二天在网络搭建后进行系统部署,遇到Ubuntu 20.04 LTS未默认携带SSH服务端的问题,通过离线安装OpenSSH服务解决,并成功完成后续部署。
4月前
Mac安装常用中间件客户端(命令行)
本文介绍了使用Homebrew安装MySQL、PostgreSQL、MongoDB、Redis和MinIO的命令行客户端的方法,包括安装命令、配置环境变量、验证安装及连接示例。还提供了交互式别名函数,简化远程数据库和服务的连接过程。
4月前
Helm 实战笔记|单独渲染与调试子 Chart 的几种方法
本文介绍了使用Helm在日常调试中单独渲染与手动更新子Chart或指定模板文件的方法,包括部署、更新、渲染和Dry-Run验证等操作,以及如何在不重新部署整个集群的情况下快速定位配置错误、验证模板逻辑和修复特定资源。
5月前
修复configmap编辑后配置乱码
博主分享了在Kubernetes中编辑ConfigMap时遇到乱码问题的解决方法。原因是行尾多余的空格导致解析错误。通过使用Vim搜索并删除多余空格(`/ \\n`),可以快速恢复配置文件格式。
5月前
赴杭、记一次阿里现场故障处理的出差
博主作为实施运维工程师,记录了处理阿里巴巴私有化环境故障的过程。从周五接到问题到次周通过扩容、修复及文件迁移最终解决,并分享了在阿里总部的见闻与感想。
7月前
MongoDB 集群部署(二进制方式)
在Kylin V10系统下完成MongoDB 4.2集群(1主2从)的非容器化部署。