星途物语 星途物语
首页
  • 随手记录
  • 故障处理
  • Nginx
  • MySQL
  • Ansible
  • Nexus
  • Tomcat
  • Docker
  • Zabbix
  • Prometheus
  • Git
  • GitLab
  • Jenkins
  • Kubernetes
  • Shell
  • Python
  • 圈圈空间
  • 做饭这件事
收藏站点
留言板
归档
GitHub (opens new window)

星途物语

尚记时,记之
首页
  • 随手记录
  • 故障处理
  • Nginx
  • MySQL
  • Ansible
  • Nexus
  • Tomcat
  • Docker
  • Zabbix
  • Prometheus
  • Git
  • GitLab
  • Jenkins
  • Kubernetes
  • Shell
  • Python
  • 圈圈空间
  • 做饭这件事
收藏站点
留言板
归档
GitHub (opens new window)
  • 随手记录

    • QPS优化记录
    • 阿里云SLB演示
    • DDOS预防
    • Linux内核优化
    • rsync同步守护进程
    • NFS文件同步
    • Tomcat升级
    • 编译安装mysql后添加到systemd管理
    • 防火墙笔记
    • python自动化巡检服务器
  • 故障处理

    • 处理防MIME攻击后出现的问题解决
  • MySQL学习笔记

    • MySQL5.7安装
    • MySQL常用操作语句
    • MySQL主从架构实施
    • MySQL主主架构实施
    • MySQL MHA高可用实施
    • MyCat读写分离
    • MySQL创建用户时的授权
    • MySQL备份
    • MySQL通配符
  • Nginx学习笔记

    • 状态码含义
    • 匹配优先级
    • Nginx常用操作
    • 添加第三方模块
    • 关于路径匹配
    • 转发和重写
    • 内置变量
    • Nginx配置文件结构
  • Tomcat学习笔记

    • 部署Tomcat
    • 修改发布目录
    • Tomcat调优
  • Redis学习笔记

    • 通过 tar.gz 包安装部署 redis
    • redis 配置文件
    • 哨兵集群
    • redis常用命令
    • 虚拟机安装 redis.tar.gz 遇到的问题
  • Ansible学习笔记

    • 部署和使用 ansible
    • ansible 自带的密码认证参数
    • 批量免密操作:批量分发公钥
    • 配置主机清单
    • ansible 小知识
    • 模块介绍
    • 剧本
    • 一键部署 rsync 环境
    • 批量安装一个tomcat
    • 批量安装一个nginx
    • 批量安装 zabbix-agent
  • Zabbix学习笔记

    • 部署 zabbix 服务端、客户端
    • 自定义监控
    • 触发器
    • 监控项类型
    • 简单检查模式
    • zabbix web 界面结构信息
    • 邮件报警
    • 微信报警
    • snmp 监控网络设备
    • 部署 zabbix 服务端、客户端
    • jmx 监控 java 应用
    • ipmi 监控硬件
    • 自动化注册
    • 监控项的主要项和相关项
    • percona 监控 mysql
  • Git学习笔记

    • 配置 git
    • 常用命令
  • GitLab学习笔记

    • 环境准备
    • 安装 gitlab
    • gitlab 忘记 root 管理员密码的处理办法
  • Jenkins学习笔记

    • 安装部署
    • jenkins 使用脚本完成项目构建
    • jenkins 自动构建最新项目
    • 将 jenkins 自动部署的结果返回给 gitlab
    • jenkins 上线 java 项目
    • jenkins pipeline
  • Docker学习笔记

    • 安装 docker
    • 配置 docker 源
    • docker 中的常见名词
    • 镜像管理命令
    • 容器管理命令
    • 创建容器
    • 数据卷
    • docker network
    • 搭建 LNMP
    • Dockerfile
    • Dockerfile 搭建 tomcat
    • docker 镜像磁盘扩容
    • docker composer
    • Harbor 私有镜像仓库
    • docker 面试题
    • docker desktop 运行时与虚拟机冲突
    • docker离线安装
  • Nexus学习笔记
  • Prometheus学习笔记

    • 核心组件
    • 工作原理
    • 安装和配置
    • 启动 Prometheus
    • PromQL 使用
    • 数据模型
    • Exporter
    • 演示服务
    • Grafana 数据可视化
    • Prometheus 告警
  • Kubernetes学习笔记

    • K8S的介绍
    • K8S集群环境的搭建
    • K8S资源管理
    • K8S的实战入门
  • 运维
  • 随手记录
星途物语
2025-01-01

QPS优化记录

公司接到了一个项目、要求项目 QPS 在 2500 以上,给了 14 台服务器部署,还派了一个验收员来检测系统是否达标,这个项目是用 nginx,weblogic,oricle,压测是使用的 loadranner,oricle 使用的是 rac 集群,由于大家不太熟悉,所以请了一位 DBA 外援

项目部署好后,进行压测,QPS 400 都没有,报了大量的网络错误

有两种错误:Connection timed out;Read timed out

当去查看后端服务和日志时,好像也没什么请求进来

总结之前的经验,我是这样来排错的:

1.频繁 GC 导致 JVM 进程暂停,暂停期间请求失败了,修改 JVM 参数 -xmx,-xms,但是提高了最大/小堆内存后 QPS 还是和之前一样,排查 JVM 配置问题

2.weblogic 线程池配置数量不够,导致请求无法处理,提高线程池最大线程数

3.nginx 配置修改(运维老大觉得是 nginx 的问题,重新编译了 nginx,但是 QPS 还是没有什么提升)

4.后来翻阅很多资料,用 netstat 统计 tcp 连接状态,发现很多 syn 半连接,在 /etc/sysctl.conf 中查看 tcp 半连接和全连接配置数发现都比较少,然后修改为合适量,改完后发现 QPS 上去了

netstat -an | awk '/tcp/ {print $6}' | sort | uniq -c | awk '{print $2, $1}' netstat -an | awk '/tcp/ {status[$6]++} END {for (s in status) print s, status[s]}'

vim /etc/sysctl.conf net.ipv4.tcp_max_syn_backlog = 8192 # 半连接优化 net.core.somaxconn = 8192 # 全连接优化

总结:linux 在处理 tcp 连接时,在接受到 syn 时,会将连接放入半连接队列中,再接收到 ack 时,会将连接放入全连接队列中,当半连接队列满时,会丢弃新收到的 syn,从而导致 Connection timed out 错误,当全连接队列满时,会丢弃 ack,从而出现 Read timed out 错误,这也是为什么服务端没接受到多少请求,因为连接都建立失败了吗,在修改完内核参数更新配置后 QPS 就上去了

#随手记录
阿里云SLB演示

阿里云SLB演示→

Theme by Vdoing | Copyright © 2025-2025 | 鄂ICP备2024086820号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式