1.
概述与准备工作
操作前准备:备份配置与数据,记录公网IP与管理端口;
环境检查:确认是否为“免备案”节点,准备好SSH/控制台账号与二次验证手段。
2.
网络连通性快速检查
步骤:1) 本地ping目标IP,确认丢包与延迟:ping -c 10 IP;
2) 路径跟踪:traceroute IP,定位丢包或高延迟跳点;3) 端口连通:telnet IP PORT或nc -vz IP PORT,检查管理端口是否可达。
3.
带宽与流量异常排查
步骤:1) 使用iftop或nload实时查看流量:apt/yum安装后运行;
2) 使用vnstat查看历史流量,确认是否为短时DDoS;3) 若有异常IP,记录并临时封禁iptables -I INPUT -s 攻击IP -j DROP。
4.
服务进程与端口检查
步骤:1) ss -tunap或netstat -tunlp列出监听端口与进程;
2) 若服务未启动:systemctl status 服务名,journalctl -u 服务名 -n 200查日志;3) 重启服务:systemctl restart 服务名,并观察日志tail -f /var/log/服务.log。
5.
系统资源与内核参数排查
步骤:1) top/htop查看CPU、内存占用;df -h检查磁盘;
2) 检查连接数:ss -s与ss -H -n state syn-recv;3) 临时调优sysctl -w net.ipv4.tcp_syncookies=1等,永久写入/etc/sysctl.conf并sysctl -p。
6.
日志分析与抓包定位
步骤:1) 检查系统/服务日志:/var/log/messages、/var/log/nginx/error.log等;
2) 抓包分析:tcpdump -i eth0 host 攻击IP -w /tmp/attack.pcap,使用Wireshark分析流量类型与特征。
7.
防火墙与白名单策略
步骤:1) 审核iptables/nftables规则:iptables -L -n --line-numbers;
2) 添加管理端口白名单:iptables -I INPUT 1 -p tcp -s 管理IP --dport 22 -j ACCEPT;3) 保存并持久化规则。
8.
高防特性排查与联调
步骤:1) 与提供商确认高防策略是否生效,查看控制面板的黑洞/清洗记录;
2) 在异常发生时要求运营商下发流量快照或清洗日志以确认是否为清洗误判。
9.
常见加固建议 — 访问控制
建议:1) 限制管理口仅允许办公IP,开启SSH密钥认证并禁用密码登录;
2) 更改默认端口并启用Fail2ban或类似防爆破服务。
10.
常见加固建议 — 网络与内核
建议:1) 启用SYN cookies、调整net.ipv4.tcp_max_syn_backlog与conntrack表大小;
2) 设置tcp_fin_timeout、tcp_tw_reuse、增加ulimit打开文件数并调整/etc/security/limits.conf。
11.
常见加固建议 — 应用与WAF
建议:1) 部署WAF(云端或本地),配置常见规则和速率限制;
2) 对静态内容使用CDN,减轻源站压力,并在应用层做验证码或JS挑战。
12.
常见加固建议 — 监控与备份
建议:1) 部署实时监控(Prometheus/Grafana或云监控),设置流量/连接告警;
2) 定期备份配置与数据,演练恢复流程,保持快照与冷备份。
13.
应急处置流程模板
步骤:1) 发生流量攻击时先启用高防清洗并记录时间点;
2) 暂时关闭非必要服务,启用白名单管理;3) 收集pcap与日志,与供应商配合完成溯源与封堵。
14.
常见问题一:高防失效怎么办?
问:为什么高防清洗没起作用?答:可能是清洗规则未覆盖端口或流量超出清洗能力,先与供应商核对清洗记录并临时封禁异常源IP,同时启用应用层限流。
15.
常见问题二:如何降低误报影响?
问:清洗误拦正常用户如何处理?答:在高防控制台调整白名单/灰名单,提供被误拦用户的IP和时间段给厂商回溯并修改规则。
16.
常见问题三:日常维护的首要操作?
问:平时应做哪些日常维护以减少故障?答:定期更新系统与软件、检查防火墙规则、监控阈值并演练应急恢复流程,确认备份可用性。
来源:香港高防免备案服务器常见故障排查与加固建议