快连路由器端如何启用节点故障自动重连?

功能定位:为什么要在路由器端做“故障自愈”
跨境办公、4K 直播、游戏加速等场景一旦掉线,人工切换平均耗时 5 分钟以上,足够让 Zoom 会议重进一次。kuailian 把原本跑在客户端的「AI 智能选路 3.0」下沉到网关,局域网所有终端在物理中断 30 秒内即可无感切到新出口,旧会话自动写日志,合规审计直接调用。
与桌面端相比,路由器策略额外盯防“带宽占用”与“整网断流”:连续 3 次测速低于套餐 30% 或 ICMP 丢包率>5% 才换线,避免瞬时抖动带来无谓漂移。经验性观察:100 Mbps 电信家宽 + 华硕 AX86U 环境,该阈值能把日均切换从 20 次压到 4 次,夜间几乎零抖动。
决策树:先判断你的硬件与固件是否值得开
硬件准入
官方仅对 MIPS/ARM v8 及以上、内存≥256 MB 开放自动重连二进制;老版 MT7621(128 MB)刷机虽能装插件,重连时会因 OOM 把 dnsmasq 一起带走,整网 DNS 直接挂。验证:SSH 执行cat /proc/cpuinfo | grep 'model name',若 BogoMIPS<1000,建议直接关闭功能。
固件分支
快连插件目前提供两条固件线:Merlin 改版(华硕)与 OpenWrt 21.02+。小米 AX 系、TP-Link 易展需先刷社区 OpenWrt 才可见“节点故障自动重连”开关;原厂固件只能跑到「基础代理」层级,无法下发探测指令。依赖保修的用户请权衡刷机风险。
操作路径:三步把开关放到首页
A. 华硕 Merlin 线
- 浏览器进 192.168.50.1 →「外部网络(WAN)」→「QuickLink 插件」。
- 「节点管理」子页右上角把「故障自动重连」滑块 ON,下方弹出「探测间隔」「丢包阈值」。
- 保持默认 30 s/5% 不动,先「应用本页设置」再「保存到 NVRAM」。插件会立即探活,日志看
/tmp/syslog.log | grep quicklink。
B. OpenWrt 线
- LuCI「服务」→「QuickLink」→「进阶设置」→ 勾选「启用节点故障自动重连」。
- 「探测模式」选「ICMP + 小流量 UDP 混合」,防止 IDC 全丢 ICMP 造成误判。
- 「切换黑名单」留空即全球可切;若合规要求“仅自贸区出口”,把 HK、SG 城市代码填白名单即可。
提示:首次开启后,插件生成/etc/quicklink/failover.json,记录每次切换节点、耗时、丢包率,拉下来就能 Excel 透视,格式与桌面端一致。
参数调优:让切换既快又不“抽风”
1. 探测间隔
默认 30 秒是 CPU 与收敛速度的折中。游戏房可降到 10 秒,CPU 多占 3–5 个百分点;只看 Disney+ 的家庭用户拉到 60 秒,能减少 20% 漂移。
2. 连续失败次数
隐藏项retry_before_fail=3需 SSH 改。晚高峰偶发 1–2 包丢可提到 5 次防误切;海底光缆施工期持续劣化,降到 2 次更快逃生。
3. 回切时延
原节点恢复后默认 30 分钟才回切,避免 IP 漂移导致银行、电商二次短信验证。可改 0(立即)或 1440 分钟(一整天),视业务容忍度而定。
合规与日志:如何留痕才能过审计
2025-11《跨境数据流动新规》要求企业保存“网关切换日志”≥6 个月。插件已在每次漂移时向 Syslog 注入 JSON,含事件时间、旧/新节点 IP、探测指标、切换耗时、设备 SN。把外部 Syslog 服务器填到「系统日志」→「远程日志」即可集中收集,无需脚本。
OpenWrt 用户装luci-app-rsyslog,单独过滤/var/log/quicklink.log,定时scp到内网审计 NAS。个人用户无需上传,任何“一键上传云端”均为第三方魔改,官方未提供。
故障排查:遇到“1401 无法连接”怎么办
警告:7.4.0 之后若同时打开 Quantum-Mode 与故障重连,部分固件切换时会清掉旧密钥缓存,触发 1401。解决顺序:先关 Quantum-Mode→重连→再开 Quantum-Mode,即可复现稳定。
现象:日志出现handshake_retry_exceed,节点列表全红。排查:
- SSH 执行
quicklink-cli status,若返回quantum_key_missing即缓存被清空。 - 「加密方式」页关闭 Quantum-Mode,点「应用」。
- 「节点管理」手动「重新测速」,成功后重新打开 Quantum-Mode。
- 把「连续失败次数」临时提到 5,给密钥协商留重试空间。
经验性观察:ARM v8 256 MB 以上设备冲突概率<5%,MT7621 因内存不足概率翻倍。若频繁出现,建议停用 Quantum-Mode,改用 AES-256-GCM,200 Mbps 内性能差异几乎无感。
适用 / 不适用场景清单
| 场景 | 建议 | 理由 |
|---|---|---|
| 跨境直播基地(50 路推流) | 开启 | 单节点抖动即掉帧,自动重连可把中断压到 10 秒内 |
| 家庭 4K 观影 | 可开 | 阈值放宽松,避免晚高峰频繁切换造成 IP 漂移验证 |
| 小型呼叫中心(合规录音) | 谨慎 | 切换时语音会中断 1–2 秒,需与 FreeSWITCH 冗余线路搭配 |
| 金融量化交易 | 不建议 | 毫秒级延迟敏感,应使用专线 + 固定出口 |
与第三方 Syslog/ SNMP 协同
若内部已跑 Prometheus,可用第三方 exporter 把failover.json解析成指标。示例脚本:
#!/bin/sh # 安装目录/Exporter/quicklink_exporter.sh tail -F /var/log/quicklink.log | while read line; do echo "$line" | jq -r '"quicklink_failover_duration_ms \(.duration)"' | curl --data-binary @- http://pushgateway:9091/metrics/job/quicklink done
权限最小化:给脚本单独用户,仅授予读日志与 curl 外发权限,禁止写配置。
版本差异与迁移建议
7.3.x 之前无「ICMP + UDP 混合探测」,升级后旧配置会被强制转成 ICMP-only,需手动改回。升级前备份/etc/config/quicklink,升级后 diff 核对,再决定阈值是否沿用。
验证与观测方法
- 终端 A 持续 ping 1.1.1.1,终端 B 拉 4K 直播。
- 「节点管理」手动“禁止”当前节点,模拟故障。
- A 的 ICMP 中断应<5 秒,B 直播无花屏。
- SSH 执行
logread | grep failover,确认日志字段齐全。
FAQ:关于自动重连的 5 个高频疑问
开启后路由器 CPU 飙高怎么办?
把探测间隔从 10 秒改回 30 秒,或关闭 UDP 混合探测,仅保留 ICMP,CPU 占用可降一半。
日志里出现“quantum_key_missing”要重装吗?
不需要重装,按文中步骤关闭 Quantum-Mode 再重连即可,属于缓存未及时写入导致。
能否只让客厅电视走自动重连,卧室电脑固定节点?
可以。在「分应用代理」里把电视 MAC 加入「智能组」,其余设备加入「固定组」,两组策略独立,互不干扰。
切换时会不会泄露真实 IP?
插件采用先建后断策略,新隧道握手成功才 drop 旧线路,理论上无中间裸奔窗口;若仍担心,可把「IPv6 passthrough」关闭,避免 v6 地址暴露。
年会员到期后功能会失效吗?
到期后插件仍运行,但只能切到免费节点池,自动重连逻辑不变;若免费池全部被封,则会持续提示“无可用节点”并停止外网,需手动关闭插件或续费。
最佳实践 6 条速查表
- 先确认 RAM≥256 MB 再开功能,避免 OOM。
- 把探测间隔、丢包阈值、连续失败次数写进变更记录表,方便回滚。
- 打开远程 Syslog,日志留存≥6 个月,满足审计。
- Quantum-Mode 与故障重连同开时,先关 Quantum 再排错。
- 金融、量化场景请直接上专线,不要用自动重连当主方案。
- 每次固件升级前备份
/etc/config/quicklink,升级后 diff 核对。
收尾:下一步该做什么
读完本文,你已掌握“开与不开”“怎么开”“何时退”的全景图。接下来:
- 用“验证与观测方法”在测试段先跑一遍,记录中断时间;
- 把探测参数、日志服务器写进变更单,审批后再推生产;
- 每季度拉一次
failover.json做透视,若切换集中某城市节点,可将其移出白名单。
如此,既享受低延迟,也留足合规证据,让网络自愈不再是“黑箱魔术”。


