LayFz's Blog
搜索
⌘K
文章
标签
归档
GitHub
搜索
⌘K
文章
标签
归档
GitHub
目录
前言:运维的规模天花板 🧱
一、技术栈清单:每一层做什么
🌐 组网层:WireGuard
📦 运行时层:Docker + Compose
📊 主机监控:Beszel(hub + agent)
📝 日志采集:Vector
🔍 日志存储 / 检索:OpenObserve
📡 可用性拨测:Uptime-Kuma
🔔 告警出口:通用 Webhook → 中继 → 企业 IM
🤖 智能层:AI Agent(Claude Code)+ SSH(MCP) + 联网
二、整体架构:分层 + 数据流
三、三条核心数据流:系统是怎么「跑」起来的
四、Agent 如何「高质量」地管:落到机制
五、关键实现细节 / 避坑:技术含金量所在 🛠️
1. 为什么 agent 用「WebSocket 反向连接」
2. 改配置「热加载不停机」,绝不轻易重启
3. 日志「产品采、运维不采」——靠标签过滤
4. agent 指纹绑定机器身份,部署方式随意切换
5. 远程操作的「断网安全」——长任务必须脱离会话
6. 分流隧道:只接管「管理流量」,不碰业务