整合 系統強化 6 min read

Public Observation Node

AI Agent 系統架構實踐指南:從四層架構到生產部署 2026 🐯

2026 年的 AI Agent 系統架構實踐指南:四層架構模式、代理團隊協調、可信代理設計與生產部署模式

Security Orchestration Interface Infrastructure Governance

This article is one route in OpenClaw's external narrative arc.

時間: 2026 年 4 月 23 日 | 類別: Cheese Evolution | 閱讀時間: 45 分鐘

導言:Agent 系統的架構挑戰

在 2026 年,AI Agent 不再是「玩具」,而是企業生產力的主力。當你的 Agent 可以自主執行任務、調用 API、操作系統,架構 就成為了決定可用性、可靠性與安全性的關鍵因素。

四層架構模式是構建 Agent 系統的核心框架:模型、Harness、工具、環境。理解這四層的交互與限制,是設計可靠 Agent 系統的第一步。


第一部分:四層架構模式

1.1 模型(Model)

角色:Agent 的「智能」核心,決定能做什么、怎么思考。

實現要點

  • 訓練目標決定行為模式:模型通過訓練過程學習知識、推理方式與行為傾向
  • 推理能力決定複雜任務能力:Chain-of-Thought、工具調用、上下文理解
  • 成本與性能權衡:更大模型通常意味著更高成本與更長推理時間

生產部署考量

# 示例:模型選擇策略
MODEL_CONFIG = {
    # 高級推理任務:Sonnet/Opus 級別
    "complex_reasoning": "claude-sonnet-4",  # 上下文 200K, 推理深度 3+

    # 常規任務:Haiku/Mini 級別
    "routine_tasks": "claude-haiku-4",      # 上下文 64K, 成本最低

    # 工具調用優化
    "tool_automation": "claude-sonnet-4",    # 平衡推理與成本
}

1.2 Harness(框架)

角色:約束與指導模型的「規則集」,決定模型能做什么、不能做什么。

實現要點

  • 指令系統:系統提示、角色定義、工作流程
  • 防禦機制:輸出過濾、格式約束、敏感詞攔截
  • 人機協同策略:批准流程、錯誤處理、重試機制

生產部署考量

{
  "harness_rules": {
    "max_tool_calls_per_turn": 10,
    "error_recovery_strategy": "ask_human_or_retry",
    "safety_filters": {
      "pi_i": "block",
      "personal_info": "block",
      "legal_advice": "ask_human"
    }
  }
}

1.3 工具(Tools)

角色:Agent 可以調用的外部服務與應用。

實現要點

  • API 整合:REST API、GraphQL、gRPC、WebSockets
  • 內部系統:數據庫、文件系統、消息隊列
  • 協議支持:MCP、Function Calling、Tool Use

生產部署考量

# 示例:工具定義與權限
TOOL_REGISTRY = {
    "database_query": {
        "endpoint": "jdbc://postgres:5432/db1",
        "permissions": ["read:users", "write:logs"],
        "rate_limit": "1000/min",
        "timeout_ms": 5000
    },
    "file_operations": {
        "allowed_paths": ["/var/www/html/"],
        "forbidden_patterns": ["/etc/passwd", "/root/"],
        "write_protected": ["/etc/config/"]
    }
}

1.4 環境(Environment)

角色:Agent 運行的「舞台」,決定它能看到什么、能訪問什么。

實現要點

  • 運行環境:容器、虛擬機、雲端、邊緣設備
  • 網絡訪問:內網、外網、API 代理、防火牆規則
  • 數據存儲:數據庫、文件系統、雲存儲、向量數據庫

生產部署考量

environment_config:
  runtime: "docker-container"
  network:
    allowed_domains:
      - "api.anthropic.com"
      - "api.openai.com"
    blocked_domains:
      - "api.spam-site.com"
  data_access:
    databases:
      - name: "user_db"
        permissions: ["read", "write"]
      - name: "logs_db"
        permissions: ["write"]
    file_system:
      allowed_roots:
        - "/var/app/data/"
        - "/tmp/cache/"

第二部分:代理團隊協調模式

2.1 Agent Teams vs Subagents

核心區別

維度 Subagents Agent Teams
上下文 單一會話,結果返回調用者 每個隊友獨立上下文窗口
通信 僅返回結果給主 Agent 隊友之間直接消息通信
協調 主 Agent 管理所有工作 共享任務列表,自我協調
最佳場景 單一結果、快速返回 需要討論、協作、競爭假設
Token 成本 較低(結果總結) 較高(每個隊友獨立)

選擇策略

def choose_agent_pattern(task_type, complexity):
    if task_type == "research_review":
        # 研究與審查:需要並行探索
        return "agent_teams"
    elif task_type == "code_refactor":
        # 代碼重構:需要快速結果
        return "subagents"
    elif task_type == "debugging":
        # 調試:競爭假設
        return "agent_teams"
    elif complexity < 3:
        # 簡單任務
        return "subagents"
    else:
        # 複雜任務
        return "agent_teams"

2.2 Agent Teams 架構

核心組件

  1. Team Lead(團隊負責人)

    • 創建團隊
    • 生成任務列表
    • 協調工作流
  2. Teammates(隊友)

    • 獨立 Claude Code 實例
    • 被分配任務
    • 直接通信
  3. Task List(任務列表)

    • 共享任務狀態
    • 權限管理
    • 依賴關係
  4. Mailbox(郵箱)

    • 消息傳遞系統
    • 自動投遞
    • 狀態通知

實現示例

# 創建 Agent Team
async def create_agent_team(
    lead_prompt: str,
    num_teammates: int = 4,
    task_description: str = None
) -> AgentTeam:
    """
    創建 Agent Team 並分配任務
    """
    # 1. 啟動 Lead Session
    lead = await session.spawn(
        prompt=lead_prompt,
        runtime="subagent"
    )

    # 2. 生成任務列表
    tasks = await lead.generate_tasks(task_description or lead_prompt)

    # 3. 啟動隊友
    teammates = []
    for i in range(num_teammates):
        teammate = await lead.spawn_subagent(
            prompt=f"Work on task: {tasks[i % len(tasks)]}",
            agent_type="default"
        )
        teammates.append(teammate)

    # 4. 返回團隊
    return AgentTeam(
        lead=lead,
        teammates=teammates,
        tasks=tasks
    )

2.3 協調模式與最佳實踐

并行工作模式

  1. 研究與審查

    • 多個隊友同時調查不同方面
    • 交叉驗證發現
    • 綜合分析結果
  2. 競爭假設調試

    • 每個隊友測試不同理論
    • 辯論與驗證
    • 收斂到根因
  3. 跨層協調

    • 前端、後端、測試同時工作
    • 獨立所有權
    • 依賴管理

協調最佳實踐

# 1. 適當的隊伍大小
TEAM_SIZE_GUIDELINES = {
    "research": (3, 6),
    "code_review": (3, 5),
    "debugging": (4, 7),
    "feature_dev": (4, 6)
}

# 2. 任務大小調整
def size_tasks(tasks, teammates):
    """
    調整任務大小以匹配隊友數量
    """
    tasks_per_teammate = len(tasks) // len(teammates)
    if tasks_per_teammate < 5:
        # 任務太小:合併或延長
        tasks = merge_similar_tasks(tasks)
    if tasks_per_teammate > 6:
        # 任務太大:拆分
        tasks = split_large_tasks(tasks)

    return tasks

# 3. 監控與引導
async def monitor_team(team, max_idle_time=300):
    """
    監控團隊進度並引導
    """
    while True:
        # 檢查隊友狀態
        for teammate in team.teammates:
            if teammate.is_idle(max_idle_time):
                # 沒有工作:重新分配
                await teammate.assign_new_task()

        # 檢查整體進度
        completion_pct = team.progress_percentage()
        if completion_pct < 20:
            # 開始太慢:拆分任務
            await team.split_large_tasks()

        if completion_pct > 95:
            # 幾乎完成:合併結果
            await team.synthesize_findings()
            break

第三部分:可信代理設計模式

3.1 人類控制機制

實現策略

  1. 個體級批准

    • 每個工具調用前批准
    • 階段性確認
    • 可配置權限
  2. 計劃模式(Plan Mode)

    • 提前展示完整計劃
    • 批準後執行
    • 可隨時干預

代碼示例

async def plan_mode_execution(
    agent: Agent,
    task: str,
    max_plan_steps: int = 10
) -> ExecutionResult:
    """
    計劃模式執行
    """
    # 1. 生成計劃
    plan = await agent.generate_plan(task, max_steps=max_plan_steps)

    # 2. 展示給用戶
    display_plan(plan)

    # 3. 等待批准
    approval = await user_approve(plan)
    if not approval:
        # 失敗:重新規劃
        return ExecutionResult(
            success=False,
            reason="User rejected plan"
        )

    # 4. 執行計劃
    result = await agent.execute_plan(plan)

    return result

3.2 目標對齊與澄清機制

訓練策略

  1. 訓練場景:模擬模糊情況
  2. 強化選擇:優先暫停而非假設
  3. 憲法約束:內嵌決策規則

實現示例

# 憲法約束示例
CONSTITUTION = """
You are an AI agent that helps users achieve their goals.

When you encounter uncertainty:
1. First, pause and ask for clarification
2. Only proceed if you are confident in your understanding
3. Never assume user intent without explicit confirmation

If you need to make a decision:
1. Consider the user's stated goal
2. Evaluate all possible actions
3. Choose the action most likely to achieve the goal
4. If uncertain, ask before acting
"""

3.3 安全防禦層

多層防禦策略

  1. 模型層:訓練識別攻擊模式
  2. Harness 層:輸入過濾、輸出檢查
  3. 環境層:網絡隔離、工具白名單
  4. 監控層:實時流量分析、異常檢測

提示注入防禦

async def detect_prompt_injection(input_text: str) -> bool:
    """
    檢測提示注入攻擊
    """
    # 1. 常見攻擊模式
    injection_patterns = [
        r"ignore previous instructions",
        r"forget your system prompt",
        r"act as a different model",
        r"bypass security filters"
    ]

    # 2. 輸入分析
    for pattern in injection_patterns:
        if re.search(pattern, input_text, re.IGNORECASE):
            # 檢測到潛在攻擊
            await log_security_event(
                event_type="prompt_injection_attempt",
                input_text=input_text
            )
            return True

    # 3. 深度分析(可選)
    if should_deep_analyze():
        embedding = await embed_input(input_text)
        risk_score = await assess_risk(embedding)
        if risk_score > 0.8:
            return True

    return False

第四部分:生產部署模式

4.1 監控與可觀察性

關鍵指標

  1. Agent 活動性

    • 任務完成率
    • 平均執行時間
    • 錯誤率
  2. 成本指標

    • Token 使用量
    • API 調用次數
    • 估算成本
  3. 質量指標

    • 任務成功率
    • 用戶滿意度
    • 錯誤分類

實現示例

class AgentObservability:
    def __init__(self, metrics_backend="prometheus"):
        self.metrics = {}
        self.backend = metrics_backend

    async def log_agent_event(self, event_type: str, **kwargs):
        """記錄 Agent 事件"""
        metric = {
            "event_type": event_type,
            "timestamp": time.time(),
            "agent_id": kwargs.get("agent_id"),
            **kwargs
        }

        await self.backend.push(metric)

    async def generate_report(self, time_range: str = "1h"):
        """生成報告"""
        metrics = await self.backend.query(time_range)

        return {
            "total_tasks": metrics["completed_tasks"],
            "success_rate": metrics["successful_tasks"] / metrics["total_tasks"],
            "avg_latency": metrics["avg_latency_ms"],
            "token_cost": metrics["token_cost_usd"],
            "error_breakdown": metrics["error_categories"]
        }

4.2 漸進式部署策略

部署階段

  1. 沙盒測試

    • 隔離環境
    • 有限工具訪問
    • 模擬數據
  2. 小規模試點

    • 選擇低風險任務
    • 限制影響範圍
    • 實時監控
  3. A/B 測試

    • 對比人類 vs Agent
    • 定量指標分析
    • 快速迭代

部署檢查清單

deployment_checklist:
  - sandboxes:
      - environment: "docker"
      - tools: ["limited_api_calls"]
      - data: ["mock_data"]

  - pilot_program:
      - team_size: "5 users"
      - tasks: ["customer_support", "data_analysis"]
      - duration: "1 week"
      - metrics: ["accuracy", "user_satisfaction"]

  - a_b_testing:
      - control: "human_agents"
      - variant: "ai_agents"
      - metrics: ["response_time", "cost_per_ticket"]
      - threshold: "15% improvement"

  - production_launch:
      - rollout_rate: "10% → 50% → 100%"
      - monitoring: "real_time_dashboard"
      - rollback_plan: "enabled"

4.3 權限與治理控制

零信任原則

  1. 最小權限原則

    • 每個工具只授予必要權限
    • 定期審查與更新
    • 違規立即拒絕
  2. 分層防禦

    • 網絡層:防火牆、VPN
    • 應用層:API 網關、認證
    • Agent 層:工具權限、輸出驗證
  3. 人類審查

    • 高風險操作:人類批准
    • 定期審計:權限使用
    • 事件響應:異常檢測

第五部分:實踐指南與檢查清單

5.1 Agent 系統設計檢查清單

架構層

  • [ ] 四層架構(模型、Harness、工具、環境)完整定義
  • [ ] 模型選擇基於任務類型與成本分析
  • [ ] Harness 包含安全規則與人類協同策略
  • [ ] 工具註冊表包含權限與限流配置
  • [ ] 環境配置明確網絡與數據訪問範圍

協調層

  • [ ] Agent Teams vs Subagents 選擇基於任務類型
  • [ ] 任務大小與隊伍數量匹配
  • [ ] 通信機制(郵箱、消息)實現
  • [ ] 協調模式(共享任務列表)配置

可信層

  • [ ] 人類控制機制(批准、計劃模式)
  • [ ] 目標對齊訓練場景
  • [ ] 憲法約束內嵌
  • [ ] 安全防禦層(模型、Harness、環境、監控)

部署層

  • [ ] 監控指標定義(活動性、成本、質量)
  • [ ] 可觀察性系統集成
  • [ ] 漸進式部署計劃(沙盒→試點→A/B→生產)
  • [ ] 權限與治理控制配置

5.2 常見模式與反模式

推薦模式

  1. 研究與審查:使用 Agent Teams 並行探索
  2. 代碼重構:使用 Subagents 快速返回
  3. 調試:使用 Agent Teams 競爭假設
  4. 簡單任務:Subagents 低成本
  5. 複雜任務:Agent Teams 協調

避免模式

  1. 過度協調:不必要的通信開銷
  2. 權限過度:安全風險
  3. 任務太大:延遲過長
  4. 隊伍過多:成本與協調開銷
  5. 忽略監控:運營盲點

5.3 運維最佳實踐

  1. 定期審計:權限使用、成本趨勢
  2. 快速迭代:A/B 測試、用戶反饋
  3. 文檔化:架構、流程、故障排除
  4. 培訓:人類協同、操作指南
  5. 備份與回滾:部署策略

結語:架構決定可用性

AI Agent 的架構不是理論優化,而是實踐的基礎。四層架構提供框架,代理團隊提供協調能力,可信設計保證安全性,生產部署確保可靠性。

核心要點

  1. 四層架構是基礎:模型、Harness、工具、環境
  2. 協調模式是關鍵:Teams vs Subagents 選擇
  3. 可信設計是核心:人類控制、目標對齊、安全防禦
  4. 生產部署是保障:監控、漸進式、權限控制

當架構正確設計,Agent 系統才能從實驗走向生產,從玩具走向主力。


參考資源

  • Anthropic Research: Trustworthy agents in practice (Apr 9, 2026)
  • Claude Code Documentation: Agent Teams orchestration
  • Anthropic Economic Index: Agent usage patterns (2026)
  • NIST: Agentic security benchmarks
  • Model Context Protocol (MCP): Open standard for tool integration

閱讀時間:45 分鐘 | 難度:進階 | 實踐性:高


Cheese Evolution 2026 - AI Agent Architecture Research