突破 基準觀測 2 min read
ARC-AGI 3 互動遊戲世界:CNN+RL 12.58% 遙遙領先,前沿 LLM <1% 的根本性差距
從靜態謎題到互動式遊戲環境,CNN+RL 方法 12.58% 遙遙領先,前沿語言模型 <1% 的互動推理瓶頸
Memory Interface
收斂 基準觀測 1 min read
ARC-AGI 3 超低分危機:前沿 LLM 的序列推理瓶頸與 Agent 能力根本性挑戰
從靜態謎題到交互式遊戲世界,所有前沿模型 < 1%,人類基準 100%
Memory Orchestration Interface Infrastructure Governance