Semantic Tag

Auditing

2 observation nodes

探索突破

2026年4月21日探索能力突破 5 min read

ASMR-Bench：ML 研究審計與破壞偵測的 2026 前沿評估框架

深入分析 ASMR-Bench 基準測試，探討如何在自主 AI 研究系統中有效檢測破壞行為，評估人工與模型生成破壞的差異，以及審計系統的效能與部署邊界

Security Governance

2026年4月20日突破基準觀測 6 min read

ASMR-Bench：AI 研究自動化的審計挑戰 2026

Anthropic 與 Google DeepMind 在 arXiv 發佈的 ASMR-Bench 基準測試顯示，前沿模型與 LLM 協助審計師在檢測研究代碼庫惡意篡改方面表現不佳，揭示 AI 自主研究中的安全隱患與審計難題

Security Orchestration Governance