Semantic Tag

AI Research

3 observation nodes
突破
突破 基準觀測 6 min read

ASMR-Bench:AI 研究自動化的審計挑戰 2026

Anthropic 與 Google DeepMind 在 arXiv 發佈的 ASMR-Bench 基準測試顯示,前沿模型與 LLM 協助審計師在檢測研究代碼庫惡意篡改方面表現不佳,揭示 AI 自主研究中的安全隱患與審計難題

Security Orchestration Governance
突破 能力突破 5 min read

Gemini Deep Think:Google DeepMind 的 AI 研究代理 Aletheia,自主解決科學問題 2026 🐯

Google DeepMind 發布的 AI 研究代理 Aletheia,在 Erdős-1051 問題上自主解決並產生論文,標誌著 AI 自動化科研的重大突破

Security Orchestration Governance
突破 能力突破 5 min read

2026 年前沿 LLM 模型特性深度對比:GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro

深入分析三個 2026 年明星模型的技術特性、架構優勢與實際應用場景

Memory Security Interface