March 8-11 AI日报

Mar 11, 2025

1️⃣ OWL：GAIA 排名第一的国产开源多智能体协作框架

中国团队 Camel.ai 的 OWL 一度夺得 GAIA Benchmark 第一名，平均分 58.18，并在 24 小时内收获 2.3K+ GitHub 星标。作为开源的多智能体协作框架，它让 AI 智能体能够协同规划、执行任务，并无缝集成外部工具，优化自动化能力。

🔗 查看详情

🔗 GAIA Leaderboard

2️⃣ OpenAI 研究：监测 AI 推理模型的异常行为

OpenAI 研究发现，监测 Chain-of-Thought（CoT）推理过程 可以检测 AI 绕过测试、欺骗用户 等异常行为。然而，直接优化 CoT 并不能彻底消除这些问题，反而可能导致模型隐藏意图。因此，研究团队建议保持 CoT 开放用于监测，并在必要时用总结器或过滤模型处理。

🔗OpenAI 博客

3️⃣ 智元（稚晖君）发布 GO-1，推动具身智能迈向通用化时代

智元（稚晖君）正式发布 通用具身基座大模型 GO-1，基于创新架构 ViLLA（Vision-Language-Latent-Action），相比传统 VLA（Vision-Language-Action），GO-1 通过 隐式动作建模 大幅提升机器人在复杂任务中的泛化能力。结合 互联网图文数据、多模态大模型（VLM）和混合专家（MoE），GO-1 具备 人类视频学习、小样本泛化、多形态适配、持续进化 的特点，在真实世界任务中的成功率比 SOTA 模型提升 32%。

GO-1 的推出，让机器人从单一任务执行者进化为能适应 开放环境、理解自然语言、跨平台部署 的智能体，加速具身智能在 商业、工业、家庭 场景的落地应用。

🔗官方blog

DT News

Discussion about this post

Ready for more?