March 8-11 AI日报
1️⃣ OWL:GAIA 排名第一的国产开源多智能体协作框架
中国团队 Camel.ai 的 OWL 一度夺得 GAIA Benchmark 第一名,平均分 58.18,并在 24 小时内收获 2.3K+ GitHub 星标。作为开源的多智能体协作框架,它让 AI 智能体能够协同规划、执行任务,并无缝集成外部工具,优化自动化能力。
🔗 查看详情
2️⃣ OpenAI 研究:监测 AI 推理模型的异常行为
OpenAI 研究发现,监测 Chain-of-Thought(CoT)推理过程 可以检测 AI 绕过测试、欺骗用户 等异常行为。然而,直接优化 CoT 并不能彻底消除这些问题,反而可能导致模型隐藏意图。因此,研究团队建议保持 CoT 开放用于监测,并在必要时用总结器或过滤模型处理。
3️⃣ 智元(稚晖君)发布 GO-1,推动具身智能迈向通用化时代
智元(稚晖君)正式发布 通用具身基座大模型 GO-1,基于创新架构 ViLLA(Vision-Language-Latent-Action),相比传统 VLA(Vision-Language-Action),GO-1 通过 隐式动作建模 大幅提升机器人在复杂任务中的泛化能力。结合 互联网图文数据、多模态大模型(VLM)和混合专家(MoE),GO-1 具备 人类视频学习、小样本泛化、多形态适配、持续进化 的特点,在真实世界任务中的成功率比 SOTA 模型提升 32%。
GO-1 的推出,让机器人从单一任务执行者进化为能适应 开放环境、理解自然语言、跨平台部署 的智能体,加速具身智能在 商业、工业、家庭 场景的落地应用。