1️⃣ DeepSeek V3 发布,性能接近 GPT-4.5
DeepSeek V3-0324 已在 Hugging Face 悄然上线,其 MMLU-Pro 分数 显示性能接近 Sonnet 3.7 和 GPT-4.5。这一更新标志着 开源 AI 在搜索与信息检索领域的持续创新,并为开发者提供 MIT 许可下的更高灵活性。
2️⃣ OpenAI 领导层调整:任命新首席研究官
OpenAI 任命 Mark Chen 为首席研究官,推动 AI 深度研究,同时 Brad Lightcap 升任 首席运营官,负责 全球业务运营。此次调整表明 OpenAI 加大对 AI 研究和市场扩展的投入。
🔗 公告
3️⃣ Alibaba 推出 Qwen2.5-VL-32B-Instruct
Alibaba 发布 Qwen2.5-VL-32B-Instruct,填补 7B 与 72B 规模间的性能空缺,提供 高效能 AI 计算。该模型强调 平衡计算资源与推理能力,适用于 多模态 AI 任务,如 视觉-语言理解。
🔗 博客
4️⃣ AI 竞赛 & 研究活动:OpenAI Forum & Red-Teaming Challenge
OpenAI Forum 将于 3 月 27 日 举办 Deep Research 活动,探讨 ChatGPT 在多步深度研究任务中的 agentic 能力。
Agent Red-Teaming Challenge 竞赛奖金提高至 17 万美元,AnthropicAI & Google DeepMind 宣布参与,推动 AI 安全与防御测试。
推荐阅读
Yann LeCun:从大型语言模型到世界模型的下一步 AI 变革 by @nake13
Yann LeCun 在 GTC 2025 峰会上表示,LLM 仅依赖文本预测,缺乏对物理世界的理解,未来 AI 应聚焦 世界模型(World Model),具备 持续记忆、推理和规划能力。他提出 JEPA 架构,通过 高层抽象学习 提升 AI 认知能力,并强调 开源 对 AI 发展的重要性。同时,他认为 AI 未来将成为 人类的助手,而非威胁。
DeepSeek发布V3更新:代码和审美有了质的提升,附5大维度测评
DeepSeek 于 3 月 24 日发布 V3 版本,在 代码生成、数学推理、知识问答、翻译和长文本理解 方面有显著提升,部分能力接近 Claude 3.7 Sonnet。新版支持 128k 上下文窗口,代码生成更优雅,审美优化明显,并已 免费开源(MIT 许可)。测试显示 V3 代码一遍通过,数学推理清晰,翻译精准,长文本摘要质量高,标志着 AI 代码与推理能力的新突破。