March 6、7 AI日报
1️⃣ 强化学习教父 Andrew G. Barto 和 Richard S. Sutton 获得 2024 年图灵奖 🏆
强化学习领域的两位奠基人 Andrew G. Barto 和 Richard S. Sutton 荣获 2024 年图灵奖,以表彰他们在强化学习概念和算法方面的卓越贡献。Sutton 和 Barto 共同撰写的《Reinforcement Learning: An Introduction》被视为强化学习领域的经典教材,他们在 TD-learning、Q-learning 和策略梯度方法等方面的研究,极大推动了 AI 代理的学习能力,影响深远。
🔗 官方公告
2️⃣ GPT-4.5 面向 Plus 用户开放 🎉
OpenAI 前几日推出的 GPT-4.5,目前已向 ChatGPT Plus 用户 开放体验。
🔗 官方动态
3️⃣ WindSurf Wave4 大更新,交互式 AI 设计更进一步 🚀
WindSurf Wave4 迎来重大升级,新增 交互式预览功能,与 Claude 3.7 结合使用,可极大提升 AI 生成设计的易用性。
📌 主要更新:
交互式预览:无需手动描述修改需求,直接点击元素即可修改。
智能错误反馈:网站报错时,会自动与 AI 助手共享错误信息,便于调试。
Tab 导入功能:可通过 tab 添加新的依赖项目。
建议操作按钮:模型输出后,提供直接执行的操作选项。
Linter 集成:AI 代码生成后,Linter 自动检查并修复问题。
MCP 服务器优化:更便捷地管理 MCP 服务器。
模型管理增强:对 AI 模型的管理更加直观和高效。
🔗 更新详情
4️⃣ Qwen 发布 QwQ-32B,对标 Deepseek-R1 671B 💡
阿里 Qwen 团队发布了 32B 参数规模的 QwQ-32B,并声称其性能可媲美 Deepseek-R1 671B。Qwen 团队表示,他们在 强化学习(RL)训练 上取得了突破,使得 中型模型 也能达到 超大规模 MoE(Mixture of Experts)模型 的水准,特别是在 数学与编程任务 上表现突出。此外,QwQ-32B 相较于 671B 更易于部署,降低了计算成本。
🔗 官方介绍
5️⃣ Mistral OCR 发布,定义文档理解新标准 📄
Mistral AI 推出了全新的 Mistral OCR,一款 光学字符识别(OCR)API,在 复杂文档理解 方面树立了新标杆。该模型不仅能精准提取 文本、表格、数学公式、图像 等内容,还能以结构化格式输出,适用于 RAG 系统 处理 多模态文档(如 PDF、幻灯片)。
📌 核心亮点:
复杂文档理解:支持 LaTeX 公式、表格、图像、手写文本等。
多语言、多模态:支持全球数千种语言和字体,适合跨国组织及本地企业。
行业领先基准测试:在多个 OCR 评测中超越 Google Document AI、Azure OCR、Gemini-1.5 等模型。
极速处理:单节点每分钟可解析 2000 页,适用于高吞吐量场景。
文档即提示(Doc-as-prompt):可直接从文档提取关键信息并生成结构化数据(如 JSON)。
可自托管:针对高隐私或机密数据的企业,支持本地部署。
Mistral OCR 现已在 La Plateforme 开放 API 访问,并将在 Le Chat 及云端合作伙伴平台上线。
🔗 官方公告
6️⃣Manus 发布,邀请码炒至数万
Manus 是 Monica.im 推出的全球首款 AI Agent,具备自主执行复杂任务的能力,而不仅仅是提供答案。它采用 Multiple Agent 架构,运行在独立虚拟机中,能够调用工具、编写代码、浏览网页,完成从简历筛选、房产推荐到股票分析等任务,极大提升自动化和任务拆解能力。尽管 Manus 并未实现技术上的颠覆性突破,但其交互体验和工程实现优于同类产品,标志着 AI 代理人生态的加速成型。
📌 Manus 专题昨天已发布,详情可见:
🔗Manus AI Agent