March 16&17 AI 日报
1️⃣ OpenAI 重大更新:GPT-5 预告、Responses API 上线
OpenAI CPO Kevin Weil 透露 GPT-5 即将发布,并暗示 语音模式和其他功能 会有重大升级。同时,Greg Brockman 正式推出 Responses API,支持 搜索、文件检索 等功能,让开发者更容易构建 智能 AI 代理,并新增 PDF 文档解析,大幅提升 AI 在信息提取和文档摘要领域的应用能力。
2️⃣ AI 研究突破:分布式训练 & LLM 内部机制解析
知名 AI 研究员 Jack Clark 发表研究,指出 Chinchilla 风格的大语言模型 采用双副本方式训练,可在 分布式架构 下获得 更低的 loss,优化 AI 训练效率。同时,Yann LeCun 讨论了 LLM 中间层可能比整体模型更强 的现象,为理解 AI 内部运行机制提供了新视角。
🔗论文
3️⃣ AI+教育 & 内容创作:ManusAI 智能存储 & VRM 生成突破
ManusAI 发布了一款 智能教育存储解决方案,让 教育机构更高效地管理和优化资源。此外,团队还展示了 AI 自动生成 VRM 角色舞蹈关键帧 的新技术,提升 AI 在 创意内容生成和虚拟角色动画 领域的应用潜力。
🔗 ManusAI
4️⃣ DeepMind Gemini 2.0 Flash:图像生成、YouTube 支持、AI Studio 更新
DeepMind CEO Demis Hassabis 介绍了 Gemini 2.0 Flash Experimental 的最新升级,新增 原生图像生成,并在 AI Studio 中上线 YouTube 视频解析 功能。此外,Gemini API 现已支持 Next.js 集成,进一步扩展开发者生态。