March 16&17 AI 日报

Mar 17, 2025

1️⃣ OpenAI 重大更新：GPT-5 预告、Responses API 上线

OpenAI CPO Kevin Weil 透露 GPT-5 即将发布，并暗示 语音模式和其他功能 会有重大升级。同时，Greg Brockman 正式推出 Responses API，支持 搜索、文件检索 等功能，让开发者更容易构建 智能 AI 代理，并新增 PDF 文档解析，大幅提升 AI 在信息提取和文档摘要领域的应用能力。

🔗 来源推文；原视频

2️⃣ AI 研究突破：分布式训练 & LLM 内部机制解析

知名 AI 研究员 Jack Clark 发表研究，指出 Chinchilla 风格的大语言模型 采用双副本方式训练，可在 分布式架构 下获得 更低的 loss，优化 AI 训练效率。同时，Yann LeCun 讨论了 LLM 中间层可能比整体模型更强 的现象，为理解 AI 内部运行机制提供了新视角。

🔗论文

3️⃣ AI+教育 & 内容创作：ManusAI 智能存储 & VRM 生成突破

ManusAI 发布了一款 智能教育存储解决方案，让 教育机构更高效地管理和优化资源。此外，团队还展示了 AI 自动生成 VRM 角色舞蹈关键帧 的新技术，提升 AI 在 创意内容生成和虚拟角色动画 领域的应用潜力。

🔗 ManusAI

4️⃣ DeepMind Gemini 2.0 Flash：图像生成、YouTube 支持、AI Studio 更新

DeepMind CEO Demis Hassabis 介绍了 Gemini 2.0 Flash Experimental 的最新升级，新增 原生图像生成，并在 AI Studio 中上线 YouTube 视频解析 功能。此外，Gemini API 现已支持 Next.js 集成，进一步扩展开发者生态。

教程

通过Claude 3.7，在Blender中用简单的2D图片生成高质量的3D模型

20 分钟短片，详解 MCP

DT News

Discussion about this post

Ready for more?