1️⃣ OpenAI:推理模型发布、平台更新与战略动态
推理模型发布:OpenAI 推出三款新模型:o3、o4‑mini 和 o4‑mini‑high(Phoenix),支持代码执行、文件上传、搜索与图像分析等功能,并引入成本优化机制。
性能评测:o3 在 HLE 与 EnigmaEval 等测评中表现优异;o4‑mini‑high 在 Project Euler 数学任务中用时不足 3 分钟完成测试,展示推理与计算能力。
模型训练细节:官方人员分享 o3 与 o4‑mini 在编码、科学与视觉任务中的性能提升路径,强调多领域能力融合。
网页应用更新:ChatGPT 加入实验性任务调度功能,界面使用 o3 与 o4‑mini,但执行仍由 GPT-4o 完成,表明系统仍处于迁移测试阶段。
Codex CLI 发布:支持 o3/o4-mini 的开源编码代理工具 Codex CLI 上线,允许用户通过自然语言在终端执行指令。
收购动态:OpenAI 正与 Windsurf(前 Codeium)洽谈收购交易,金额约 30 亿美元,意在增强其在 AI 编码工具领域的布局。
🔗 模型发布
🔗 性能评测 o3
🔗 性能评测 o4-mini-high
🔗 训练优化分析
🔗 网页调度功能
🔗 Codex CLI
🔗 收购新闻
2️⃣ LlamaIndex:模型集成与金融工作坊
模型支持更新:LlamaIndex 已实现对 o3 与 o4‑mini 的 day 0 支持,开发者可通过更新 Python 包快速接入新模型。
行业活动预告:将在纽约举办金融领域专题工作坊,聚焦 AI 在投资分析、代理系统构建等方面的应用。
3️⃣ Google:开发工具与 Gemini 功能扩展
AI Studio 更新:Google AI Studio 推出无限画布与 Starter Apps V2,增强 Gemini API 的原型开发能力。
Gemini Live 扩展:Gemini Live 功能现已开放至所有 Android 用户,支持实时摄像头与屏幕共享交互。
4️⃣ ByteDance:Seedream 3.0 发布
ByteDance Seed 团队推出图像生成基础模型 Seedream 3.0,聚焦生成质量与创意表达能力的提升,为图像生成领域带来技术更新。
5️⃣ Grok:记忆功能上线
Grok 推出用户记忆功能,支持查看、编辑与删除交互历史,已在 iOS 与 Android Beta 版中上线,用于个性化推荐与对话优化。
🔗 记忆功能
6️⃣ Mistral AI:Classifier Factory 工具发布
Mistral AI 推出 Classifier Factory,支持开发者快速创建定制化分类器,适用于内容审核、意图检测等任务,并附带完整文档与 Cookbook。
🔗工具发布