1️⃣ OpenAI:GPT-4o 更新、API 提升与 MCP 集成
OpenAI 发布了全新 GPT-4o 版本,Sam Altman 强调其在代码生成、复杂任务处理、指令遵循等方面的性能大幅提升;同时,OpenAI Developers 宣布 chatgpt-4o-latest API 接口模型更新,未来这一优化将扩展至旧版模型。
此外,Agents SDK 现已集成 MCP(Model Context Protocol),并将在 ChatGPT 桌面应用与 Responses API 中逐步推广,为开发者提供更强的工具集成能力。
2️⃣ Anthropic:经济指数报告 & 模型研究
Anthropic 发布了一份 详尽的 AI 经济指数报告,分析 Claude 模型的使用情况及其在劳动市场中的影响。同时,其研究团队还发布了两项重要成果:
通过 “显微镜” 方法追踪大模型内部推理路径
深度解析语言模型的决策过程与结构行为
这些研究为 AI 的安全性与可解释性提供了新方向。
3️⃣ ManusAI:推出移动应用与多模态升级
ManusAI 宣布启动封闭测试并推出 Manus 移动应用。此次更新包含 多模态处理能力与长上下文支持,显著优化用户交互体验,推动智能助手产品向更高性能演进。
🔗 详情查看
4️⃣ Claude:Web 应用界面全面升级
Claude 推出新版 Web 应用,新增 Claude Compass,可区分“扩展搜索任务”与“研究任务”,极大提升了搜索精度与用户操作清晰度,凸显其在多任务 AI 应用方向的深化能力。
🔗 详情查看
5️⃣ ChatGPT 移动端体验提升 & 美加学生促销上线
ChatGPT 推出 安卓内测新版应用,集成产品评论、推理滑块等功能,改善移动端交互体验。同时,面向美加学生推出 两个月 Plus 免费体验活动,以拓展教育市场用户。
6️⃣ 清华大学发布东亚语音识别模型
清华大学在 Hugging Face 上发布 专注东亚语言的自动语音识别(ASR)模型,填补该语种技术空白,为语音交互系统在亚洲语言上的发展提供强力支撑。
🔗 模型发布
7️⃣ LlamaIndex:支持 LlamaCloud 作为 MCP 服务器
LlamaIndex 宣布 LlamaCloud 现可作为 MCP server 使用,支持实时数据注入 AI 代理,拓展开发者在多平台中的数据交互与自动化处理能力。
🔗 MCP 整合
来自 GitHub 的热门 AI 项目
MaxKB
MaxKB 是一个即开即用的开源 RAG 问答系统,通过结合大语言模型和检索增强生成技术,为企业知识库、客服、教育和研究等场景提供智能问答能力。它支持文档上传和网页抓取,具备灵活的工作流编排、多模态输入输出、主流模型兼容及快速集成能力,适合私有化部署,帮助用户快速构建具备语义理解能力的智能助理。
Khoj
Khoj 是一个自托管的开源 AI 助手,定位为“第二大脑”,支持与本地或在线大模型对话,能从用户文档和互联网中提取答案。用户可创建具备个性和工具的智能代理,自动化研究任务,进行语义搜索、图像生成、语音交互等操作,适用于个人效率提升与企业级部署,覆盖 Obsidian、Emacs、浏览器、手机等多平台使用场景。