1️⃣ OpenAI:记忆机制、语音模式与 API 权限更新
ChatGPT 记忆功能更新:系统提示中新增 "Model Set Context" 字段(代号 Moonshine),可记录用户历史对话以生成更个性化回应。
语音模式扩展:高级语音模式新增“显示字幕”选项,已在 iPadOS 上线,iOS 与网页版暂未支持。
GitHub 连接器上线:ChatGPT 设置中新增 GitHub 接入选项,目前尚未推出完整“Sources”界面。
API 验证机制调整:OpenAI 更新组织验证策略,1-3 级开发者通过验证后可访问 o3 和 Streaming 功能,并测试 Flex Processing 模式以优化成本与性能平衡。
🔗 Moonshine 机制
🔗 语音字幕更新
🔗 GitHub 接入
🔗 API 验证说明
2️⃣ Google:Gemini 2.5 系列、Studio 工具与科学研究发布
Gemini 2.5 系列上线:正式发布 Gemini 2.5 Flash 模型,Flash 为混合推理架构,主打思考速度与响应质量的灵活平衡。
AI Studio 功能升级:推出无限画布与 Starter Apps V2,便于原型构建与快速迭代。
航运网络 API 发布:Google 推出全球航运网络设计 API,用于优化物流调度与国际运输。
Cell2Sentence-Scale 项目发布:该方法将细胞生物数据转换为文本,拓展大模型在生命科学领域的应用。
🔗 Gemini Flash
🔗 AI Studio 更新
🔗 航运 API
🔗 Cell2Sentence 项目
3️⃣ LlamaIndex:模型集成与多代理通信
集成 Gemini Flash:新版已支持 Gemini 2.5 Flash,便于将其整合进数据检索与处理流程。
A2A 代理功能发布:推出 A2A(Agent-to-Agent)通信框架,使多个 AI 代理能协同工作、交换数据,支持复杂系统构建。
4️⃣ Grok:工作区功能更新
Grok 新增工作区功能,用户可集中管理文件和对话,支持重拾上下文与自定义指令组织,提升多轮任务处理效率。
🔗 工作区功能
5️⃣ ManusAI:Google Drive 文件集成
ManusAI 实现与 Google Drive 的深度集成,支持文件上传、下载与文档处理,提升企业在文档自动化场景中的灵活性。
🔗 Drive 集成
6️⃣ Meta FAIR:感知编码器研究进展
Meta FAIR 发布新一代 Meta Perception Encoder,提升图像感知与多模态理解能力,拓展视觉智能模型的应用边界。
🔗 研究成果
来自 GitHub 的热门 AI 项目
OpenBB
OpenBB 是一个完全开源的投资研究平台,为所有人提供股票、期权、加密货币、外汇、宏观经济等数据的访问与分析工具。支持命令行和图形界面,内置 AI 财务分析助手,适合个人投资者、量化研究者和开发者使用。平台支持通过 PyPI 安装,强调可扩展性与社区贡献,采用 AGPLv3 许可证。