April 18 AI 日报

Gemini 2.5 Flash 上线，OpenAI 产品小更新

Apr 18, 2025

1️⃣ OpenAI：记忆机制、语音模式与 API 权限更新

ChatGPT 记忆功能更新：系统提示中新增 "Model Set Context" 字段（代号 Moonshine），可记录用户历史对话以生成更个性化回应。
语音模式扩展：高级语音模式新增“显示字幕”选项，已在 iPadOS 上线，iOS 与网页版暂未支持。
GitHub 连接器上线：ChatGPT 设置中新增 GitHub 接入选项，目前尚未推出完整“Sources”界面。
API 验证机制调整：OpenAI 更新组织验证策略，1-3 级开发者通过验证后可访问 o3 和 Streaming 功能，并测试 Flex Processing 模式以优化成本与性能平衡。

🔗 Moonshine 机制
🔗 语音字幕更新
🔗 GitHub 接入
🔗 API 验证说明

2️⃣ Google：Gemini 2.5 系列、Studio 工具与科学研究发布

Gemini 2.5 系列上线：正式发布 Gemini 2.5 Flash 模型，Flash 为混合推理架构，主打思考速度与响应质量的灵活平衡。
AI Studio 功能升级：推出无限画布与 Starter Apps V2，便于原型构建与快速迭代。
航运网络 API 发布：Google 推出全球航运网络设计 API，用于优化物流调度与国际运输。
Cell2Sentence-Scale 项目发布：该方法将细胞生物数据转换为文本，拓展大模型在生命科学领域的应用。

🔗 Gemini Flash
🔗 AI Studio 更新
🔗 航运 API
🔗 Cell2Sentence 项目

3️⃣ LlamaIndex：模型集成与多代理通信

集成 Gemini Flash：新版已支持 Gemini 2.5 Flash，便于将其整合进数据检索与处理流程。
A2A 代理功能发布：推出 A2A（Agent-to-Agent）通信框架，使多个 AI 代理能协同工作、交换数据，支持复杂系统构建。

🔗 Gemini 集成
🔗 A2A 功能

4️⃣ Grok：工作区功能更新

Grok 新增工作区功能，用户可集中管理文件和对话，支持重拾上下文与自定义指令组织，提升多轮任务处理效率。

🔗 工作区功能

5️⃣ ManusAI：Google Drive 文件集成

ManusAI 实现与 Google Drive 的深度集成，支持文件上传、下载与文档处理，提升企业在文档自动化场景中的灵活性。

🔗 Drive 集成

6️⃣ Meta FAIR：感知编码器研究进展

Meta FAIR 发布新一代 Meta Perception Encoder，提升图像感知与多模态理解能力，拓展视觉智能模型的应用边界。

🔗 研究成果

来自 GitHub 的热门 AI 项目

OpenBB

OpenBB 是一个完全开源的投资研究平台，为所有人提供股票、期权、加密货币、外汇、宏观经济等数据的访问与分析工具。支持命令行和图形界面，内置 AI 财务分析助手，适合个人投资者、量化研究者和开发者使用。平台支持通过 PyPI 安装，强调可扩展性与社区贡献，采用 AGPLv3 许可证。

Discussion about this post

No posts

Ready for more?

#nojs-banner { position: fixed; bottom: 0; left: 0; padding: 16px 16px 16px 32px; width: 100%; box-sizing: border-box; background: red; color: white; font-family: -apple-system, "Segoe UI", Roboto, Helvetica, Arial, sans-serif, "Apple Color Emoji", "Segoe UI Emoji", "Segoe UI Symbol"; font-size: 13px; line-height: 13px; } #nojs-banner a { color: inherit; text-decoration: underline; } This site requires JavaScript to run correctly. Please turn on JavaScript or unblock scripts