7月22日 AI 日报：OpenAI IMO 金牌争议与京东开源通用多智能体

Jul 22, 2025

1️⃣ DeepMind 负责人质疑 OpenAI 的 IMO 金牌声明

DeepMind 推理团队负责人质疑 OpenAI 声称在 IMO 中获得金牌的结果，指出由于第六题丢分，应为银牌而非金牌。他强调 IMO 有内部评分标准，外部无法准确评估，并批评 OpenAI 未与 IMO 合作且缺乏透明度。

OpenAI 在闭幕式前公布结果，被指不尊重人类参赛者，抢夺风头。研究社区对此表示不满，认为 DeepMind 的合作方式更具专业性，这一争议凸显了 AI 竞赛中的伦理和验证问题。

🔗 推文：https://x.com/demishassabis/status/1947337618787615175

2️⃣ Gemini AI 凭借 Deep Think 赢得 IMO 金牌

Google DeepMind 团队宣布，使用先进的 Gemini 模型结合 Deep Think 技术，在 2025 年国际数学奥林匹克竞赛 (IMO) 中获得金牌标准。这一成就标志着从去年使用领域特定模型获得银牌的巨大进步，展示了 AI 在处理复杂数学问题方面的快速发展。

该模型在正式数学和非正式数学领域均表现出色，团队表示将很快分享更多细节。这一突破不仅提升了 AI 的推理能力，还为未来在教育和科研中的应用铺平了道路。

🔗 推文：https://x.com/OfficialLoganK/status/1947336606815281279

3️⃣ Anthropic 首席产品官加入 Figma 董事会

Anthropic 的首席产品官 Mike Krieger 宣布加入 Figma 的董事会，他表示期待与 Figma 创始人 Dylan Field 合作，推动设计平台的未来发展。Mike Krieger 作为 Instagram 的联合创始人和 CTO，具有丰富的产品经验，此次加入将为 Figma 注入更多创新活力。

Figma 作为设计团队不可或缺的平台，已成为行业标准，这一合作可能促进 AI 与设计工具的深度整合。社区对这一消息反应积极，期待 Figma 在 AI 增强方面的进一步突破。

🔗 推文：https://x.com/mikeyk/status/1947329017809678486

4️⃣ Gemini 原生 TTS 功能正式开放生产使用

Google AI 宣布，Gemini 2.5 Flash 和 Pro 模型的原生文本到语音 (TTS) 功能现已准备好大规模生产使用。这一功能特别适用于类似 NotebookLM 的播客内容生成，提供高质量的音频输出。

开发者可在 AI Studio 中试用，并通过 Gemini API 文档了解更多细节。这一更新增强了 Gemini 的多模态能力，有助于创建更丰富的交互式应用，如教育工具和虚拟助手。

🔗 推文：https://x.com/OfficialLoganK/status/1947328086577492309

5️⃣ 京东开源产品级端到端通用多智能体 JoyAgent-JDGenie

京东开源了 JoyAgent-JDGenie，一款端到端通用多智能体系统，在 GAIA 测试中准确率达到 75.15%，超越 OWL 和 OpenManus 等竞争者。该系统支持直接处理查询或任务，提供完整的多智能体框架，包括前端、后端和核心子智能体如报告生成和代码智能体。

框架采用多层级和多模式思考设计，支持跨任务记忆，可快速构建和部署多智能体应用。这一开源项目为开发者提供了开箱即用的工具，适用于企业级 AI 解决方案开发。

🔗 推文：https://x.com/aigclink/status/1947196727238255057

来自 GitHub 的热门 AI 项目: Crawl4AI

Crawl4AI 是一个开源的、针对 LLM 友好的网络爬虫和抓取器，专为快速、AI 就绪的网络爬取而设计，适用于 LLM、AI 代理和数据管道，具有实时性能和易部署性。其技术特点包括使用 Python、Playwright、Docker 和 FastAPI，支持 Markdown 生成优化用于 RAG 和微调、结构化数据提取（LLM 驱动、CSS/XPath 基于）、浏览器集成、智能链接分析、异步 URL 种子和性能优化（高达 3 倍速度）。应用场景包括网络爬取任务、将网页转换为 Markdown 用于 AI 应用、提取结构化数据用于研究或数据管道，以及在生产环境中大规模数据提取。

🔗 项目：https://github.com/unclecode/crawl4ai

DT News

Discussion about this post

Ready for more?