7月22日 AI 日报:OpenAI IMO 金牌争议与京东开源通用多智能体
1️⃣ DeepMind 负责人质疑 OpenAI 的 IMO 金牌声明
DeepMind 推理团队负责人质疑 OpenAI 声称在 IMO 中获得金牌的结果,指出由于第六题丢分,应为银牌而非金牌。他强调 IMO 有内部评分标准,外部无法准确评估,并批评 OpenAI 未与 IMO 合作且缺乏透明度。
OpenAI 在闭幕式前公布结果,被指不尊重人类参赛者,抢夺风头。研究社区对此表示不满,认为 DeepMind 的合作方式更具专业性,这一争议凸显了 AI 竞赛中的伦理和验证问题。
🔗 推文:https://x.com/demishassabis/status/1947337618787615175
2️⃣ Gemini AI 凭借 Deep Think 赢得 IMO 金牌
Google DeepMind 团队宣布,使用先进的 Gemini 模型结合 Deep Think 技术,在 2025 年国际数学奥林匹克竞赛 (IMO) 中获得金牌标准。这一成就标志着从去年使用领域特定模型获得银牌的巨大进步,展示了 AI 在处理复杂数学问题方面的快速发展。
该模型在正式数学和非正式数学领域均表现出色,团队表示将很快分享更多细节。这一突破不仅提升了 AI 的推理能力,还为未来在教育和科研中的应用铺平了道路。
🔗 推文:https://x.com/OfficialLoganK/status/1947336606815281279
3️⃣ Anthropic 首席产品官加入 Figma 董事会
Anthropic 的首席产品官 Mike Krieger 宣布加入 Figma 的董事会,他表示期待与 Figma 创始人 Dylan Field 合作,推动设计平台的未来发展。Mike Krieger 作为 Instagram 的联合创始人和 CTO,具有丰富的产品经验,此次加入将为 Figma 注入更多创新活力。
Figma 作为设计团队不可或缺的平台,已成为行业标准,这一合作可能促进 AI 与设计工具的深度整合。社区对这一消息反应积极,期待 Figma 在 AI 增强方面的进一步突破。
🔗 推文:https://x.com/mikeyk/status/1947329017809678486
4️⃣ Gemini 原生 TTS 功能正式开放生产使用
Google AI 宣布,Gemini 2.5 Flash 和 Pro 模型的原生文本到语音 (TTS) 功能现已准备好大规模生产使用。这一功能特别适用于类似 NotebookLM 的播客内容生成,提供高质量的音频输出。
开发者可在 AI Studio 中试用,并通过 Gemini API 文档了解更多细节。这一更新增强了 Gemini 的多模态能力,有助于创建更丰富的交互式应用,如教育工具和虚拟助手。
🔗 推文:https://x.com/OfficialLoganK/status/1947328086577492309
5️⃣ 京东开源产品级端到端通用多智能体 JoyAgent-JDGenie
京东开源了 JoyAgent-JDGenie,一款端到端通用多智能体系统,在 GAIA 测试中准确率达到 75.15%,超越 OWL 和 OpenManus 等竞争者。该系统支持直接处理查询或任务,提供完整的多智能体框架,包括前端、后端和核心子智能体如报告生成和代码智能体。
框架采用多层级和多模式思考设计,支持跨任务记忆,可快速构建和部署多智能体应用。这一开源项目为开发者提供了开箱即用的工具,适用于企业级 AI 解决方案开发。
🔗 推文:https://x.com/aigclink/status/1947196727238255057
来自 GitHub 的热门 AI 项目: Crawl4AI
Crawl4AI 是一个开源的、针对 LLM 友好的网络爬虫和抓取器,专为快速、AI 就绪的网络爬取而设计,适用于 LLM、AI 代理和数据管道,具有实时性能和易部署性。其技术特点包括使用 Python、Playwright、Docker 和 FastAPI,支持 Markdown 生成优化用于 RAG 和微调、结构化数据提取(LLM 驱动、CSS/XPath 基于)、浏览器集成、智能链接分析、异步 URL 种子和性能优化(高达 3 倍速度)。应用场景包括网络爬取任务、将网页转换为 Markdown 用于 AI 应用、提取结构化数据用于研究或数据管道,以及在生产环境中大规模数据提取。