7月20日 AI 日报：GPT-5 曝光与数奥金牌水平 OpenAI 的新模型

Jul 20, 2025

1️⃣ GPT-5 在生物安全基准中曝光

在SecureBio的生物安全基准仓库中，发现了名为“gpt-5-reasoning-alpha-2025-07-13”的模型标识，这被视为OpenAI即将发布GPT-5的早期迹象。TestingCatalog报道称，这一发现源于代码提交，暗示GPT-5可能聚焦于增强推理能力。

社区对这一泄露反应热烈，许多人推测这与OpenAI的最新进展相关。该模型的出现预示着AI在安全和伦理基准测试中的应用，或将带来更强大的生成式AI工具。

🔗 推文：https://x.com/testingcatalog/status/1946561535653908816

2️⃣ Figure AI 发布机器人制造最新动态

Figure AI 公司最近更新了其新闻页面，展示了在人工智能、机器人和制造领域的最新进展。公司创始人Brett Adcock分享了一个视频，突显了他们正在大规模出货AI驱动的机器人系统，这标志着Figure在人形机器人领域的快速推进。

这一更新引起了广泛关注，用户们纷纷讨论机器人自主充电和未来迭代的可能性。Figure的进展预示着机器人技术将更深入融入制造业和日常生活，推动行业向自动化转型。

🔗 推文：https://x.com/adcock_brett/status/1946658124896882851

3️⃣ OpenAI 新模型被誉为 AI “登月时刻”

OpenAI的最新实验性推理大语言模型在国际数学奥林匹克竞赛（IMO）中达到了金牌水平，这被视为人工智能领域的重大突破。前微软AI副总裁Sebastien Bubeck强调，这一成就证明了模型能够生成真正创造性的数学证明，而无需任何外部工具。

这一进展超越了单纯的竞赛表现，展示了AI在处理复杂、新颖问题的潜力。专家认为，这可能标志着AI从模拟到真正创新的转折点，影响未来科学研究和教育。

🔗 推文：https://x.com/SebastienBubeck/status/1946577650405056722

4️⃣ Walker S2 机器人实现自主电池更换

Walker S2 被誉为首个能感知低电量、自主寻找电池、进行更换并继续工作的类人机器人，这一创新展示了机器人自主性的新高度。Angry Tom 在推文中分享了演示视频，突显了其热插拔自主电池更换系统，这标志着机器人技术向全天候运作迈进。

社区反应混合，许多用户表达了惊叹与担忧，认为这可能加速机器人取代人类劳动。专家指出，这一功能将提升机器人在工业和日常场景中的实用性，推动AI驱动的自动化革命。

🔗 推文：https://x.com/AngryTomtweets/status/1946508091048259686

5️⃣ Manus AI 代理在性能测试中超越 ChatGPT

Manus AI 发布了其通用AI代理的演示视频，与ChatGPT Agent使用相同提示进行比较，结果显示Manus在速度、可靠性和实用性上更胜一筹。公司强调，通过优化上下文工程，他们的代理能更高效地完成复杂任务，而无须编辑或技巧。

用户反馈突出Manus的实际优势，但也提到信用系统的限制。这一比较展示了AI代理领域的竞争激烈，推动开发者向更高效的自主系统发展。

🔗 推文：https://x.com/ManusAI_HQ/status/1946410432924995688

来自 GitHub 的热门 AI 项目: Open Deep Research

Open Deep Research是一个简单、可配置、完全开源的深度研究代理，支持多种模型提供商、搜索工具和MCP服务器。其技术特点包括可通过Web UI或环境变量配置研究过程、多模型任务分工（如总结、研究、压缩和报告撰写）、多维评分系统以及支持本地和远程MCP服务器进行文件系统操作和分布式协调，基于LangGraph平台和Python 3.11开发。适用于迭代式网络研究、报告撰写、批量评估和比较研究等场景，帮助用户构建高效的AI研究工作流。社区反响积极，获得约5.3k星标和751 forks，用户反馈强调其灵活性和对开源AI代理的支持，推动深度研究工具的创新。

🔗 项目：https://github.com/langchain-ai/open_deep_research

DT News

Discussion about this post

Ready for more?