8月2日 AI 日报：Gemini 2.5 Deep Think 性能突破、AI透明度框架与Anthropic限制OpenAI访问Claude

Aug 02, 2025

1️⃣ Gemini 2.5 Deep Think 展现卓越性能

今日，Google DeepMind 首席执行官 Demis Hassabis 在 X 上宣布，Gemini 2.5 Deep Think 在多个 challenging benchmarks 中取得了 state-of-the-art 性能，引发广泛关注。该模型通过并行思维和强化学习技术，显著提升了解决复杂问题的能力，尤其在数学推理和代码生成方面表现优异。这一突破标志着 AI 在学术和实用场景中的又一次飞跃，吸引了全球研究者和开发者的目光。

用户反馈显示，Gemini 2.5 Deep Think 在处理国际数学奥林匹克问题和编码任务时表现出色，但其高性能也带来了严格的速率限制。许多订阅者希望 Google 能通过 AI Studio 优化接口以提升使用体验，这可能成为未来更新的重点方向。

🔗 推文：https://x.com/demishassabis/status/1951468051578142848

2️⃣ OpenRouter 发布神秘模型 Horizon Alpha 引发 GPT-5 猜测

OpenRouter 今日推出了一款神秘的隐秘模型 Horizon Alpha，允许用户免费试用并提供反馈，引发 AI 社区的热烈讨论。该模型拥有 256,000 上下文和强大的性能表现，社区迅速猜测它可能是 OpenAI 正在测试的 GPT-5 早期版本。这一隐秘发布模式旨在收集实时数据，增强了其作为潜在行业领导者的神秘感。

分析人士指出，Horizon Alpha 在 EQ-Bench 和创意写作基准测试中的优异表现支持了这一猜测。如果证实是 GPT-5，这将标志着 OpenAI 在竞争激烈的 AI 市场中的重大进展，值得持续关注。

🔗 推文：https://x.com/OpenRouterAI/status/1950713168193282078

3️⃣ Brad Lightcap 回应 OpenAI 战略调整

OpenAI 总裁 Brad Lightcap 在 X 上分享了公司对当前 AI 竞争格局的最新战略，强调了技术创新的重要性。他表示，尽管面临外部挑战，OpenAI 仍致力于提升模型性能以保持行业领先地位。这一声明在 AI 社区中引发了关于竞争与合作的广泛讨论。

分析人士指出，Lightcap 的表态可能与 Anthropic 最近限制 OpenAI 访问 Claude API 的事件有关。这场争端可能重塑 AI 行业的合作模式，值得持续关注。

🔗 推文：https://x.com/bradlightcap/status/1951389149405618

4️⃣ Anthropic 启动 Claude Neptune V4 安全测试

TestingCatalog 在 X 上报道，Anthropic 正在测试其新安全系统 Claude Neptune V4，红队测试预计持续一周。该系统旨在增强 Claude 模型的安全性，图片显示了测试界面中“claude-neptune-v4”模型的配置，包括温度和最大 token 数等参数。这一消息表明 Anthropic 正为即将推出的 4.1 版本做准备，引发了社区对新模型性能的期待。

专家认为，此次测试可能为 Claude 系列的下一代模型奠定基础，尤其是在对抗 jailbreaking 和提升安全性方面。开发者们对测试结果的公开表示出浓厚兴趣，这可能推动 AI 安全标准的进一步完善。

🔗 推文：https://x.com/testingcatalog/status/1951381764552929435

5️⃣ Anthropic 限制 OpenAI 访问 Claude 引发争议

根据 WIRED 报道，Anthropic 于本周撤销了 OpenAI 对 Claude API 的访问权限，理由是违反服务条款。这一决定引发了 AI 行业关于数据共享和竞争的激烈争论，OpenAI 则表示此举令人失望但尊重。该事件可能促使行业重新审视 API 使用规范和安全评估标准。

Image may contain Electronics Mobile Phone Phone Art and Paper

分析师认为，这场冲突可能加速 AI 开发者的安全透明度框架建设，尤其是对大型模型的监管。 Anthropic 的举动或将影响未来 AI 生态系统的合作模式，值得密切观察。

🔗 推文：https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/

来自 GitHub 的热门 AI 项目: LLaVA-NeXT

LLaVA-NeXT 是一个轻量级多模态 AI 模型，支持文本、图像、音频和视频处理，特别适合移动设备使用，其高效资源管理和对 140 多种语言的支持受到社区高度评价。该项目采用先进的推理优化技术，适用于实时翻译、内容生成和多媒体分析等场景，近期在 GitHub 上因其开源性质和性能提升而迅速走红。开发者反馈表明，其易于扩展和部署的特点使其成为 AI 研究和应用的热门选择。

🔗 项目：https://github.com/LLaVA-VL/LLaVA-NeXT

DT News

Discussion about this post

Ready for more?