8月7日 AI 日报：Google Jules正式发布、Claude Code安全审查、OpenAI GPT-5直播

Aug 07, 2025

1️⃣ Google Jules AI编码代理正式发布

Google的Jules AI编码代理已正式退出beta测试阶段，现已集成到Google AI Pro和Ultra订阅计划中，为用户提供无限访问权限以及由Gemini 2.5 Thinking驱动的增强规划功能。该代理作为Google的AI编码助手，帮助开发者更高效地进行代码规划和实现，并已获得beta用户的高度认可和团队的全力支持。

🔗 推文：https://x.com/testingcatalog/status/1953170239719702871

2️⃣ Claude Code新增安全漏洞审查功能

Anthropic推出的Claude Code现可自动审查代码中的安全漏洞，该功能已在公司内部应用并成功捕获潜在问题，避免了部署风险。该更新显著提升了代码的安全性，受到开发者的欢迎，并有望成为AI辅助编程的标准工具。

🔗 推文：https://x.com/mikeyk/status/1953139363547857162

3️⃣ OpenAI将于周四直播发布GPT-5

OpenAI宣布将于周四上午10点太平洋时间进行直播，强烈暗示将推出备受期待的GPT-5模型。该活动引发全球AI社区的热烈讨论，用户期待新模型在智能和多模态能力上的突破性进步。

🔗 推文：https://x.com/OpenAI/status/1953139020231569685

4️⃣ OpenAI向美国联邦员工提供ChatGPT访问

OpenAI将以每年1美元的价格向每个联邦机构提供ChatGPT访问权限，覆盖整个美国联邦劳动力。该举措旨在提升政府工作效率和创新能力，但同时引发了关于数据隐私和安全性的广泛辩论。

🔗 推文：https://x.com/sama/status/1953103336044990779

5️⃣ OpenAI提醒开发者gpt-oss性能差异

OpenAI开发者体验负责人提醒，使用gpt-oss开源模型时，由于不同推理提供商和运行环境的实现差异，性能和准确性可能存在波动。公司正积极与提供商合作优化，确保模型在工具调用等方面的最佳表现，并欢迎开发者反馈以进一步改进。

🔗 推文：https://x.com/romainhuet/status/1952916530792153093

来自 GitHub 的热门 AI 项目: confident-ai/deepeval

DeepEval是一个简单易用的开源框架，用于评估和测试大型语言模型（LLM）系统，类似于Pytest但专为LLM输出单元测试设计，整合了最新研究指标如G-Eval、hallucination、answer relevancy和RAGAS等，由本地运行的LLM和NLP模型驱动。该项目支持RAG管道、聊天机器人和AI代理的端到端评估，允许自定义指标和合成数据集生成，适用于优化模型、提示和架构，防止提示漂移，并在CI/CD环境中集成红队测试以识别安全漏洞，如毒性和SQL注入。在社区中，该框架被广泛用于基准测试流行数据集，并在生产环境中监控LLM响应，受到开发者的高度评价和积极采用。

🔗 项目：https://github.com/confident-ai/deepeval

DT News

Discussion about this post

Ready for more?