7月18日 AI 日报:ChatGPT Agent 自动化任务处理、Claude 金融服务推出与 Google Veo 3 视频生成模型集成
1️⃣ OpenAI 推出 ChatGPT Agent,提升自动化任务处理能力
OpenAI 发布了 ChatGPT Agent,它能够自动处理数据任务,如获取周一指标、生成电子表格并调度重复运行。这项功能允许用户授权代理浏览网页、预约和进行购买,从而减少琐碎工作,让用户专注于重要优先事项。
ChatGPT Agent 具备上下文感知能力,能够选择合适的工具并根据连接器、上下文和自定义指令执行智能操作。它还支持创建完全可编辑的演示文稿,提供一站式解决方案,帮助用户高效管理复杂任务。
🔗 推文:https://x.com/OpenAI/status/1945934976001937744
2️⃣ Google 发布 Veo 3 视频生成模型集成至 Gemini API
Google 通过 Gemini API 推出了 Veo 3,这是一个先进的视频生成模型,能够原生生成视频中的音频,支持大规模生产使用。该模型定价为每秒 0.75 美元(含音频)或 0.50 美元(无音频),团队正努力实现快速版本以降低成本并提高质量。
Veo 3 未来将支持图像到视频的转换,开发者可以期待更多创新应用。价格随时间下降将使高质量视频生成更易访问,推动生成媒体领域的快速发展。
🔗 推文:https://x.com/OfficialLoganK/status/1945894697177846265
3️⃣ Anthropic 推出 Claude for Financial Services,助力金融分析
Anthropic 发布了 Claude for Financial Services,该解决方案整合了领先的数据平台和行业提供商,实现实时访问全面金融信息,并通过内部和行业来源进行验证。这包括 Claude Code 和 Claude for Enterprise,提供扩展使用限制和预构建的 MCP 连接器,以及指导性上线服务。
用户可以通过直播了解详细信息,该工具旨在提升金融决策的准确性和效率。Claude 的集成将帮助分析师快速创建投资推荐、财务模型和支持文档,显著缩短处理时间。
🔗 推文:https://x.com/AnthropicAI/status/1945889476556853520
4️⃣ Figure 发布第三代人形机器人电池,提升能量密度与安全性
Figure 公司介绍了其 F.03 人形机器人的第三代电池,该电池完全由内部工程和制造,实现了全栈控制。相较前代,成本降低了 78%,安全性与可靠性显著提升,并配备 2kW 快速充电器和主动冷却系统。
电池采用结构化设计,包括高强度外壳和热绝缘灌封化合物,能够承受 1 米跌落并防止热失控传播。能量密度的大幅改进将支持机器人更长的运行时间,推动人形机器人在实际应用中的部署。
🔗 推文:https://x.com/adcock_brett/status/1945872294171246905
5️⃣ Mistral AI 更新 Le Chat,新增深度研究和语音模式等功能
Mistral AI 为 Le Chat 引入了多项新功能,包括深度研究工具,能以结构化报告形式快速探索复杂主题。该平台还添加了语音模式,通过 Voxtral 模型支持移动对话,以及原生多语言推理,由 Magistral 模型驱动,提供多语种思考答案。
此外,新增项目功能用于组织上下文丰富的对话文件夹,以及高级图像编辑,通过简单提示创建和修改图像。这些更新使 Le Chat 更具能力和趣味性,用户可立即在网站或 app 中体验。
🔗 推文:https://x.com/MistralAI/status/1945858558836216026
来自 GitHub 的热门 AI 项目: vanna
vanna 是一个使用大型语言模型 (LLM) 和检索增强生成 (RAG) 技术实现准确 Text-to-SQL 生成的工具,用户可以通过聊天方式查询 SQL 数据库。其技术特点包括 RAG 机制提升查询精度,避免传统 SQL 生成的错误,适用于 Python 环境。应用场景主要在数据分析、数据库交互和商业智能领域,帮助非技术用户轻松访问复杂数据。社区反响热烈,今日获得 286 颗星,显示出开发者对 AI 增强数据库工具的强烈兴趣。
🔗 项目:https://github.com/vanna-ai/vanna