1️⃣ Stability AI 发布 Stable Audio 2.0 API
Stability AI 推出 Stable Audio 2.0 API,支持生成 最长 3 分钟、44.1kHz 立体声 的高质量音乐轨迹。该 API 允许用户通过 自然语言提示 进行音频到音频编辑,为音乐创作和音频处理提供新的 AI 解决方案。这一更新使 AI 在音乐产业的应用更加灵活,适用于 内容创作者、开发者和音频工程师。
🔗官网
2️⃣ OpenAI FAQ 更新及学生折扣试验计划
OpenAI 更新了 FAQ 页面,首次公布 澳大利亚大学 资格名单,并介绍了 ChatGPT Plus 学生折扣实验计划。这一举措表明 OpenAI 正尝试吸引更多学术用户,同时调整订阅策略,以更好地服务 教育市场。未来,类似的折扣计划可能扩展至更多地区和学校。
🔗 公告
3️⃣ Sora 更新 ChatGPT Plus 用户视频使用政策
Sora 宣布,ChatGPT Plus、Team 及 Pro 用户 现在可 无限制使用视频生成功能,不再受信用额度限制。这一更新 提高了用户的使用灵活性,并可能促进 AI 生成视频内容 在创意设计、教育和营销领域的广泛应用。Sora 的持续优化,彰显了 OpenAI 在 多模态 AI 领域 的雄心。
🔗 公告
4️⃣ GTC 硅谷举办 lerobot AI 黑客松
GTC 会议期间,lerobot AI 黑客松 在硅谷举行,邀请开发者参与 AI 相关编程挑战与创新。此次黑客松鼓励 AI 代理、强化学习、计算机视觉 等领域的新应用开发,并提供 奖金和技术支持。这一活动旨在激发创意,并推动 AI 在实际应用中的落地。
5️⃣ Yann LeCun 分享 GTC25 主题演讲亮点
Yann LeCun 在 GTC25 活动上发表主题演讲,探讨 AI 计算架构、能效优化及 AI 代理的未来发展。他强调,自监督学习和能效驱动的 AI 计算 将成为未来 AI 研究的核心方向。这一演讲 为 AI 领域的长期发展提供了重要的理论支持,并吸引了业界广泛关注。
🔗 视频
推荐阅读
OpenAI o1 模型核心成员 Noam Brown 如何看推理模型的未来 by @nake13
Noam Brown 在 GTC 2025 介绍了他从扑克 AI 到 OpenAI o1 的研究历程。他的工作从不完美信息博弈出发,先后开发了超越人类的扑克 AI Pluribus 和具备自然语言协商能力的 Diplomacy AI Cicero。在 OpenAI,他专注于让 AI 在推理过程中更灵活地分配算力,实现更强的决策能力,推动通用推理范式的发展。这项研究有望催生更类人甚至超人级别的智能系统。
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
Yann LeCun 在 GTC 2025 上与英伟达首席科学家比尔·达利展开对话,猛烈批评当前大模型的推理方式,认为 token 不是表示物理世界的正确方式,现有 AI 预测方法存在根本性缺陷。他强调,真正的智能需要在“心智空间”中进行推理与规划,而非依赖语言 token 进行计算。同时,他对光学计算和量子计算表示怀疑,认为这些技术的应用前景有限。此外,他高度评价中国 AI 研究,特别提到 DeepSeek 的创新能力,并预测未来十年内可能实现更高层次的智能系统。