热点事件:当地时间 3 月 18 日周二,NVIDIA 在加州圣何塞举行英伟达 AI 盛会 GTC 2025。
1️⃣ Nvidia DGX Spark 预定启动 & AI 基础设施优化
Nvidia 正式宣布 DGX Spark(前称 Project DIGITS)已在多个国家开启预约,并公布了不同配置的详细定价信息(4TB 版本起售价 $3,999,两台捆绑销售 $8,049)。此外,Nvidia 还透露 Grace Blackwell 芯片将在 AI 计算和深度学习领域发挥关键作用。
核心配置:
Grace Blackwell 架构,搭载 20 核 Arm CPU & Blackwell GPU
128GB 统一 LPDDR5x 内存(273 GB/s 带宽)
1TB 或 4TB 加密 NVMe 存储
USB4、HDMI 2.1a、WiFi 7 支持
功耗 170W,重量仅 1.2kg
同时,Perplexity 宣布已集成 Nvidia Dynamo 库,以大幅提升 AI 推理计算能力,增强每天数亿次请求的处理效率,优化 AI 推理规模化应用。
🔗 推文
2️⃣ Google Gemini App 重大升级
Google Gemini App 带来了 Audio Overviews 和 Canvas 模式 两项创新功能:
Audio Overviews:允许用户上传文档或幻灯片,AI 自动生成语音概览,结合 Deep Research 报告,优化移动端学习体验。
Canvas 模式:整合代码编辑、实时预览,提升团队协作与原型设计 效率。
此外,Google 还宣布 Gemini 2.0 Flash API 访问速率 提升至 10M TPM 和 10K RPM,适用于高频调用场景,用户需升级至 Tier 2 以获取更高限额。
🔗 推文
3️⃣ OpenAI API 重大更新
OpenAI 在其 Responses API 和 Chat Completions API 中新增 PDF 文件直接输入 功能,使 AI 能够更高效地处理企业级文档数据和复杂文本任务。
此外,OpenAI Executive Function 第五集 由 EliseAI CEO Minna Song 分享,探讨 AI 在 住房和医疗效率 提升方面的作用。
🔗 推文
4️⃣ Stability AI 推出 Stable Virtual Camera & MeshGen 0.6
Hugging Face 发布 Stable Virtual Camera,这是一款专为扩散模型 设计的 AI 影像工具,支持实时 AI 影像处理,提升 AI 影像生成的稳定性。
同时,MeshGen 0.6 版本 现已上线,支持Blender 远程 AI 运行,进一步增强 AI 3D 建模 生态系统。
🔗 推文
5️⃣ Google DeepMind & Nvidia AI 研究合作
Google DeepMind 与 Nvidia 达成合作,推出多项 AI 研究成果:
SynthID 水印技术 集成至 Nvidia Cosmos 世界模型,提升 AI 生成内容的真实性检测。
ICLR 2025 亮相 TIPS 模型,优化 AI 多模态理解,特别是在图像与文本预训练 方面的突破。
GTC25 亮相 MuJoCo-Warp,优化 AI 仿真技术,提升物理模拟能力。
🔗 推文
推荐阅读:
1. 《老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录》
英伟达在GTC大会上发布了新一代AI芯片GB300,推理性能相比GB200提升1.5倍,并计划在2026年推出更强的Vera Rubin芯片,性能达到GB300的3.3倍,未来还将推出更强的Rubin Ultra和Feynman系列。英伟达还推出了两款个人AI超级计算机DGX Spark和DGX Station,并开源了多个AI推理工具和模型,以提升计算效率。此外,公司在自动驾驶、网络基础设施和量子计算领域也有新动作,展示了AI技术的广泛应用和未来发展方向。
2.《Bonus独家 | 百川智能急刹车,调整医疗ToB,基础研发停摆》
百川智能在AI行业的竞争中遭遇挑战。公司暂停了基础模型训练,核心技术负责人离职,并对医疗To B业务进行调整。由于DeepSeek等开源模型的崛起,百川的商业模式受到冲击,To B市场变得更加不确定。面对挑战,百川开始转向To C市场,计划结合“百小应”探索C端医疗产品。尽管公司仍有资金储备,但正经历业务重组,以寻找新的增长方向。
教程