March 15 AI 日报
1️⃣ AI 开源生态:OLMo 2 32B、DeepSeek R1 Turbo、Gemma 3 优化版本发布
Gemma 3 在 Box AI 企业评测 中表现突出,新增 单 GPU 优化版本 和 12B 代码调优模型。
OLMo 2 32B 在多项基准测试中展现强劲性能,击败了最新的 GPT 3.5、GPT 4o mini 以及领先的开放权重模型 Qwen 和 Mistral。
DeepSeek R1 Turbo 已在 Hugging Face 上线,提供 64K 上下文窗口 与更大输出能力。
🔗 查看模型:OLMo 2; Deepseek R1 Turbo;Gemma Doc
2️⃣ Yann LeCun 论文提出无需归一化层的深度网络训练方法
Yann LeCun 发布新论文,提出 利用参数化 tanh 激活函数训练深度网络,无需依赖传统的 批归一化(Batch Norm) 或 层归一化(Layer Norm),优化神经网络的稳定性与计算效率。该方法挑战了现有训练范式,并为 深度学习模型的结构优化 提供了新思路,可能对 大规模 AI 训练的资源消耗 产生积极影响。
🔗 论文详情:Yann LeCun 论文
3️⃣ Hugging Face Datasets 3.4 发布,支持多模态数据
Hugging Face 发布 Datasets 3.4,新增 图像、音频、视频文件容量支持,并提升 数据流传输速度,进一步优化 AI 训练与推理的效率。
🔗 更多详情:Hugging Face
4️⃣ 《Whispers From The Star》开启内测,AI 驱动的实时互动游戏曝光 🎮
米哈游创始人蔡浩宇的 AI 游戏公司 Anuttacon 正式曝光了首款作品 《Whispers From The Star》,并已开放 iOS 内测报名。这款游戏以 AI 实时生成的对话为核心,玩家需要通过语音、文字或视频的方式与女主角 Stella 交流,帮助她在神秘的 GAIA 星球 上生存,并寻找回家的方法。
游戏的最大亮点在于 AI 智能体的实时互动,Stella 的对话、情绪甚至动作都会根据玩家的输入动态变化,创造出全新的沉浸式体验。画面采用 100% 实时演算,并结合多模态 AI 技术,使角色的表现更加自然真实。不过,游戏中的视频画面并非 AI 生成,而是基于传统渲染技术打造。
目前,《Whispers From The Star》的内测仅支持 iOS 12 及以上设备,对 AI 计算能力和设备性能都是一次挑战。感兴趣的玩家可以前往官网申请测试资格,抢先体验这款 AI 颠覆传统游戏互动方式的新作品。
🔗 内测报名:Whispers From The Star 官方网站
教程