April 26 AI 日报
1️⃣ Meta AI 扩展至欧盟地区
Meta AI 的网页版现已在欧盟上线,覆盖奥地利、德国、比利时等多个国家,但因 Llama 4 许可限制,图像生成功能暂不可用。
用户反馈显示,奥地利用户已可使用,而波兰等地尚未覆盖,Meta AI 还计划通过 Ray-Ban Meta 智能眼镜在欧洲推出多模态功能。
2️⃣ Meta:Web-SSL 模型全面开源
Meta 开源了 Web-SSL 模型系列,包括从 ViT-L 到 ViT-7B 的自监督学习视觉模型,基于数十亿网络图像训练,未使用语言监督。
这些模型在视觉问答任务中表现出色,部分场景超越 CLIP 模型,此次发布包括模型和 GitHub 代码,由 David Fan 主要贡献。
3️⃣ AI 数学奥林匹克冠军模型开源
Dieter (@kagglingdieter) 团队宣布在 Hugging Face 发布 AI 数学奥林匹克一等奖模型,包含多种规模版本。
其 1.5B 参数的迷你版在 AIME 数学基准测试中击败 DeepSeek-R1,AIME 是美国高中数学邀请赛,测试模型的数学推理能力。
4️⃣ OpenAI 与新加坡航空合作
Jason Kwon 宣布 OpenAI 与新加坡航空达成首个航空业重大合作,利用 AI 提升旅行体验,如优化客户服务或航班管理。
Kwon 表示将于五月访问新加坡,可能与合作启动或后续发展相关,社区对 AI 实际影响展开热议。
5️⃣ Google 推出 Whisk 和 Veo 2 视频功能
Google 发布 Whisk 功能,允许 Google One AI Premium 用户在 60 多个国家使用 Veo 2 技术创建 8 秒视频。
公告展示了不同艺术风格的视频示例,部分用户反馈因账户限制无法访问,显示区域性挑战。
6️⃣ Grok 为学生提供免费 SuperGrok
Grok 针对学生推出促销活动,使用 .edu 邮箱注册可获两个月免费 SuperGrok,增强版 AI 助手助力期末考试学习。
SuperGrok 提供全天候学习支持,部分用户反馈非 .edu 邮箱无法参与,显示适用范围的局限性。
7️⃣ OpenAI 更新 GPT-4o 提升性能
OpenAI 更新 GPT-4o,优化内存管理和 STEM 问题解决能力,同时调整模型响应,使其更主动并引导对话向高效结果发展。
用户反馈显示新版更具互动性,但“高效结果”定义模糊,Sam Altman 回应称将减少模型的“过于迎合”行为。
来自 GitHub 的热门 AI 项目
ByteDance 开源 UI-TARS 多模态代理
ByteDance 开源了 UI-TARS-1.5,一个基于强大视觉-语言模型的多模态代理,能够在虚拟世界中执行多样化任务,如 GUI 导航和 CAPTCHA 认证。
项目基于近期论文的基础架构,集成了强化学习驱动的高级推理,吸引了大量开发者关注。
🔗 Github链接:https://github.com/bytedance/UI-TARS