April 29 AI 日报
1️⃣ 阿里巴巴:Qwen3 系列模型发布
阿里巴巴发布 Qwen3 系列开源 AI 模型,参数规模从 0.6B 到 235B,包含 MoE 和密集模型。旗舰 Qwen3-235B-A22B 在编码、数学和通用能力上匹敌 DeepSeek-R1、OpenAI o1、Google Gemini 2.5 Pro 等顶尖模型,Qwen3-4B 和 Qwen3-32B 也表现优异。
支持“思考”模式(复杂任务)和“非思考”模式(快速响应),可通过 Qwen Chat Web、GitHub、Hugging Face 等平台访问,推荐使用 SGLang、vLLM 部署。
2️⃣ OpenAI:ChatGPT 购物与搜索功能升级
OpenAI 宣布 ChatGPT 新增购物功能,提供个性化产品推荐、图片、评论和直接购买链接,无广告且无佣金。
搜索功能优化,支持 WhatsApp 查询(通过 1-800-ChatGPT),新增多重引文、趋势搜索和自动补全,全球搜索量达 10 亿次/周。更新基于 GPT-4o,覆盖 Plus、Pro、免费及未登录用户,数日内全面上线。
3️⃣ Google DeepMind:Gemini 2.5 Pro 强化学习展示
Google DeepMind 展示 Gemini 2.5 Pro 实时实现强化学习算法,通过“Vibe-Coding”界面编码、视觉化训练并调试错误。
界面包括游戏环境、训练控制和性能指标(如累计奖励),凸显 AI 在研究应用的潜力,获用户好评。
🔗 Google DeepMind Gemini 2.5 Pro
4️⃣ Baidu:MCP 支持电商与云存储交互
Baidu 推出模型上下文协议(MCP)支持,AI 可实时与电商、云存储等服务交互。
在 BaiduCreate2025 活动中,展示首个支持 AI 驱动电商交易的 MCP 服务器,并新增开发者发现功能,助力构建智能应用,展现开放生态承诺。
5️⃣ Higgsfield AI:Iconic Scenes 电影场景生成
Higgsfield AI 推出“Iconic Scenes”功能,用户通过自拍插入《泰坦尼克号》《黑客帝国》等经典电影场景,生成个性化动画视频。鼓励使用 #CartoonMeChallenge 分享,吸引娱乐 AI 关注。
🔗 Higgsfield AI's Iconic Scenes
6️⃣ Cognition:DeepWiki 交互式文档工具
Cognition 发布 DeepWiki,为 GitHub 仓库提供交互式文档,已索引 3 万仓库,处理超 40 亿行代码。
免费开源,无需注册,通过替换 URL(github→deepwiki)访问。由 Devin 驱动,利用提交历史分析代码结构,助开发者快速理解代码库。
7️⃣ 开发者工具:MCP 增强 Claude 应用
Avi Chawla 分享项目,通过八个 MCP 服务器(Zep、Firecrawl、Stagehand、Chroma 等)增强 Claude,构建类似 ChatGPT 的应用。
提供 CLI、GitHub、Jupyter 等工具,支持记忆、网页抓取和向量数据库,附详细教程,展示模块化开发潜力。
来自 GitHub 的热门 AI 项目
hacksider:Deep-Live-Cam 实时换脸与一键视频深伪
Deep-Live-Cam 是一个开源项目,支持使用单张图片进行实时人脸替换和一键视频深伪。用户可选择源脸图片和目标图像/视频,点击“开始”即可生成替换结果,支持实时直播(需 OBS 等工具)。2.0 版新增快速多脸切换和清晰度增强,安装需技术能力或使用预构建版本。项目在 GitHub 趋势榜名列前茅,拥有 51.4k 星和 7.6k 分叉,需遵守 AGPL-3.0 许可,仅限非商业研究用途。
🔗Github链接:https://github.com/hacksider/Deep-Live-Cam