May 21 AI 日报
1️⃣ 微软Azure AI Foundry发布
微软推出了Azure AI Foundry,这是一个全栈AI平台,旨在帮助开发者快速构建、部署和扩展AI解决方案及智能代理。
它支持多种模型,如Grok 3和Flux Pro 1.1,并提供多代理编排、免主机费微调以及与Teams、Slack等平台的集成。平台还包括本地运行功能和AI红队测试,确保安全性和效率。
🔗 推文
2️⃣ 谷歌整合代理式AI功能
谷歌宣布在Google Chrome、Search和Gemini App中整合代理式AI功能。
Gemini App的Agent Mode允许用户将复杂任务(如寻找公寓、安排参观)委托给AI代理。这表明谷歌正在推动AI从信息检索向主动任务执行的转变,可能会显著提升用户体验。
🔗 推文
3️⃣ 谷歌Gemini 2.5 Pro新增Deep Think
谷歌为其Gemini 2.5 Pro模型引入了Deep Think,一种利用并行思维技术的高级推理模式。
该模式在USAMO 2025数学基准测试和LiveCodeBench编码基准测试中表现出色,目前正通过Gemini API向受信任的测试者开放,未来将更广泛应用。
🔗 推文
4️⃣ Higgsfield AI推出VFX效果工具
Higgsfield AI发布了一款VFX效果工具,允许用户通过一键操作创建专业级视觉效果,如DATAMOSH和SYMBIOTE。
🔗 推文
5️⃣ AI Studio与Gemini SDK的无代码开发
Ammaar Reshi展示了如何使用AI Studio通过Gemini SDK快速生成AI应用。
他演示了一个无需编写代码的文本冒险游戏“Cosmic Odyssey”,显示了AI驱动的游戏开发潜力,降低了开发门槛。
🔗 推文
6️⃣ ManusAI推出团队定价计划
ManusAI推出了团队定价计划,每席位提供3900个共享信用,团队成员可同时运行最多2个任务,起价为5席位每月39美元/席位。
🔗 推文
热门GitHub项目
Microsoft Magentic UI
Magentic-UI 是一个以人为本的界面研究原型,它由多智能体系统驱动,可以浏览和执行网页操作、生成和执行代码以及生成和分析文件。
Magentic-UI 尤其适用于需要网页操作的 Web 任务(例如,填写表单、定制餐单)、深度导航至未被搜索引擎收录的网站(例如,筛选航班、查找个人网站的链接)或需要网页导航和代码执行的任务(例如,根据在线数据生成图表)。
🔗 Github链接