May 8 AI 日报
1️⃣ Microsoft宣布支持Agent2Agent协议,推进AI代理协作
Charles Lamanna在X上宣布,Microsoft的Copilot Studio和Azure AI Foundry将支持Agent2Agent(A2A)协议,这一协议建立在早先宣布的Model Context Protocol(MCP)基础上。
A2A旨在实现AI代理之间的互操作性,允许它们协同工作,Microsoft已加入GitHub上的A2A工作组,参与协议和工具的制定。
🔗 X post
2️⃣ Anthropic为Claude API新增网络搜索功能,增强实时数据能力
Anthropic宣布Claude API现支持网络搜索,开发者可利用实时数据增强Claude的知识库。
Claude能自主判断是否需要搜索,并可进行多次搜索,利用早期结果优化后续查询,响应包含引文,特别适合需要准确性和责任感的敏感应用。
🔗 X post
3️⃣ Mistral AI推出Mistral Medium 3,多模态模型成本低8倍
Mistral AI发布Mistral Medium 3,这是一个多模态模型,提供顶级性能,成本比同类模型低8倍,平衡性能、成本和部署性。
模型在编码和函数调用方面表现优异,支持企业功能,如混合部署、自定义后训练和无缝整合企业工具。基准测试表显示,其在HumanEval+、MATH、MMLU-Pro等任务上与Llama 4 Maverick、GPT-4o等领先模型相当或更优。
🔗 X post
4️⃣ Meta发布开源Perception Language Model(PLM),助力视觉理解
AI at Meta推出Meta Perception Language Model(PLM),这是一个开源、可复制的视觉语言模型,针对复杂视觉任务设计。
PLM旨在填补详细视觉理解的空白,支持开源社区构建更强大的计算机视觉系统,研究论文、代码和数据集已开放下载。
🔗 X post
5️⃣ NVIDIA开源Open Code Reasoning模型,性能优异效率高
Vaibhav Srivastav在X上分享,NVIDIA开源了Open Code Reasoning模型,包含32B、14B和7B三个尺寸,采用Apache 2.0许可。
这些模型在LiveCodeBench上击败O3 mini和O1 (low),比同类推理模型节省30%令牌,适合代码生成和推理任务,兼容llama.cpp、vLLM、transformers、TGI等框架。
🔗 X post
GitHub 热门项目
n8n -工作流自动化工具
n8n是一个公平代码工作流自动化平台,内置AI功能,支持可视化构建和自定义代码,可自托管或使用云端服务。
提供400多个整合,适合技术团队构建强大自动化,保持对数据和部署的完全控制。
包括基于LangChain的AI代理工作流,支持JavaScript/Python编写,添加npm包,社区活跃,提供900多个现成模板。企业功能包括高级权限、SSO和隔离部署。
🔗 GitHub页面