May 22 AI 日报
1️⃣ xAI 推出 Live Search API,Grok 现在可以搜索实时数据
xAI发布了Live Search API,使Grok能够实时搜索X平台、互联网和新闻数据,消除了传统AI模型的知识截止限制。该API目前处于免费测试阶段,鼓励开发者构建实时数据驱动的应用。
例如,可用于市场情绪分析或新闻聚合。社区对该功能反应热烈,但也有人担忧其可能被用于实时操控市场或舆论。
🔗 推文
2️⃣ Meta AI 启动 Llama Startup Program,支持初创企业开发生成式 AI 应用
Meta AI宣布启动Llama Startup Program,旨在支持美国初创企业开发生成式AI应用。该计划面向已注册、融资少于1000万美元且至少有一名开发者的初创企业,提供云费用报销、Llama专家的技术支持以及社区资源。
申请截止日期为2025年5月30日。Meta AI通过此计划推动Llama技术在初创生态中的应用,可能促进生成式AI的创新。
🔗 推文
3️⃣ Claude 实时 AI 工作流构建活动
500名开发者将在旧金山参与使用Claude的实时AI工作流构建活动。这不是产品演示,而是一个测试实验室,聚焦于解决实际问题。活动将于2025年5月22日上午9:30(太平洋时间)开始,并提供直播。
🔗 推文
4️⃣ X 将引入赌博功能,用户可使用广告收入进行新闻事件押注
Alex Finn报道,X计划引入赌博功能,允许用户使用广告收入通过X Money押注新闻事件,如选举结果或经济指标。
X官方确认正在探讨预测市场,但尚未达成正式合作。此举可能增强X的金融化,但引发了关于赌博普及对社会影响的争议,部分用户对此表示担忧。
🔗 推文
5️⃣ OpenAI 收购 io,计划开发 AI 驱动设备,首款产品预计 2026 年发布
OpenAI以65亿美元收购了由Sam Altman和Jony Ive创立的io公司,计划开发AI驱动设备,首款产品预计2026年发布。
Jony Ive的设计公司LoveFrom将负责OpenAI和io的设计工作,约55名io员工将加入OpenAI。此举旨在重新定义计算体验,但面临能耗、隐私和市场主导地位的潜在问题。
🔗 推文
6️⃣ OpenAI 宣布 Responses API 新功能,包括远程 MCP 服务器支持、图像生成、Code Interpreter 等
OpenAI开发者账户宣布Responses API新增七项功能,包括支持远程MCP服务器、图像生成(使用gpt-image-1,支持流式预览和多轮编辑)、代码解释器(用于数据分析和图像理解)、文件搜索改进、后台模式、推理摘要和加密推理项。
🔗 推文
7️⃣ Hugging Face 发布关于视觉语言模型的博客和 nanoVLM 仓库
Hugging Face发布了一篇关于视觉语言模型(VLM)的博客,介绍了VLM基础知识、架构和训练轻量级VLM的方法。
同时推出了nanoVLM开源仓库,使用PyTorch提供简洁的代码(约150行模型代码,250行VLM实现),便于开发者学习和微调VLM。博客通过图表解释了像素重排等技术,适合对AI感兴趣的技术人员。
🔗 推文
8️⃣ TestingCatalog News 介绍 Comet AI 浏览器,可自动执行 X 上的任何操作
TestingCatalog News展示了Comet AI浏览器,一个能够自动化X平台操作的工具。它可以执行查找帖子、回复等任务,并提供深入的X账户分析,超越Grok的洞察能力。
视频演示显示Comet找到TestingCatalog的置顶帖子并回复“Testing”。该工具支持多标签代理和子代理,可能会改变用户与X的交互方式,尽管需要适应新的操作模式。
🔗 推文
9️⃣ Head 推出全球首个 AI 营销师,可替代整个营销团队
Head推出了号称全球首个AI营销师,声称可取代增长负责人、内容创作者和CMO等角色。它能制定策略、创建内容并执行营销活动,已为2000多个品牌在200多个国家生成超过1亿美元收入。
Head采用基于结果的定价模式,仅在产生实际效果时收费。社区对此反应热烈,但也有人将其称为“营销革命”。
🔗 推文
1️⃣0️⃣ Entelligence AI 发布 DeepReviews,AI 驱动的代码审查工具
Entelligence AI推出了DeepReviews,一款AI驱动的代码审查工具,能够分析整个代码库,捕捉传统工具难以发现的跨文件错误。它还提供自动更新的代码库文档、编辑器内审查和团队洞察功能。
据称,使用DeepReviews的团队合并代码速度提高3倍,生产前捕获的错误增加7倍。开发者对其全代码库上下文分析功能表示赞赏,但也建议增加对单个提交的审查支持。
🔗 推文
1️⃣1️⃣ Mistral AI 发布新开源模型 Devstral,专为编码代理设计
Mistral AI与AllHands AI合作推出了开源模型Devstral,专为编码代理设计。该模型在SWE-Bench Verified基准测试中以约24亿参数的规模取得45%的性能,超越了更大规模的模型如DeepSeek-V3(3240亿参数,35%)和Qwen3(2350亿参数,30%)。
Devstral的高效性使其适合资源受限的环境,如本地设备或边缘计算。Mistral AI强调其开源性质,鼓励开发者自由使用和修改代码。
🔗 推文
来自 GitHub 的热门 AI 项目
Semantic Kernel Semantic Kernel是Microsoft开发的开源SDK,支持C#、Python和Java,旨在帮助开发者快速将大型语言模型(LLM)集成到应用中。它提供模型灵活性,支持OpenAI、Azure OpenAI、Hugging Face等;代理框架支持模块化AI代理;多代理系统可协调复杂工作流;插件生态系统支持扩展功能;向量数据库支持无缝集成Azure AI Search等;多模态支持处理文本、视觉和音频输入。许多财富500强企业已采用此工具,其1.0+版本保证了稳定性和向后兼容性。
🔗 推文