May 31 AI 日报

May 31, 2025

1️⃣ Google 发布 AI Edge 应用，可在手机上离线运行 AI 模型。

Google 推出了一款名为 AI Edge 的应用，允许用户在手机上离线运行 AI 模型，无需互联网连接即可使用。

该应用支持聊天、图像问答和提示实验室等功能，完全免费，适合隐私敏感场景。

2️⃣ Google Gemini App: 所有 Android 和 iOS 用户可在 Gemini Live 中共享摄像头和屏幕。

用户可通过此功能在对话中实时展示内容，提升交互体验，适用于多种场景。

此功能增强了 Gemini Live 的多模态交互能力，适合教育、协作等场景。

3️⃣ ElevenLabs 推出 Conversational AI 2.0，新功能包括先进的交互模型、语言切换、多角色模式等。

该平台现支持 HIPAA 合规、欧盟数据驻留和强大的安全措施，适合医疗等行业。

新功能包括多模态支持和批量调用，提升了语音代理的灵活性和效率。

4️⃣ Superblocks 推出 Clark，一个 AI 代理，用于构建内部企业应用，结合了应用构建、自动化和企业级 React。

Clark 支持企业标准，如权限管理和数据安全，适用于复杂业务场景。

其多代理架构确保设计、IT 和安全等环节的高效协作。

5️⃣ Gemini 现在可以解析 Google Drive 上的视频文件，对于 Workspace 用户来说，可以与录制的会议对话。

此功能类似企业级“Recall”，能快速总结会议内容，显著提升工作效率。

用户可通过聊天方式提取会议关键点，适用于企业生产力提升。

6️⃣ LlamaIndex 赞助 Gradio Agents & MCP Hackathon，这是 2025 年最大的 MCP 和 AI 代理开发活动。

活动将于 6 月 2 日至 8 日举行，提供 16,000 美元现金奖励和超过 400,000 美元的 API 信用额度。

参与者可获得 Anthropic、Mistral AI 等公司的 API 访问和导师指导。

7️⃣ FLUX.1 Kontext，由 @bfl_ml 发布，是目前世界上最好的 AI 图像模型，可在 LTX Studio 中试用。

该模型支持多模态输入，可以通过自然语言编辑图像、交换背景、改变物体颜色等。

其逼真效果引发讨论，用户认为难以区分 AI 生成内容与现实。

8️⃣ LisanBench 是一个新的基准测试，用于评估大型语言模型的知识、前瞻规划、约束遵守、记忆和注意力以及长上下文推理能力。

测试结果显示 o3 是表现最佳的模型，特别是在逃离低连通性区域和避免死胡同方面。

该基准测试成本低且易验证，适合评估模型在复杂任务中的表现。

AgenticSeek

AgenticSeek 是一个本地运行的 AI 助手，通过语音指令实现网页浏览、代码编写和任务规划，数据本地处理以确保隐私。它支持多种编程语言，自动选择最佳代理，硬件需求根据模型大小从 8GB 到 48GB VRAM 不等。

🔗Github链接： AgenticSeek GitHub

DT News