May 31 AI 日报
1️⃣ Google 发布 AI Edge 应用,可在手机上离线运行 AI 模型。
Google 推出了一款名为 AI Edge 的应用,允许用户在手机上离线运行 AI 模型,无需互联网连接即可使用。
该应用支持聊天、图像问答和提示实验室等功能,完全免费,适合隐私敏感场景。
🔗 推文:Google AI Edge App
2️⃣ Google Gemini App: 所有 Android 和 iOS 用户可在 Gemini Live 中共享摄像头和屏幕。
用户可通过此功能在对话中实时展示内容,提升交互体验,适用于多种场景。
此功能增强了 Gemini Live 的多模态交互能力,适合教育、协作等场景。
🔗 推文:Gemini Live Update
3️⃣ ElevenLabs 推出 Conversational AI 2.0,新功能包括先进的交互模型、语言切换、多角色模式等。
该平台现支持 HIPAA 合规、欧盟数据驻留和强大的安全措施,适合医疗等行业。
新功能包括多模态支持和批量调用,提升了语音代理的灵活性和效率。
4️⃣ Superblocks 推出 Clark,一个 AI 代理,用于构建内部企业应用,结合了应用构建、自动化和企业级 React。
Clark 支持企业标准,如权限管理和数据安全,适用于复杂业务场景。
其多代理架构确保设计、IT 和安全等环节的高效协作。
🔗 推文:Superblocks Clark AI
5️⃣ Gemini 现在可以解析 Google Drive 上的视频文件,对于 Workspace 用户来说,可以与录制的会议对话。
此功能类似企业级“Recall”,能快速总结会议内容,显著提升工作效率。
用户可通过聊天方式提取会议关键点,适用于企业生产力提升。
🔗 推文:Gemini Video Parsing
6️⃣ LlamaIndex 赞助 Gradio Agents & MCP Hackathon,这是 2025 年最大的 MCP 和 AI 代理开发活动。
活动将于 6 月 2 日至 8 日举行,提供 16,000 美元现金奖励和超过 400,000 美元的 API 信用额度。
参与者可获得 Anthropic、Mistral AI 等公司的 API 访问和导师指导。
🔗 推文:Gradio Hackathon
7️⃣ FLUX.1 Kontext,由 @bfl_ml 发布,是目前世界上最好的 AI 图像模型,可在 LTX Studio 中试用。
该模型支持多模态输入,可以通过自然语言编辑图像、交换背景、改变物体颜色等。
其逼真效果引发讨论,用户认为难以区分 AI 生成内容与现实。
🔗 推文:FLUX.1 Kontext
8️⃣ LisanBench 是一个新的基准测试,用于评估大型语言模型的知识、前瞻规划、约束遵守、记忆和注意力以及长上下文推理能力。
测试结果显示 o3 是表现最佳的模型,特别是在逃离低连通性区域和避免死胡同方面。
该基准测试成本低且易验证,适合评估模型在复杂任务中的表现。
🔗 推文:LisanBench Benchmark
GitHub 热门项目
AgenticSeek
AgenticSeek 是一个本地运行的 AI 助手,通过语音指令实现网页浏览、代码编写和任务规划,数据本地处理以确保隐私。 它支持多种编程语言,自动选择最佳代理,硬件需求根据模型大小从 8GB 到 48GB VRAM 不等。
🔗Github链接: AgenticSeek GitHub