June 25 AI 日报
1️⃣ OpenAI:ChatGPT 连接器扩展到 Pro 用户
OpenAI 宣布,ChatGPT 连接器现支持 Google Drive、Dropbox、SharePoint 和 Box,对 Pro 用户(除欧洲经济区、瑞士、英国外)在 ChatGPT 之外的深度研究模式中可用。这一功能允许用户将个人或工作相关的云存储数据整合到 ChatGPT 中,显著提升日常任务的处理效率。
此更新是对6月4日首次推出连接器功能的扩展,最初仅限于深度研究模式。现在,Pro 用户可以在更广泛的场景中使用这些连接器,适用于文档分析、内容创作等任务,但需遵守现有用户权限设置。
🔗 推文:OpenAI ChatGPT Connectors Expansion
2️⃣ Google DeepMind:Gemini Robotics On-Device 发布
Google DeepMind 推出 Gemini Robotics On-Device,这是一款直接运行于机器人设备的视觉-语言-动作模型,使机器人能够更快、更高效地执行任务,并适应新环境,无需持续的互联网连接。该模型支持复杂双臂任务,如解压午餐袋、悬挂水平仪等,并通过50-100次示范即可学习新技能。
DeepMind 还发布了 Gemini Robotics 软件开发工具包(SDK)和 MuJoCo 物理模拟器,供开发者定制模型。该技术适用于无网络或低连接场景,推动AI在物理世界的应用。
🔗 推文:Google DeepMind Gemini Robotics
3️⃣ Google:Gemini 2.5 Pro 快速演示
Google 展示了 Gemini 2.5 Pro 的六个快速演示,用户可以上传手绘草图并要求 AI 生成对应的应用程序代码。首个演示通过一张写有“DVD”的草图,重现了经典的 DVD 屏幕保护程序效果,展示 AI 将创意转化为功能性代码的能力。
用户可通过 Gemini 网站 访问 2.5 Pro,使用 Canvas 功能上传草图并尝试类似任务。其他演示包括室内设计、账单分割和任务管理等应用,激发开发者灵感。
🔗 推文:Google Gemini 2.5 Pro Demos
4️⃣ Claude 网页应用更新
Claude 网页应用新增了“Artifacts Gallery”的聚光灯公告,允许用户探索、自定义和创建 AI 增强的工件,如游戏、工具和模板。新功能支持通过 Claude API 实时为工件提供 AI 能力,目前处于 Beta 阶段。
此外,更新中提到“Wiggle VM”环境,支持文件上传和处理,可能为开发者提供更灵活的运行环境。此更新增强了 Claude 的创作和开发潜力。
🔗 推文:Claude Artifacts Gallery Update
5️⃣ OpenMemory Chrome 扩展发布
Taranjeet 发布了 OpenMemory Chrome 扩展,允许用户在 ChatGPT、Claude、Perplexity、Grok、Gemini 等 AI 助手间共享记忆,提供统一的上下文体验。该扩展免费且开源,减少了在不同平台间重复输入信息的麻烦。
用户可通过 Chrome Web Store 安装扩展,查看更多信息请访问 OpenMemory 官网。社区反馈积极,赞赏其开源性质和实用性。
🔗 推文:OpenMemory Chrome Extension
6️⃣ ElevenLabs 移动应用上线
ElevenLabs 推出 iOS 和 Android 移动应用,将其强大的 AI 语音工具带到用户手中。基于 Eleven v3 模型,用户可生成支持 70 种语言的高质量语音配音,适用于视频创作,并与 CapCut、iMovie 等应用无缝整合。
新用户每月获 10,000 免费字符,项目和语音在网页与移动端同步。应用免费下载,iOS 版见 App Store,Android 版见 Google Play。
🔗 推文:ElevenLabs Mobile App Launch
来自 GitHub 的热门 AI 项目
ML-From-Scratch
ML-From-Scratch 是由 Erik Linder-Norén 创建的 GitHub 仓库,包含使用 NumPy 从头实现的机器学习模型和算法,注重可访问性和透明性。该项目涵盖从线性回归到深度学习的广泛内容,适合学习机器学习核心原理的开发者。
项目提供清晰的代码示例,如多项式回归拟合温度数据,安装方式简单,通过克隆仓库并运行 Python 脚本即可体验。访问 ML-From-Scratch 获取更多信息。
🔗 项目链接:ML-From-Scratch GitHub