April 28 AI 日报
1️⃣ Hugging Face 收购 Pollen Robotics,推出 Reachy 2
Hugging Face 近日宣布收购法国机器人公司 Pollen Robotics,并推出了 Reachy 2 人形研究机器人。这款机器人定价为7万美元,专为教育和研究设计,具有以下特点:
开源软件:代码公开,允许研究人员和开发者自由修改和优化。
Python 可编程:支持 Python 编程语言,便于开发者快速上手。
LeRobot AI 库:集成 Hugging Face 的开源 LeRobot AI 库,提供强大的 AI 驱动功能。
硬件特性:配备双臂(多自由度)、视觉和声音传感器、轮式底盘以及虚拟现实(VR)集成,适合复杂的人机交互研究。
🔗 原x帖子
2️⃣ CAMEL-AI.org 与微软推出 AI 学习助手
CAMEL-AI.org 与微软合作开发了一款 AI 学习助手,旨在帮助用户将 PowerPoint(PPT)、PDF 和 Word(DOCX)文件快速转换为结构化的 Markdown 学习笔记。该工具的主要功能包括:
自动转换:支持多种文档格式,生成清晰的 Markdown 笔记。
Gemini OCR 技术:利用高精度光学字符识别(OCR)技术,从图像或扫描文档中提取文本。
角色扮演代理:CAMEL-AI 的 AI 代理负责分解内容、生成摘要并格式化笔记。
开源与模块化:项目完全开源,采用模块化设计,用户可根据需求定制工作流程。
这款工具特别适合学生、教师和需要快速整理学习资料的专业人士。例如,学生可上传课堂幻灯片,快速生成复习笔记。
🔗 原x帖子
3️⃣ Google DeepMind 的 Genie 2:从照片到 3D 世界
Google DeepMind 推出了一项突破性技术 Genie 2,能够将单张 2D 照片转化为可交互的 3D 世界。这一技术在《60 Minutes》节目中由研究科学家 @jparkerholder 和 CEO @DemisHassabis 展示,引发了广泛关注。Genie 2 的潜在应用包括:
AI 学习革新:通过生成动态 3D 环境,AI 可通过交互和探索学习,类似于强化学习(Reinforcement Learning)。
行业应用:可用于游戏开发(快速生成虚拟世界)、机器人训练(模拟现实环境)以及教育(交互式学习场景)。
用户对这一技术的反应热烈,认为它可能改变 AI 训练方式,使其更像“在游戏中学习”。Genie 2 的推出与“体验时代”(Era of Experience)的理念相呼应,强调 AI 通过动态环境学习的重要性 观看演示。
🔗 原x帖子
来自 GitHub 的热门 AI 项目
Graphiti by Zep
Graphiti 是一个用于构建实时知识图谱的开源框架,由 Zep 开发,专为 AI 代理设计。它支持处理复杂、动态的数据,具有以下特点:
知识图谱构建:自动生成知识图谱,表示实体之间的关系(如“ Kendra 喜欢 Adidas 鞋”),每个关系由节点和边组成。
动态与时序支持:能够处理随时间变化的关系,并保留历史上下文。
多模查询:支持语义搜索、关键词搜索和图算法搜索,适合复杂数据查询。
应用场景:可用于销售(结合 CRM 数据)、客服(跟踪用户交互)、金融(分析动态市场数据)等领域。
🔗 Github链接