May 11 AI 日报

May 11, 2025

1️⃣ Transformer Lab：开源大型语言模型工具包

Transformer Lab 是一款 100% 开源的工具包，允许用户在本地机器上训练、微调和与任何大型语言模型（LLM）交互。它支持一键下载 LLM 和拖拽式 UI 用于检索增强生成（RAG），使任何人都可以轻松实验 LLM。

2️⃣ ChatGPT 对学习的积极影响

一项发表在 Nature 上的元分析显示，ChatGPT 对学生的学习表现、学习感知和高阶思维有显著的积极影响。该研究分析了 51 篇实验论文，发现 ChatGPT 在适当使用时可以提升学习成果。

3️⃣ Gemini 2.5：高级视频理解能力

Google AI Developers 宣布 Gemini 2.5 在视频理解方面具有先进的能力，在关键视频基准测试中取得最先进的性能。开发者可以通过 Google AI Studio 和 Gemini API 使用这些能力构建应用。

4️⃣ 使用 DeepSeek Janus-Pro 构建多模态 RAG

Avi Chawla 分享了如何使用 ColPali 进行嵌入、Qdrant 作为向量数据库和 DeepSeek Janus-Pro 作为多模态 LLM，构建一个 100% 本地运行的多模态检索增强生成（RAG）系统。该系统可以处理包含文本和图像的复杂多模态文档，如 PDF。

WeClone

WeClone 是一个使用微信聊天记录创建数字克隆的项目。通过使用聊天数据微调大型语言模型（LLM），它捕捉用户独特的风格，并支持语音克隆和与多个平台的集成，提供数字克隆和数字不朽的全面解决方案。

DT News