May 25 AI 日报

May 25, 2025

1️⃣ Waterloo大学推出免费LLM基础课程

Waterloo大学推出了一门免费课程，专注于大型语言模型（LLM）的基础知识，由Wenhu Chen主讲。该课程涵盖了从基础到高级的AI主题，包括循环神经网络（RNN）、卷积神经网络（CNN）、自然语言处理（NLP）、计算机视觉（CV）、注意力机制、Transformer架构、预训练和参数高效微调（PEFT）等内容。

课程通过幻灯片和视频形式提供，适合初学者和有经验的开发人员深入学习AI模型开发。

🔗 推文

2️⃣ Google Labs推出Flow AI电影制作工具

Google Labs宣布其AI电影制作工具Flow现已扩展至71个新国家，通过Google AI Pro和Ultra订阅提供（Google Labs）。

Veo 3是Flow的核心功能之一，支持生成带声音的视频，现已对Pro用户开放试用，Ultra用户则享有更高的生成容量。

🔗 推文

3️⃣ Blackbox AI Agent：自主编程代理

Manish Kumar Shah在X上介绍了Blackbox AI Agent，一个已被超1000万开发者使用的自主编码代理（manishkumar_dev）。

该工具能够自动添加新功能、修复代码错误、从头构建完整应用程序，支持同步和异步工作模式，适应不同开发风格。视频演示（时长约8分钟）展示了Blackbox在代码编辑器中的操作，如修改代码、调试和项目管理。

🔗 推文

4️⃣ Google推出Jules：强大编程代理

Google推出了Jules，一个被誉为“最强大编码代理”的工具（jowettbrendan）。Jules能读取代码库、制定开发计划、构建功能、编写测试并推送拉取请求（PR），直接集成GitHub，减少开发者切换工具的麻烦。

它还提供音频提交摘要，方便团队同步更新。Jules运行于安全的Google Cloud虚拟机中，确保代码安全且无幻觉（hallucination）。目前处于免费公测阶段，开发者可通过Jules网站试用。

🔗 推文

5️⃣ Gemini App推广Veo 3

Google Gemini App宣布Veo 3现已在71个新国家可用，Pro用户可通过升级订阅试用此AI视频生成工具（GeminiApp）。

Veo 3支持生成带声音的视频，X帖子中展示了一个8秒视频，呈现了一只穿“GEMINI”毛帽的刺猬在雪地中的可爱场景，凸显其创意能力。

🔗 推文

6️⃣ Gamma：快速构建着陆页

Farah在X上分享了如何使用Gamma平台在不到2分钟内创建功能齐全的着陆页（farah_tech_AI）。Gamma是一个免费的AI驱动平台，已有超5000万用户，最近发布了新版本。

视频演示（时长82秒）展示了从输入描述（如“为TechNova AI Solutions创建着陆页”）到选择主题、编辑内容并发布的全过程。Gamma支持自定义主题和域名（Pro计划），生成的页面包括领导团队介绍和行业成功案例等内容。

🔗 推文

今日GitHub热门项目

LLaMA-Factory

LLaMA-Factory是一个开源AI项目，提供易用且高效的平台，用于训练和微调大型语言模型（LLM）（GitHub仓库）。它支持多种模型（如LLaMA、Mistral、Qwen等）和训练方法，包括预训练、指令监督微调、奖励模型训练等。

平台提供16位全参数微调、LoRA微调、QLoRA微调等多种计算精度，以及GaLore、BAdam、DoRA等优化算法和FlashAttention-2等加速运算符。用户无需编写代码即可在本地微调模型，适合研究者和开发者。LLaMA-Factory还支持多GPU分布式训练，近期更新包括支持Qwen3和InternVL3模型。

🔗 GitHub仓库

DT News

Discussion about this post

Ready for more?